文章插圖

文章插圖
一、數據庫是信息系統的核心
獲取與分析信息,是人類推動社會進步的關鍵過程 。如何持續提 高信息處理的能力,是人類社會的持續性命題 。在計算機發明之后, 信息可經過其電子化編碼后轉化為數據 。人類開始探索利用計算機算力優勢,實現對數據的高效存儲與計算,從而大幅提升信息處理效率 。人類首先嘗試開發出各類特定計算機應用程序完成相關工作,但由于各類特定應用程序復用性差,人類逐漸圍繞數據存儲和計算功能、抽象出滿足組織信息化需求、邏輯關聯的數據庫 。
數據庫是支持一個或多個應用領域,按概念結構組織的數據集合, 其概念結構描述這些數據的特征及其對應實體間的聯系 。數據庫中的數據按一定的數據模型組織、描述和存儲,具有較小冗余度、較高 數據獨立性和易擴展性,并可為各種用戶共享 。數據庫由于綜合成本低、處理能力高,扮演各類信息系統的核心角色 。
六十余年發展過程中,數據庫共經歷前關系型、關系型和后關系型三大階段 。前關系型階段數據庫的數據模型主要基于網狀模型和層次模型,在當時較好地解決了數據集中存儲和共享的問題,但在數據抽象程度和獨立性上存在明顯不足 。關系型階段提出關系模型概念,論述范式理論作為開啟標志,期間誕生了一批廣泛應用的關系型數據庫,該階段技術脈絡逐步清晰、市場格局趨于穩定 。后關系型數據庫階段由于數據規模爆炸增長、數據類型不斷豐富、數據應用 不斷深化,技術路線呈現多樣化發展 。隨著各行業數字化轉型不斷深 入,5G、云計算等新興技術快速發展,傳統數據庫的應用系統紛紛優化升級 。全球市場格局劇烈變革,我國數據庫產業進入重大發展機遇期 。
二、數據庫關鍵技術及發展趨勢
數據庫管理系統作為能夠使用戶定義、創建、維護和控制訪問數 據庫的軟件系統,其整體架構與技術路線不斷深化發展,如今呈現集中式與分布式并存,數據模型不斷拓展等技術現狀 。
(一)數據庫管理系統典型架構
數據庫管理系統由于不同產品實現細節不完全相同,此處僅對部分主流數據庫產品做進一步抽象處理得出上述架構 。數據庫大致可以 由內核組件集與外部組件集共同組成,其中外部組件集以數據庫配套 的獨立支撐軟件為主 。
(二)數據庫技術發展歷程
從 20 世紀 60 年代至今,數據庫的發展歷程大致分為以下三個階段:
1.前關系型階段(1960-1970):網狀層次數據庫初嘗探索
1963 年開發出世界上第一個數據庫管理系統也是第一個網狀DBMS集成數據存儲 。網狀 DBMS 的誕生對當時的信息系統產生了廣泛而深遠的影響,解決了層次結構無法建模更 復雜的數據關系的建模問題 。
同時期為解決“阿波羅登月”計劃處理龐大數據量的需求,北美航空公司開發出 GUAM軟件 。其設計思想是將多個小組件構成較大組件,最終組成完整產品 。這是一種倒置樹的結構,也被稱之為層次結構 。隨后 IBM 加入 NAA, 將 GUAM 發展成為 IMS系統成為最早商品化的層次 DBMS 。
【sdl使用 sdl庫函數】2.關系型階段(1970-2008):關系型數據庫大規模應用
第一階段的 DBMS 解決了數據的獨立存儲、統一管理和統一訪 問的問題,實現了數據和程序的分離,但缺少被廣泛接受的理論基礎, 同時也不方便使用,即便是對記錄進行簡單訪問,依然需要編寫復雜 程序,所以數據庫仍需完善理論從而規?;瘧寐涞?。第二階段開啟的標志是一 篇論文提出基于集合論和謂詞邏輯的關系模型,為關系型數據庫技術奠定了理論基礎 。這篇論文彌補了之前方法的不足,促使 IBM 的 San José實驗室啟動驗證關系型數據庫管理系統的原型項目 System R,數據庫發展正式進入第二階段 。1974 年,Ingres 原型誕生,為后續大量基于其源碼開發的 PostgreSQL、Sybase、Informix 和 Tandem 等著名產品打下堅實基礎 。1977 年,Oracle 前身 SDL 成立 。1978 年,SDL 發布 Oracle 第一個版本 。
20 世紀 80 年代,關系型數據庫進入商業化時代 。1983 年,IBM 發布 Database2 (DB2) for MVS,標志 DB2 正式誕生 。1985 年,Informix 發布第一 款產品 。1986 年,美國國家標準局(ANSI)數據庫委員會批準 SQL 作 為數據庫語言的美國標準并公布標準 SQL 文本 。1987 年,國際標準 化組織(ISO)也做出了同樣決定,對 SQL 進行標準化規范并不斷更新, 使得 SQL 成為關系型數據庫的主流語言 。此后相當長的一段時間內, 不論是微機、小型機還是大型機,不論是哪種數據庫系統,都采用 SQL 作為數據存取語言,各個公司紛紛推出各自支持 SQL 的軟件或 接口 。同年 5 月,Sybase 發布首款產品 。
20 世紀 90 年代,Access、PostgreSQL 和 MySQL 相繼發布 。至此,關系型數據庫理論得到了充分的完善、擴展和應用,在后關系型 階段,關系型數據庫仍在發展演進,從未中止 。
3.后關系型階段(2008-至今):模型拓展與架構解耦并存
進入 21 世紀,隨著信息技術及互聯網不斷進步,數據量呈現爆發式增長,各行業領域對數據庫技術提出了更多需求,數據模型不斷 豐富、技術架構逐漸解耦,一部分數據庫走向分布式、多模處理、存算分離的方向演進 。谷歌在 2003 至 2004 年公布了關于三篇技術論文為分布式數據庫奠定基礎, Mike Stonebraker 提出“one size does not fit all”并依照此理念推出多種數據模型、存儲介質的數據庫,數據庫發展正式進入第三階段 。
數據模型不斷拓展 。步入互聯網 Web 2.0 和移動互聯網時代,許 多互聯網應用表現出高并發讀寫、海量數據處理、數據結構不統一等 特點,關系型數據庫并不能很好地支持這些場景 。另一方面,非關系型數據庫有著高并發讀寫、數據高可用性、海量數據存儲和實時分析 等特點,能較好地支持這些應用的需求 。因此,一些非關系型數據庫也開始興起 。為了解決大規模數據集合和多種數據類型帶來的挑戰, NoSQL 數據庫應運而生,其訪問速度快,適宜處理互聯網時代容量大、多樣性高、流動性強的數據 。
以 Apache Cassandra 、Apache HBase 為代表的分布式存儲為基 礎的數據庫,底層存儲基于分布式文件系統具備了分片或者分區存儲 的能力,擴大了普通存儲設備的存儲系統的上限 。
以 Greenplum 為代表的 Shared-Nothing 架構,通過多節點協同工 作擴大分布式存儲能力的同時,相應的還通過 MPP 架構可以支持多 級并行計算處理,增強查詢和分析能力 。
以 Kylin 為代表的多維數據庫產品,以及以 OpenTSDB 為代表的 時序數據庫,使用其它分布式數據庫作為后臺存儲,通過構建相應的 數據模型和索引技術,擴展成為新的數據庫 。
其他還包括分庫分表等中間件解決方案,嚴格來說不屬數據庫系 統,但是提供類分布式數據庫解決方案,適用于合適的業務場景對分 布式數據庫的需求 。
(三)數據庫技術發展趨勢
大數據時代,數據量不斷爆炸式增長,數據存儲結構也越來越靈 活多樣,日益變革的新興業務需求催生數據庫及應用系統的存在形式 愈發豐富,這些變化均對數據庫的各類能力不斷提出挑戰,推動數據庫技術的不斷演進,總結起來體現為三個方向:1)多模數據庫實現 一庫多用、利用統一框架支撐混合負載處理、運用 AI 實現管理自治, 提升易用性、降低使用成本;2)充分利用新 興硬件、與云基礎設施深度結合,增強功能、提升性能;3)利用隱私計算技術助力安全能力提升、區塊鏈數據庫輔助數 據存證溯源,提升數據可信與安全 。
1.趨勢一:多模數據庫實現一庫多用
后關系型階段,數據結構越來越靈活多樣 。面對這些多種結構的數據,應用程序對不同數據提出了不同存儲要求, 數據的多樣性成為數據庫平臺面臨的一大挑戰,數據庫因此需要適應多類型數據管理的需求 。多模數據庫支持靈活的數據存儲類型,將各種類型的數據進行集中存儲、查詢和處理,可以同時滿足應用程序對于結構化、半結構化和非結構化數據的統一管理需求 。未來在云化架構下,多類型數據管理是一種新趨勢, 也是簡化運維、節省開發成本的一個新選擇 。
2.趨勢二:統一框架支撐分析與事務混合處理
業務系統的數據處理分為聯機事務處理與聯機分析處理兩類 。企業通常維護不同數據庫以便支持兩類不同的任務,管理和維護成本高 。因此,能夠統一支持 OLTP 和 OLAP 的數據庫成為眾多企業的需求 。產業界當先正基于創新的計算存儲框架研發HTAP 數據庫,其能夠基于統一套引擎同時支撐業務系統運行和分析決策場景,避免在傳統架構中,在線與離線數據庫之間大量的數據交互 。
3.趨勢三:運用 AI 實現管理自治
面對大規模數據和不同的應用場景,傳統數據庫組件存在業務類型不敏感、查詢優化能力弱等問題 。目前有研究通過將傳統數據庫組 件用機器學習算法替代,來實現更高的查詢和存儲效率,自動化處理各種任務 。機器學習算法可以分析大量數據記錄,標記異常值和異常模式,幫助企業提高安全性,防范入侵者破壞,還可以在系統運行時自動、連續、無人工干預地執行修補、調優、備份和 升級操作,盡可能減少人為錯誤或惡意行為,確保數據庫高效運行、 安全無失 。
4.趨勢四:充分利用新興硬件
最近十幾年,新興硬件在經歷學術研究、工程化和產品化階段發展,對數據庫系統設計提供了廣闊思路 。期間最主要的硬件技術進步是多處理器、多核、大內存和 固態硬盤,多處理器和多核為并行處理提供可能,SSD 大幅提升了數據庫系統的 IOPS 和降低延遲,大內存促進了內存數據庫引 擎的發展; GPU 適用于特定數據庫操作加速,如掃描、謂詞過濾、大量數據的 排序、大表關聯、聚集等操作 。隨著新型硬件成本逐漸降低,充分利用新興硬件資源提升數據 庫性能、降低成本,是未來數據庫發展的重要方向之一 。
5.趨勢五:與云基礎設施深度結合
云計算技術 的不斷發展催生出將數據庫部署在云上的需求,通過云服務形式提供數據庫功能的云數據庫應運而生 。云與數據庫的融合,減少了數據庫參數的重復配置,具有快速部署、高擴展性、高可用性、可遷移性、 易運維性和資源隔離等特點,具體有兩種形態,一種是基于云資源部署的傳統數據庫;另一種是基于容器化、微服務、Serverless 等理念 設計的存算分離架構的云原生數據庫 。云原生數據庫能夠隨時隨地從 多前端訪問,提供云服務的計算節點,并且能夠靈活及時調動資源進行擴縮容,助力企業降本增效 。未來,數據庫將深度結合云原生與分布式特點,幫助用戶實現最大限度資源池化、彈性變配、 超高并發等能力,更加便捷、低成本實現云上數字化轉型與升級 。
6.趨勢六:隱私計算技術助力安全能力提升
隨著數據上云趨勢顯著,云數據庫面臨的風險相較于傳統數據庫更加多樣化、復雜化 。如何解決第三方可信問題是云數據庫面臨的首要安全挑戰 。當前云數據庫數據安全隱私保護是針對數據所處階段來制定保護措施的 。這些傳統技術手段可以解決單點風險,但不成體系,且對處于運行或者運維狀態下的數據則缺少有效的保護 。近年來以同態加 密等密碼學為代表的軟件解決方案和以可信執行環境為代表 的硬件方案為數據庫安全設計提供許多新思路 。密碼學方案的核心思路是整個運算過程都是在密文狀態,通過基于數學理論的算法來直接對密文數據進行檢索與計算 。硬件方案的核心思路是將存放于普通環 境的加密數據傳遞給 TEE 側,并在 TEE 側完成數據解密和計算任務 。未來,此類數據庫將圍繞算法安全性和性能損耗等問題,逐步突破,進而提供覆蓋數據全生命周期的安全保護機制 。
7.趨勢七:區塊鏈數據庫輔助數據存證溯源
數據庫管理員或黑客對數據庫歷史記錄的修改是一個經常爆發的問題 。區塊鏈具有去中心化、信息不可篡改等特征,數據庫能夠長期留存有效記錄,所有歷史操作均不可更改并能追溯, 適用于金融機構、公安等行業的應用場景 。區塊鏈數據庫由于要容忍節點拜占庭行為而不得不采用代價更高的共識算法成為落地應用的一大挑戰 。由于沒有統一的協調者,如何保證區塊鏈網絡分片時分布式系統的安全性,高并發下的并行控制如何保證 ACID 也都是設計者不可忽視的問題 。未來,提升區塊鏈數據庫性能將成為學術界與工業界共同探索的命題 。
三、數據庫產業發展
全球數據庫產業生態成熟壯大,在發展過程中,逐漸細分出數據 庫產品、數據庫服務和數據庫支撐體系三個細分產業 。
(一)數據庫產業概述
(二)數據庫產品
1.企業主體大部分仍處于發展初期階段
成立時間呈現兩個熱周期 。國內由于頂層設計加碼,掀起一股國產數據庫的浪潮 。2012 年, 大數據成為國家級發展戰略 。政策利好與資本關注 為我國數據庫產業不斷注入新活力,國產數據庫產業迎來第二輪浪潮 。
地域分布以一線城市為主 。總部分布情況代表企業所在城市對數據庫產業的重視與發展程度;員工數量普遍在百人以下 。我國數據庫雖然數量眾多,但平均從業人員數量較少,仍在快速發展階段;平均專利數量不足五十個余,仍有較大發展空間 。
2.產品類型仍以關系型為主,非關系型產品正在快速發展
我國數據庫產品數量分布呈現以關系型為主,非關系型及混合型 數據庫為輔的局面 。數據庫產品根據研發方式不同,分為完全自研和基于開源二次研發兩類 。
我國關系型數據庫產品多數基于 MySQL 和 PostgreSQL 二次開 發而來;我國非關系型數據庫產品發展勢頭良好,逐漸受到國際認可 。非關系型數據庫中以基于開源數據庫品進行二次開發為主,時序數據庫因其存儲處理海量時序數據的特性,常應用于工業控制、物聯網、車聯網等領域 。
3.市場份額正逐漸傾向云上,線下市場迎來激烈競爭
線上市場呈現快速增長 。隨著云計算技術不斷成熟,云上數據庫市場快速增長;線上市場格局巨頭涌現 。我國頭部云服務商處于領先地位, 云上數據庫作為云基礎設施的延續與發展,具備天然先發優勢;存量市場替換空間可觀,線下市場迎來激烈競爭 。隨著市場傾向的變化,傳統部署市場替換國外數據庫空間巨大 。隨著技術層面的分布 式改造需求不斷以及市場層面自發選擇國產產品傾向,國產數據庫市場份額有望得到大幅提升,各企業紛紛搶抓戰略機遇,不斷迭代打磨產品能力,搶占市場份額 。國產數據庫供給能力得到大幅提升,產品功能逐漸完善,集群規模與日俱增,性能表現不斷攀升,市場競爭程度較為激烈;初創企業和巨頭陸續投身開源市場 。開源已成為數據庫產業的共識,開源有助于擴 大人才規模及上下游生態影響力,通過運營開源社區快速獲得反饋并加快產品開發、提升產品質量,同時反哺社區開發者及獨立軟件開發商等生態伙伴,能夠達到多方共贏目的 。
(三)數據庫服務
很長一段時間內,我國數據庫服務工作主要以附屬技能的形式由應用開發商和硬件服務商提供保障 。隨著數據庫對于企業的重要性越來越高,企業對于以數據庫為核心的專業服務的需求也越加迫切,獨立的數據庫服務廠商開始嶄露頭角,并形成了一個專業化的數據庫細分服務領域 。
1.頭部企業主體發展時間較長
數據庫服務產業主體主要由多年來在電信、金融、政務等重要行業提供外包 IT 運維服務的企業構成,成立時間普遍十年以上,核心成員多為早期提供服務的專家,由于企業數據庫技術體系龐雜,需要服務提供商能夠提供橫向主流數據庫產品 和縱向多版本技術服務覆蓋能力,服務行業技術壁壘較高 。
2.服務工作范圍廣,缺乏行業規范和指引
數據驅動時代,企業開始利用海量實時數據分析業務發展、了解客戶行為和優化配置資源,并據此制定企業發展戰略 。數據庫系統作為數據存儲的主要載體,數據庫服務貫穿企業 IT 系統的整個生命周期 。按照信息系統建設的不同階段,數據庫的服務范圍主要覆蓋規劃 設計、實施部署、運維運營三個方面 。
3.服務市場集中在重點行業,環境變革倒逼各主體轉型升級
服務市場主要集中在金融、電信、政府、制造、交通五個行業 。云計算改變傳統服務市場格局 。在云計算逐漸成熟之后,與云上 數據庫市場份額迅速擴大 。而云上數據庫的咨詢、部署、運維等服務 工作則直接由云計算公司負責,所以云計算公司將改變傳統服務市場 格局 。由于服務工作定制化程度較高,相對標準化云產品,屬于勞動力密集型工作,所以從綜合成本角度出發,未來云上數據庫服務市場 部分將由云計算公司依靠自身資源儲備負責,另一部分云計算公司將與線下服務公司進行合作,形成優勢互補,共同完成相關工作 。
服務企業向產品企業轉型 。如今隨著分布式云數據庫興起,數據庫運維要求不斷提升,數據庫服務商除了提供傳統的駐場與遠程運維類服務外,圍繞數據庫開發、測試、運維等環節也提供多種類型的數據庫周邊工具 。為了拓展業務范圍,提升企業利潤總額, 認識到可以利用自身服務能力積累與經驗,對數據庫產品供應商形成 差異化優勢,順勢推出自有數據庫產品,進一步加劇了數據庫產品市 場競爭激烈程度 。
(四)數據庫支撐體系
當前數據庫支撐體系由于數據庫技術路線不斷演進,也正處于變革和創新的高發期 。
1.學術研究仍以關系理論為重點,國內研究水平逐漸提升
學術界公認的數據庫領域頂級會議主要有 VLDB、SIGMOD 和 ICDE 。從這些會議的研究方向看,當前以關系型數據庫為主,非關系型數據庫為輔 。綜合分析全球論文研究主題,除了關系型數據庫,圖論、圖數據 庫、查詢優化、機器學習、分布式處理、時序數據、流數據、時空數 據、云數據庫等代表當前火熱的技術方向 。此外,數據安全、隱私保 護也是每年不可或缺的研究主題;我國在全球數據庫領域學術影響逐漸提升 。
2.領域內各類組織形成,產業熱度不斷提高
數據庫支撐體系各類組織主要分為以下四類:一類是由具備官方背景的研究組織,用于 匯聚國內數據庫理論研究頭部力量;第二類是數據庫從業人員牽頭發 起的面向數據庫技術愛好者的用戶組織,用于進行各類專題技術交流和討論;第三類是由數據庫企業組建,針對自身特定產品討論的官方技術社區,;第四類是匯聚數據庫整體行業信息的第三方技術社區,用于搭建領域內線上交流平臺 。
3.多層級數據庫人才培訓體系正在快速形成
高校教育注重普適教育,重視社會人才發展大趨勢需求 。通過原 理性知識傳授、數據庫系統應用實踐等教學方式,為數據庫產業發展 提供了大量儲備人才 。
培訓機構是數據庫人才認證獲取的主要途徑 。培訓機構累計為合作伙伴培訓學員超 5 萬人次,其中獲得 Oracle、MySQL、PostgreSQL 認證學員數千人,為企業輸送專業 DBA 萬余人 。培訓方式為廠商授 權培訓中心或聯合認證培訓中心等,培訓知識主要面向數據庫工程實踐和應用 。
企業培訓基于人才培養時間成本、人才可用性等考量因素,多渠道聚集人才 。一方面,數據庫廠商開始建立自己的認證體系,并形成 了不同級別的培訓課程和認證考試;另一方面,一些企業開始加強與院校的產教融合嘗試,通過與高校進行教材編撰、實訓開發、專業共建、人才共建等合作項目,在高校提前培養數據庫相關儲備人才 。
4.數據庫領域受資本市場高度追捧
近些年隨著國產數據庫概念的火熱與應用需求多樣化帶動的技術變革,國內外各路資本紛紛注入數據庫產業,形成“百舸爭流”的旺盛態勢 。
四、數據庫典型行業應用動態
通過 IT 監管環境、數據業務復雜性、核心業務數據類型、 成本敏感性、科技能力儲備情況五個維度對五個典型行業進行分析:
(一)金融行業&電信行業
傳統金融機構(銀行、證券、保險)和電信運營商作為支撐國民經濟正常運行的關鍵行業,兩 個行業的重要數據庫系統由于支撐大量涉賬業務,業務正確性和連續 性關系國計民生,在強監管壓力下,對數據一致性要求極高,所以主要應用以關系型數據庫為主 。
目前金融和電信行業在數據庫應用方面呈現五個新需求:一是隨著移動互聯網的發展,數據量呈現急劇增長,這對數據存儲和管理提出了更高要求;二是隨著普惠金融落地,其對業務連續性能力更加重視;三是隨著電子支付的大面積普及,需要面臨高并發業務和高用戶量帶來的系統壓力;四是面臨互聯網金融對傳統金融業務的沖擊以及提速降費要求,業務創新要求進 一步強烈;五是防止潛在供應鏈風險,技術層面存在國產化需求 。根 據上述需求分析,金融和電信行業在數據庫應用方面正在呈現三大趨 勢:
一是大部分存量數據庫將向分布式架構升級 。金融和電信行業核 心業務數據類型均為關系型數據庫,在當前信息科技背景下,此類集中式數據庫所面臨的業務體量將呈現爆發性增長 。同時由于單一硬件 能力增長有限,所以無法依靠縱向升級硬件擴展存量數據庫能力上限 。而與集中式事務數據庫相比,分布式數據庫采用多種模式實現數據的 分散存儲,將壓力分散到不同服務器上,并不斷通過增加存儲或計算 節點來實現彈性升級,克服了集中式數據庫的諸多缺點 。
二是應用大量非關系型數據庫助力創新業務落地 。金融機構和電 信運營商擁有龐大客戶群體的各類數據,覆蓋客戶、賬戶、產品、交易等大量的結構化數據,以及海量的語音、圖像、視頻等非結構化數據 。這些數據背后蘊藏的豐富全面的信息資源,能夠有效賦能其自身業務發展 。而這些數據的價值挖掘,均需應用到圖數據庫、文檔數據庫等非關系型數據庫,所以 未來將會有大量非關系型數據庫助力金融和電信創新業務落地,
三是產品選型逐漸傾向國產數據庫供應商 。金融和電信行業數據庫產品類型以國外商用產品和國外社區開源產品為主, 但當前受國際單邊保護主義影響,國外商用數據庫產品存在潛在供應鏈風險 。面對強監管的要求,金融和電信行業對于風險的容忍度極低, 所以各機構在選型方面均開始傾向國產數據庫 。國產數據庫產品功能、性能水平不斷增強,產業供給能力整體進入上升周期,增強了金融和電信機構選型國產數據庫產品信心 。
(二)政務行業
數字政府能力的提升,需依賴強大的現代 化的智能治理基礎設施,而數據庫作為支撐數據存儲和計算的核心組件,是智能治理基礎設施的重要組成部分 。
當前我國在提升社會治理的數字化治理水平過程中,主要呈現兩大特點:一是個體、企業和社會等被治理對象數量龐大、日趨復雜, 而當前我國智能治理基礎設施仍以傳統關系型數據庫為主,效率較低, 亟需變革更新;二是智能治理要求各層、各機構政府人員深度應用信 息科技工具,而當前信息科技工具應用普遍需要較高門檻,政務行業 科技能力儲備情況較普遍較低,導致數據基礎設施建設完成之后,應 用效果不佳,難以達到預期效果 。
當前政務行業在數據庫應用方面正在呈現兩大趨勢:
一是大范圍應用空間型、關聯型數據庫等產品 。社會治理普遍基于空間位置和人、物、企業等實體的關聯關系進行,而傳統關系型數據庫在面對空間位置和實體關聯關系的分析和建模能力不足 。當前空間型數據庫和圖數據庫的快速發展提高了空間位置數據和實體關聯 關系分析的存儲和分析效率,將是未來智能治理中數據庫的重要應用方向 。
二是利用各類工具組件,做到數據庫應用“平民化” 。為達到政務 人員深度應用信息科技工具目的,一方面在加強政務人員信息化能力 同時,數據庫應用過程也需盡量做到“平民化”,包括但不限于具備 可視化建模能力、支持特定政務領域解決方案模板、流程式指引等 。
(三)制造業
隨著政策環境的鋪墊和工業互聯網基礎設施的逐步完善,工業大數據迎來重大發展機遇 。當前物聯網技術正逐步滲透工業領域,不斷增長的傳感器、飆升的數據量以及更高的大數據分析需求對原有的數據庫系統提出了新的需求,包括增加擴展性、實現與大數據技術生態的友好對接、降低大規模應用價格、充分利用邊緣計算設備能力 。
未來工業行業在數據庫應用方面將呈現兩大趨勢:
一是應用大量時序數據庫 。隨著物聯網場景的豐富以及人們對信息全面掌控的需求,基于時間序列數據類型的應用越來越多,工業業 務對于查詢的要求已經不僅僅是滿足于一些基礎的條件查詢或是插 值查詢,查詢會大量擴展到基于時間的維度,而時序數據庫更契合此類場景 。
二是逐步向邊緣計算發展 。工業領域是 IoT 的重要試驗田 。當數 據過于龐大,集中化的處理方式就很難響應實時的數據分析需求,這 就帶來了數據計算向邊緣的發展,需要實時響應的監控就通過邊緣設 備及時的處理并反饋,需要用于大規模分析的數據再進行集中存儲, 這種分級的處理方式能夠有效地提升時效性數據的價值,同時減輕存 儲系統的負擔,當前許多工業數據庫正在研發邊緣計算版本 。
(四)互聯網
當前我國互聯網行業發展進入調整期,上市企業營收政府大幅放緩,總市值持續波動,投融資低位徘徊,行業格局出現分化 ?;ヂ摼W 行業為充分發揮新要素、新模式、新動能等方面的優勢,對底層 IT系統中的數據庫提出了多項新要求,以性能好、造價低、迭代快為核心 。
未來互聯網行業在數據庫應用方面將呈現三大趨勢:
一是利用內存數據庫加速業務效率 。隨著動態隨機存儲器容量的上升和單位價格的下降,使大量數據在內存中的 存儲和處理成為可能,Redis、Memcached 等內存數據庫逐漸成熟, 應用范圍越來越廣 。未來幾年,隨著非易失性存儲器件(NVM)逐 步投入商用,新硬件將會給內存數據庫帶來更大的發展機遇 。
二是開源數據庫應用更加廣泛 。開源數據庫具有獲取方便、成本低等優勢,同時互聯網企業科技能力強、對于成本敏感等特點,所以 開源數據庫產品在互聯網行業已被廣泛應用 。當前越來越多的數據庫 企業將開源作為一種商業運營策略,所以開源數據庫市場將更加豐富, 為其進一步在互聯網領域廣泛應用提供了條件 。
三是初創公司利用云數據庫促進其快速發展 ?;ヂ摼W創業公司一 般具備人數較少、資金有限、場地不足等特點,無法投入大量資源用 于建設 IT 基礎設施 。當前各大云計算公司推出眾多云數據庫產品,由于利用了云資源的優勢,云數據庫具備彈性好、計費模式便捷、套 件生態好等特點,符合互聯網創業公司的應用需求 。互聯網創業公司 未來將更大面積應用云數據庫 。
五、總結與展望
數據庫作為提供數據存儲與處理能力的軟件產品,是各機構信息系統的關鍵部件,是助力數據價值釋放的核心引擎 。隨著數據躍升為生產要素,數據重要性進一步提高,我國數據庫產業也迎來新一輪變局 。
從技術角度看,一方面數據應用的變化倒逼數據庫具備更大數據存儲容量、更多數據計算模型、更快數據業務響應能力,整體技術發展進入后關系型階段,架構設計逐漸分布式化、模型構建逐漸場景化; 另一方面,人工智能、新型硬件、區塊鏈、密態計算等關聯技術的創 新正在催生新型數據庫設計模式,傳統數據庫功能邊界正被逐漸突破 。
在數據庫產業和技術的變局過程中,供給側、應用側、生態側均 處于機遇與挑戰并存的狀態 。未來一段時期,我國數據庫行業將圍繞 兩個核心命題進行發展:
一個是縮小“高要求的存量數據應用需求”與“仍處于發展初期 階段的供給能力”之間的差距 。在存量數據應用需求方面,國際數據庫產品已經為我國數據庫行業樹立了發展的目標與方向,相比之下, 我國數據庫產業供給能力仍處于發展初期,與應用方既有的使用預期仍存在差距 。預計我國數據庫行業未來圍繞“技術”和“生態”兩條 主線,一方面利用資金、開源、人才、場景等資源完成技術成熟度達標,另一方面補足運營、服務、渠道短板,完成生態成熟度達標 。
另一個是探索“創新型數據應用需求”與“數據庫技術產品演進 路線”的合理映射關系 。創新型數據應用需求是更長周期內數據庫產 業發展的牽引力,但是數據庫技術產品如何演進、從而滿足創新型數據應用需求并不存在成熟的路線圖,所以未來數據庫技術產品將在一 段時間內呈現較強的隨機演進狀態 。為解決這一核心命題,數據應用 方與數據庫供給方必須利用產業平臺、人才互通等手段,完成深度融合與綁定 。
“明者見于無形,智者慮于未萌 。”當前我國數據庫產業的發展格局,是緊跟時代步伐順應歷史規律、著眼全球提升國際綜合競爭力、 立足國情推動新舊動能接續轉換的外在表現 。我們相信,以數據庫為代表的新型數據基礎設施不斷創新發展,對于全面建設社會主義現代 化國家的征程,將起到重要的推動作用 。未來已來,拭目以待 。
- 新車磨合期使用時的十大注意事項 很多老司機不見得都懂
- 手機的home鍵失靈 安卓手機的home鍵突然無法使用了
- 手機使用的模擬器 模擬器手機模擬器
- 遠程登錄電腦軟件 使用哪些軟件可以遠程登錄一臺
- swf播放器怎么使用 swf如何打開并播放
- 如何使用復制器 復制器怎么復制房子
- 建議使用非IE內核瀏覽器 非ie內核瀏覽器是什么意思
- ps的筆刷工具怎么用 ps筆刷使用教程
- 電腦錄音用什么軟件免費 電腦錄音軟件免費使用
- office一鍵激活工具怎么使用 office一鍵激活工具打不開
