文章插圖

文章插圖
前段時間在網上看到一張大數據行業全景圖 , 幾乎涵蓋了大數據相關的全部技術 。光數據庫產品就好幾十種 , 真是眼花繚亂:)
簡單而言 , 可以用二維表來表示的就是結構化數據(如 , 包含有不同字段的一條記錄);相反 , 不方便用二維邏輯表來表現的數據 , 如文本、圖片、視頻、XML、HTML、圖像和音頻就是非結構化數據 。此外 , 字段可根據需要擴充 , 即字段數目不定的 , 可稱為半結構化數據 。
關系型數據庫就是由二維表及其之間的聯系所組成的一個數據集 。可以這樣理解 , 如果數據集(數據庫)是關系型 , 那么數據一定是結構化的 , 相反如果數據是結構化 , 那么組成的數據集可能是關系型 。關系型數據庫的最大特點就是事務的一致性 。傳統的關系型數據庫讀寫操作都是事務的 , 具有ACID(不展開講)的特點 , 如典型的銀行系統 。但是 , 在互聯網應用中 , 一致性卻不是顯得那么重要:如張三看到的內容和李四看到同一內容更新不一致是可以容忍的 , 換句話說 , 兩個人看到同一好友的數據更新的時間差那么幾秒是可以容忍的 。因此 , 關系型數據庫的最大特點在互聯網時代已經不那么重要了 。
1、關系型數據庫
數據庫發展的早期 , 幾乎都是集中式的關系型數據庫的天下 , 如商業型數據庫ORACLE、SQL Server、IBM DB2、Sybase等 , 尤其是ORACLE , 幾乎占到了大型數據庫市場份額的70%以上 , 這也是為什么“去IOE”(IBM的小型機、Oracle的數據庫、EMC的存儲)工作中去O最難的原因 。
后來逐漸發展起來的開源數據庫有MySQL、PostgreSQL 。據統計 , 截止2016年11月份 , MySQL已超過Oracle數據庫 , 位居關系型數據庫排行榜第一 。互聯網行業如谷歌、FaceBook、阿里、騰訊、京東等 , 傳統行業如順豐、圓通、上港集團、陸港集團、上汽集團、上交所、寧波銀行、恒豐銀行、聯通、移動、電信等 , 都有大規模應用MySQL 。PostgreSQL主要在GIS領域處于優勢地位 , 有豐富的GIS數據類型和處理算法 。
2、非關系型數據庫(NoSQL):大部分都是開源的 , 可謂百花齊放百家爭鳴 , 常見的產品超過20種 。其中有很大一部分非關系型數據庫都是針對某些特定的應用需求出現的 , 因此 , 對于特定應用具有極高的性能 。
非關系型數據庫主要分為以下幾類:
(1)鍵值(key-value)數據庫:面向高性能并發讀寫 , 典型代表如Redis 。
(2)列存儲(Columnar Storage)數據庫:面向PB級的分析應用 , 如:HBase , Hypertable 。京東、阿里、騰訊、唯品會、圓通、順豐等都將HBase大規模應用于準實時的數據分析挖掘計算以及提供歷史歸檔數據的存儲和查詢服務 。
(3)文檔數據庫:特點是可以在海量的數據中快速地查詢數據 , 如網頁和移動應用數據 。典型代表:MongoDB , CouchDB , Mark Logic
(4)圖形數據庫:如應用在推薦系統、關系圖譜 , 典型代表:new4j , InfiniteGraph , OrientDB
3、新式關系型數據庫(NewSQL ):NewSQL提供與NoSQL系統相同的擴展性能 , 且保持傳統數據庫支持的ACID特性 。典型代表:SAP HANA , VoltDB , nuoDB , MariaDB , Pivotal
4、MPP(Massively Parallel Processing)數據庫:指使用多個SQL數據庫節點搭建的數據倉庫系統 , MPP解決了單個SQL數據庫不能存放海量數據的問題 。代表產品有Teradata , Vertica , Redshift , Greenplum
- php架構cms是什么意思 cms系統哪個好用
- win7睡眠是什么意思 win7設置休眠從不 但是還是會睡眠
- 夏至是什么時候 怎么過好夏至
- 小暑是什么意思 小暑是什么時候
- 人工智能平臺是什么 人工智能軟件平臺有哪些
- 鹽鹵,鹽鹵的性質 鹽鹵是什么
- 五險一金是什么 五險一金指什么多少錢
- 運維各個崗位的職責是什么 運維項目經理的職責
- 肉卡在牙縫里一會就臭了是什么原因
- 平面ui是什么意思 平面設計和UI的區別
