cdn分發管理系統 cdn 分發



文章插圖
cdn分發管理系統 cdn 分發

文章插圖
CDN 概述
CDN 全稱 Content Delivery Network , 即內容分發網絡 。其基本思路是盡可能避開互聯網上有可能影響數據傳輸速度和穩定性的瓶頸和環節 , 使內容傳輸的更快、更穩定
CDN 的工作原理 就是將源站的資源緩存CDN各個節點上 , 當請求命中了某個節點的資源緩存時 , 立即返回客戶端 , 避免每個請求的資源都通過源站獲取 , 避免網絡擁塞、緩解源站壓力 , 保證用戶訪問資源的速度和體驗 。
舉一個生活中的例子 , 我們在某東上購買商品 , 快遞能做到當日送達 , 其根本原理是通過在全國各地建設本地倉庫 。當用戶購買商品時 , 通過智能倉配模式 , 為消費者選擇就近倉庫發貨 , 從而縮短物流配送時間 。
image.png
而商品庫存的分配 , 流程可以參考下圖 , 從 工廠(源站) -> 地域倉庫(二級緩存) -> 本地倉庫 (一級緩存)
image.png
內容分發網絡 就像前面提到的 智能倉配網絡 一樣 , 解決了因分布、帶寬、服務器性能帶來的訪問延遲問題 , 適用于站點加速、點播、直播等場景 。使用戶可就近取得所需內容 , 解決 Internet網絡擁擠的狀況 , 提高用戶訪問網站的響應速度和成功率 。
image.png
CDN的誕生
image.png
CDN 誕生于二十多年前 , 為解決內容源服務器和傳輸骨干網絡壓力過大的問題 , 在 1995 年 , 麻省理工學院教授 , 互聯網發明者之一 Tom Leighton 帶領著研究生 Danny Lewin 和其他幾位頂級研究人員一起嘗試用數學問題解決網絡擁堵問題 。
他們使用數學算法 , 處理內容的動態路由安排 , 并最終解決了困擾 Internet 使用者的難題 。后來 , 史隆管理學院的 MBA 學生 Jonathan Seelig 加入了 Leighton 的隊伍中 , 從那以后他們開始實施自己的商業計劃 , 最終于 1998 年 8 月 20 日正式成立公司 , 命名為 Akamai 。Akamai 公司通過智能化的互聯網分發 , 結束了 “World Wide Wait” 的尷尬局面 。
同年 1998 年 , 中國第一家 CDN 公司 ChinaCache 成立
CDN工作原理接入CDN
【cdn分發管理系統 cdn 分發】在接入CDN前 , 當我們訪問某個域名,直接拿到第一個真實服務器的IP地址 , 整個流程如下(圖有點簡陋)
image.png
當我們需要加速網站時 , 通過向運營商注冊自己加速域名 , 源站域名 , 然后進入到自己域名的DNS配置信息 , 將 A 記錄修改成 CNAME 記錄即可 。阿里云加速申請參考如下:
image.png
CDN訪問過程
image.png
1、用戶訪問圖片內容 , 先經過 本地DNS 解析 , 如果 LDNS 命中 , 直接返回給用戶 。2、LDNS MISS , 轉發 授權DNS 查詢3、返回域名 CNAME picwebws.pstatp.com.wsglb0.com. 對應IP地址(實際就是DNS調度系統的ip地址)4、域名解析請求發送至DNS調度系統 , DNS調度系統為請求分配最佳節點IP地址 。5、返回的解析IP地址6、用戶向緩存服務器發起請求 , 緩存服務器響應用戶請求 , 將用戶所需內容傳送到用戶終端 。
圖:華為云全站加速示意圖
CDN解決了什么問題骨干網壓力過大
Tom Leighton在 1995 年 ,  帶領團隊嘗試用數學問題解決網絡擁堵問題 , 從而解決骨干網絡壓力過大的問題 。由于上網沖浪 的少年越來越多 , 造成骨干網的核心節點流量吞吐不足以支撐互聯網用戶的增長 , 通過CDN可以避免用戶流量流經骨干網 。
骨干網是一個全球性的局域網,一級互聯網服務提供商(ISP)將其高速光纖網絡連接在一起 , 形成互聯網的骨干網 , 實現在不同地理區域之間高效地傳輸流量 。
1、局域網
局域網(Local Area Network , LAN)是指在某一區域內由多臺計算機互聯成的計算機組 , 比如:在大學時期 , 晚上12點后斷網了 , 我們仍然能夠通過路由器開黑打CS , 魔獸 。那就是基于局域網互聯 , 實現資料共享與信息之間的通信 。
image.png
2、骨干網
這里引用一下中國電信全網架構 , 骨干網可以理解成是一個全國性的局域網 , 通過核心節點的流量互通 , 實現全網網絡的互通 。這也是為什么我們稱為互聯網 的原因 。
image.png
北京、上海、廣州 , 是ChinaNet的超級核心 。除了超級核心之外 , ChinaNet還有天津、西安、南京、杭州、武漢、成都等普通核心 。
image.png
三公里之 middlemile
通常網絡訪問中會有”三公里”路程
第一公里為:源站到ISP接入點第二公里為:源站ISP接入點到訪問用戶的ISP接入點第三公里(最后一公里)為:用戶ISP接入點到用戶客戶端
CDN網絡層主要用來加速第二公里(middlemile),
在 CDN 的基礎架構中 , 通常使用兩級 server 做加速:
L1(下層):距離用戶(或俗稱網民)越近越好 , 通常用于緩存那些可緩存的靜態數據 , 稱之為 lastmile(最后一公里) 。L2(上層):距離源站越近越好 , 稱之為 firstmile(第一公里) , 當 L1 無法命中緩存 , 或內容不可緩存時 , 請求會通過 L1 透傳給 L2 , 若 L2 仍然沒有命中緩存或內容不可緩存 , 則會繼續透傳給 L2 的 upstream(有可能是源站 , 也有可能是 L3) , 同時 L2 還可以做流量、請求數的量級收斂 , 減少回源量(如果可緩存) , 降低源站壓力 。L1 和 L2 之間的部分 , 是 CDN 的 ”內部網絡“ , 稱之為 middlemile(中間一公里) 。
image.png
CDN的組成全局負載均衡系統 GLB(Global Load Balance)
image.png
當用戶訪問加入CDN服務的網站時 , 域名解析請求將最終由 “智能調度DNS”負責處理 。它通過一組預先定義好的策略 , 將當時最接近用戶的節點地址提供給用戶 , 使用戶可以得到快速的服務 。同時它需要與分布在各地的CDN節點保持通信 , 跟蹤各節點的健康狀態、容量等信息 , 確保將用戶的請求分配到就近可用的節點上.緩存服務器
緩存服務器主要的功能就是緩存熱點數據 , 數據類型包括:靜態資源(html,js,css等) , 多媒體資源(img,mp3,mp4等) , 以及動態數據(邊緣渲染)等 。
眾所周知耳熟能詳的與 CDN 有關的開源軟件有:
SquidVarnishNginxOpenRestyATSHAProxy
具體對比可參考:https://blog.csdn.net/joeyon1985/article/details/46573281
CDN的分層架構
image.png
源站
源站指發布內容的原始站點 。添加、刪除和更改網站的文件 , 都是在源站上進行的;另外緩存服務器所抓取的對象也全部來自于源站 。
CDN 調度策略DNS 調度
基于請求端 local DNS 的出口 IP 歸屬地以及運營商的 DNS 調度 。
DNS 調度的問題:
DNS 緩存時間在 TTL 過期前是不會刷新的 ,  這樣會導致節點異常的時候自動調度延時很大 , 會直接影響線上業務訪問 。大量的 local DNS 不支持 EDNS 協議 , 拿不到客戶的真實IP , CDN 絕大多數時候只能通過local DNS IP來做決策 , 經常會出現跨區域調度的情況 。HTTP DNS 調度
客戶端請求固定的 HTTP DNS 地址 , 根據返回獲取解析結果 ??梢蕴岣呓馕龅臏蚀_性(不像DNS調度 , 只能通過local DNS IP來做決策) , 能很好的避免劫持等問題 。
當然這種模式也有一些問題 , 例如客戶端每次加載URL都可能產生一次HTTP DNS查詢 , 這就對性能和網絡接入要求很高 。
302調度
基于客戶端 IP 和 302 調度集群進行實時的流量調度 。
我們來看一個例子:
訪問 URL 鏈接后 , 此時請求到了調度群集上 , 我們能拿到的客戶端信息有 客戶端的出口IP(絕大多情況下是相同的) , 接下來算法和基于 DNS 的調度可以是一樣的 , 只是判斷依據由 local DNS 出口 ip 變成了客戶端的出口IP 。瀏覽器收到302回應 , 跟隨 Location 中的 URL , 繼續發起 http 請求 , 這次請求的目標 IP 是CDN 邊緣節點 , CDN節點會響應實際的文件內容 。
302 調度的優勢:
實時調度 , 因為沒有 local DNS 緩存的 , 適合 CDN 的削峰處理 , 對于成本控制意義重大;準確性高 , 直接獲取客戶端出口 IP 進行調度 。
302 調度的劣勢:
每次都要跳轉 , 對于延時敏感的業務不友好 。一般只適用于大文件 。AnyCast BGP路由調度
基于 BGP AnyCast 路由策略 , 只提供極少的對外 IP , 路由策略可以很快的調整 。
目前 AWS CloudFront、CloudFlare 都使用了這種方式 , 在路由層面進行調度 。
這種方式可以很好地抵御 DDOS 攻擊 , 降低網絡擁塞 。
當然這種方式的成本和方案設計都比較復雜 , 所以國內的 CDN 目前還都是用 UniCast 的方式 。
一些概念CDN運作原理
本地緩存的數據 , 通過key-value 的形式 , 將url 和本地緩存進行映射,存儲結構與 Map相似 , 采用 hash+鏈表形式進行緩存 。
image.png
CDN命中率
衡量我們CDN服務質量的一個核心標準 , 當用戶訪問的資源恰好在緩存系統里 , 可以直接返回給用戶 , 說明CDN命中;如果CDN緩存中 , 沒有命中資源 , 那么會觸發回源動作 。
CDN回源
當CDN本地緩存沒有命中時 , 觸發回源動作,
一級緩存 訪問二級緩存是否有相關數據 , 如果有 , 返回一級緩存 。二級緩存 Miss , 觸發 二級緩存 回源請求 , 請求源站對應數據 。獲取結果后 , 緩存到本地緩存 , 返回數據到一級緩存 。一級緩存 獲取數據 , 緩存本地后 , 返回給用戶 。CDN預熱數據
上面說的訪問模式 , 都是基于Pull模式 , 由用戶決策哪部分熱點數據會最終存留在CDN緩存中;對于大促場景 , 我們往往需要預先將活動相關資源預熱 到 邊緣節點(L1),避免大促開啟后 , 大量用戶訪問 , 造成源站壓力過大 。這時候采用的是 Push模式 。
CDN的特點總結
1、資源訪問加速: 本地Cache加速 , 提高了企業站點(尤其含有大量圖片和靜態頁面站點)的訪問速度 , 并大大提高以上性質站點的穩定性
2、消除運營商間網絡互聯的瓶頸問題: 鏡像服務消除了不同運營商之間互聯的瓶頸造成的影響 , 實現了跨運營商的網絡加速 , 保證不同網絡中的用戶都能得到良好的訪問質量 。
3、遠程加速: 遠程訪問用戶根據DNS負載均衡技術 智能自動選擇Cache服務器 , 選擇最快的Cache服務器 , 加快遠程訪問的速度
4、帶寬優化: 自動生成服務器的遠程Mirror(鏡像)cache服務器 , 遠程用戶訪問時從cache服務器上讀取數據 , 減少遠程訪問的帶寬、分擔網絡流量、減輕原站點WEB服務器負載等功能 。
5、集群抗攻擊: 廣泛分布的CDN節點加上節點之間的智能冗余機制 , 可以有效地預防黑客入侵以及降低各種D.D.o.S攻擊對網站的影響 , 同時保證較好的服務質量。