飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

允中 發自 凹非寺
量子位 編輯 | 公眾號 QbitAI
飛槳(PaddlePaddle)是國內唯一功能完備的端到端開源深度學習平臺,集深度學習訓練和預測框架、模型庫、工具組件、服務平臺為一體,其兼具靈活和效率的開發機制、工業級應用效果的模型、超大規模并行深度學習能力、推理引擎一體化設計以及系統化的服務支持,致力于讓深度學習技術的創新與應用更簡單 。
從Paddle Fluid v1.0以來,飛槳致力于打造更好的用戶體驗,趁著百度開發者大會,也為用戶精心準備了一份大禮,在開發、訓練及部署全流程上進行了全新升級,發布了飛槳的五大優勢,接下來將一一解讀 。
【飛槳PaddlePaddle最新升級5大優勢 paddle框架入門】一、動態圖&靜態圖 - 兼具動態圖和靜態圖兩種計算圖的優勢
從飛槳核心框架Padlde Fluid v1.5開始,飛槳同時為用戶提供動態圖和靜態圖兩種機制 。
靜態圖是先定義網絡結構而后運行,對定義好的圖結構進行分析,可以使運行速度更快,顯存占用更低,在業務部署上線上的具有非常大的優勢,為用戶的AI應用落地提供高效支持 。但是靜態圖組網和執行階段是分開,對于新用戶理解起來不太友好 。
二、應用效果最佳的官方模型 – 覆蓋三大主流任務
基于百度多年的產業應用經驗,以及百度生態伙伴的人工智能解決方案實踐,飛槳為用戶提供70 精選經過真實業務場景驗證的、應用效果最佳的官方算法模型,涵蓋視覺、NLP、語音和推薦等AI核心技術領域 。
飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

文章插圖
飛槳自然語言處理模型庫PaddleNLP:基于飛槳打造的工業級中文NLP開源工具集,擁有當前業內效果最好的中語義表示模型和基于百億級大數據訓練的預訓練模型,并將自然語言處理領域的多種模型用一套共享骨架代碼實現,可大大減少用戶在開發過程中的重復工作 。
用戶在極大地減少研究和開發成本的同時,也可以獲得更好的基于工業實踐的應用效果 。本次發布PaddleNLP-Research,支持NLP前沿研究,現已開源MRQA2019閱讀理解競賽Paddle Fluid基線、 DuConv (ACL2019)、ARNOR(ACL2019)、MMPMS(IJCAI2019)、MPM(NAACL2019) 等近期百度在 NLP 學術領域的工作 。
飛槳視覺模型庫PaddleCV:基于飛槳打造的業界效果最好的CV開源工具集,并開源多個百度自研、國際賽事奪冠方案模型 。物體檢測統一框架、圖像分類庫、圖像生成庫、視頻識別庫多個基礎任務庫中,既具備高精度模型、也具備高速推理模型 ?;谝讛U展、易模塊化的操作,用戶可以高效完成各類視覺任務的工業應用 。
PaddleDetection物體檢測統一框架,覆蓋主流的檢測算法,即具備高精度模型、也具備高速推理模型,包含Faster-RCNN (支持FPN), Mask-RCNN (支持FPN), Cascade-RCNN, RetinaNet, Yolo v3, SSD算法并提供一系列的預訓練模型,具有工業化、模塊化、高性能的優勢 。結合飛槳核心框架的高速推理引擎,訓練到部署無縫銜接;提供模塊化設計,模型網絡結構和數據數據處理均可定制;基于高效的核心框架,訓練速度和顯存占用上有一定的優勢,例如,YOLO v3訓練速度相比同類框架快1.6倍 。此外,本次除了統一檢測框架,還發布一系列預訓練模型,例如基于改進版的ResNet的檢測模型,不增加計算量的情況下,精度普遍提高約1%左右 。圖像分類庫本次新增9個圖像分類模型,截至目前,覆蓋10種、超過25個ImageNet預訓練模型,其中ResNet模型持續改進,發布計算量相當的改進模型,例如ResNet50 Top1準確率從76.5%提升到79.84%( 3.34%) 。PaddleGAN為用戶提供易上手的、一鍵式可運行的GAN模型,覆蓋主流GAN算法,包括CGAN、DCGAN、Pix2Pix,CycleGAN,StarGAN,STGAN,ATTGAN,其中STGAN是百度自研的人臉屬性編輯編輯模型,發表于CVPR 2019 。PaddleVideo業界首個視頻識別與定位工具集繼4月份發布, 本次持續優化訓練速度,部分模型速度優于同類產品的30%;本次新增加C-TCN,百度自研的視頻動作定位模型,也是2018年ActivityNet奪冠方案,在飛槳上首次開源 ?;陬A訓練模型,用戶可以更便捷地完成自己的AI應用,飛槳為用戶提供預訓練模型管理和遷移學習組件PaddleHub,可一鍵加載工業級預訓練模型 。本次新增發布29個預訓練模型,共為用戶提供40 預訓練模型,覆蓋文本、圖像、視頻三大領域八類模型 。
PaddleHub提供Fine-tune API,10行代碼即可完成大規模預訓練模型的遷移學習 。PaddleHub還引入「模型即軟件」的理念,通過Python API或者命令行工具,一行代碼完成預訓練模型的預測 。
飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

文章插圖
三、大規模分布式訓練 - 業界最強的超大規模并行深度學習能力
飛槳同時支持稠密參數和稀疏參數場景的超大規模深度學習并行訓練,支持千億規模參數、數百個節點的高效并行訓練,也是最早提供如此強大的深度學習并行技術的深度學習平臺 。
飛槳提供高性價比的多機CPU參數服務器解決方案,基于真實的推薦場景的數據驗證,可有效地解決超大規模推薦系統、超大規模數據、自膨脹的海量特征及高頻率模型迭代的問題,實現高吞吐量和高加速比 。
基于Paddle Fluid v1.5,分布式訓練新發布High-level API Fleet,單機轉分布式訓練成本顯著降低;GPU多機多卡性能顯著提升,在ResNet50、BERT、ERNIE等模型中4x8 v100配置下相比此前發布的Benchmark提速超過50% 。
飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

文章插圖
四、端到端部署 - 推理引擎一體化設計,訓練到多端推理的無縫對接移動端加速
基于Paddle Fluid v1.5,飛槳完整支持多框架、多平臺、多操作系統,為用戶提供高兼容性、高性能的多端部署能力、全面領先的底層加速庫和推理引擎Paddle Mobile 和Paddle Serving 。
對于開發者來說,除了模型的訓練,在產品化過程中還會遇到各種各樣的工程化問題 。隨著移動設備被廣泛使用,在移動互聯網產品應用深度學習和神經網絡技術已經成為必然趨勢 。例如在移動端部署,就需要面臨很多的問題,例如安裝包大小、運行內存占用大小、推理速度和效果等 。當前主流的模型很難直接部署到移動設備中 。
在4月份的發布中,PaddleSlim 實現了目前主流的網絡量化、剪枝、蒸餾三種壓縮策略,并可快速配置多種壓縮策略組合使用 。針對體積已經很小的 MobileNet 模型,在模型效果不損失的前提下實現 70% 以上的體積壓縮 。
本次版本PaddleSlim更是進一步升級,新增基于模擬退火的自動剪枝策略和輕量級模型結構自動搜索功能Light-NAS,對比MobileNet v2在ImageNet 1000類分類任務上精度無損情況下FLOPS 減少17%,并在百度的OCR識別、人體檢測、人臉關鍵點檢測等業務線應用,精度無損甚至提高的情況下,速度帶來了30%~40%的提升 。
飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

文章插圖
五、服務支持 – 唯一提供系統化深度學習技術服務的平臺
飛槳已經實現了API的穩定和向后兼容,為用戶提供從入門教程到安裝編譯文檔、使用手冊、模型文檔、API接口及索引文檔在內的完善的中英雙語使用文檔 。同時,提供系統的服務體系為企業合作伙伴護航,幫助高校和教育伙伴構建完善體系,為開發者提供不同層次的培養體系 。
飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

文章插圖

飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

文章插圖

飛槳PaddlePaddle最新升級5大優勢 paddle框架入門

文章插圖
以上為大家介紹了飛槳的五大優勢,想要了解更多或者下載最新版本Paddle Fluid v1.5,請點擊以下鏈接:
http://www.paddlepaddle.org.cn?fr=lzw
— 完 —
誠摯招聘
量子位正在招募編輯/采訪人員,工作地點在北京中關村 。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字 。
量子位 QbitAI · 頭條號簽約作者
?'?' ? 追蹤AI技術和產品新動態
,