【阿里的瀏覽器叫什么 阿里旗下的瀏覽器叫什么名字】
文章插圖

文章插圖
夸克瀏覽器是阿里旗下的一個搭載極速AI引擎的高速智能瀏覽器 ??淇鸵詷O速智能搜索為定位,致力于為用戶提供交互更智能高效、內容更專業權威的新一代搜索引擎,同時也在產品極致體驗上不斷實現突破 。
夸克目前不僅提供極致的搜索體驗,也在探索以深度學習為基礎的AI工具,通過高效的算法效果和全流程的性能優化,提供更好的用戶體驗 。深度學習模型在實際應用的過程中,效果遠好于傳統模型,但由于算法復雜度過高,預測性能成為制約模型最終能否上線的核心問題 。NVIDIA TensorRT通過計算圖的優化、高效Kernel的實現及更高效硬件的利用加速模型預測耗時,使預測速度提升了1~3倍 。
智能相機功能對ORC實時性提出新要求
夸克瀏覽器為用戶提供智能相機功能,打開夸克APP后,通過相機入口(如下左圖紅框所示)進入智能相機功能,可以看到智能相機提供的具體功能(如下右圖所示),包括萬能掃描、學習輔導、萬物識別等功能,這些功能對實時性要求極高,不少功能的底層核心技術依賴OCR 。作為核心一環,OCR需要承接巨大流量,其效果及性能影響整個上層業務的用戶體驗 。
NVIDIA TensorRT助力模型性能提升
對比目前性能優化方案,夸克選擇了采用NVIDIA TensorRT作為模型優化的底層框架對模型進行優化 。TensorRT提供完整端到端模型性能優化工具,支持TF和ONNX等相關框架模型,使用后對模型性能帶來巨大提升 。
1、TensorRT對模型結構進行優化,使用高效Kernel實現,并且支持FP16和INT8量化 。部分模型通過使用TensorRT,模型性能達到2-3倍的提升,并且顯存降到原來的30%~50% 。
2、有模型在使用FP16精度后,模型效果下降,夸克團隊在NVIDIA工作人員的指導下,通過對模型設置混合精度,模型的性能較FP16略微下降,但整體效果能夠達到要求 。
3、對于部分轉TensorRT失敗的模型,對模型進行分析,單獨抽取模型耗時的部分進行模型優化 。
4、在使用TensorRT的過程中,通過Nsight Systems發現TensorRT OP在某些場景性能表現不盡人意,在NVIDIA工作人員指導下,通過調整OP的使用方式解決該問題 。
TensorRT助力OCR全流程性能優化
通過使用NVIDIA TensorRT,夸克瀏覽器極大地提升了模型性能和降低模型本身顯存占用,提高了GPU的使用率 。在對整體流程和模型進行優化后,全部模型能夠部署在單個GPU上,并且整體耗時在400ms內 。
夸克技術人員表示:TensorRT文檔齊全,功能使用方便,用戶能夠以低門檻使用其帶來的優化,無需手動編寫復雜模型轉換工具,大大地減少了用戶投入成本 。對比其他模型優化框架,TensorRT具有更好的通用性、易用性和性能 。
通過這次對OCR全流程的性能優化,夸克瀏覽器也積累了一套適合內部使用的模型性能優化方案,在遇到其他模型性能問題時也有的放矢 。目前夸克已經把TensorRT相關優化工具集成到其瀏覽器的內部平臺上,同時應用到其他業務的模型中,并取得良好的效果 。
- excel兩列合并保留內容在原有的列表里 excel倆列內容合并
- 喝酒能吃柚子嗎
- 咳嗽蒸梨的做法
- 孕婦能吃壽司么
- 豬腦髓的功效與作用
- 興平特色美食
- 黃岡好吃的特色美食
- 小蘇打的學名叫什么,小蘇打、食用堿、泡打粉,哪種可以讓油炸食物酥脆?
- 網絡模擬器有哪些 模擬網絡設備的軟件
- 我的世界海洋神殿的種子是哪個? 我的世界海底神殿種子大全
