文章插圖

文章插圖
導言
大多數與圖像識別相關的分類問題都存在著眾所周知的/既定的問題 。例如,通常情況下,沒有足夠的數據來對分類系統進行適當的訓練,這些數據涵蓋的類可能會有所不足,而且最常見的情況是,使用未經仔細檢查的數據將意味著我們對數據的標簽缺乏合理的分類 。
深度學習依靠大量高質量的數據來預測未來的趨勢和行為模式 。并且數據集需要代表我們打算預測的類,否則,系統會”曲解”不同類的分布,讓你的模型產生偏差 。
這些問題通常有一個共同的原因:即查找、提取和存儲大量數據的能力不夠強大,以及在第二層上對數據的清除、管理和處理能力不足 。
雖然我們可以提高計算能力和數據存儲能力,但這種情況只有當這是一個復雜的、大的卷積神經網絡針對一個大的數據集運行時才會考慮,只有一臺機器是不可能的 。因為它可能沒有足夠的空間/內存,而且很可能沒有足夠的計算能力來運行分類系統 。它還需要通過云資源”訪問”并行或分布式計算,了解如何運行、組織和設置復雜的集群 。
然而,擁有足夠的數據和處理能力并不足以防止這些問題的發生 。
在這篇文章中,我們將探索和討論一些不同的技術,這些技術可以解決在處理小數據集時出現的問題,如緩解分類的不平衡,以及如何防止過度擬合 。
遷移學習
“數據可能是新的煤炭”,引用自NeilLawrence的話 。我們知道深度學習算法需要通過大量的標記數據從零開始訓練一個成熟的網絡,但是我們常常無法完全理解大量這個詞意味著多少數據 。簡單來說,僅僅是找到滿足你訓練需求的數據量可能都會給你帶來挫折感,但是有一些技術,例如數據增強或遷移學習,將為你的模型節省大量的精力和時間 。
遷移學習是一種流行的、非常強大的方法,簡而言之,它可以概括為是把已訓練好的模型參數遷移到新的模型來幫助新模型訓練 。這意味著利用現有的模型并改變它以適應你自己的目標 。這種方法包括”切斷”前訓練模型的最后幾個層,并使用你的數據集對它們進行再訓練 。這樣做有以下優點:
它在較老的模型上建立了一個新的模型,并對圖像分類任務進行了驗證 。例如,一個建立在CNN體系架構上的模型(比如由Google開發的CNN模型Inception-v3),然后經過ImageNet的預訓練;
它減少了訓練時間,因為它允許重復使用參數以實現可能需要數周才能達到的性能 。
不平衡數據
通常,數據集中的一組標簽相對于其他數據集中的標簽的比例可能是不平衡的,而這個時候,所占比例較低標的標簽組往往是我們感興趣的一組,因為它相對稀有 。例如,假設我們有一個二進制分類問題,X類代表95%的數據,Y類代表其他5%的數據 。因此,該模型對X類更”敏感”,對Y類不太”敏感” 。當分類器的準確率達到95%時,我們只能說對X類的預測基本都是正確的 。
顯然,這里的準確性不是一個適當的”評分” 。在這種情況下,我們更應該考慮的是預測錯誤的代價、預測精確度和查全率 。一個合理的起點是對不同類型錯誤的二維表示,換句話說,是一個混淆矩陣 。在本文中,可以將其描述為說明實際標簽與預測標簽的方法,如下圖所示 。
通過給每個標簽分配不同的系數;
通過對原始數據集進行重新采樣,或者對少數類進行過采樣或對多數類進行過采樣 。也就是說,由于分類邊界的更”嚴格”,數據集太小容易帶來誤差,讓過采樣更容易導致過度擬合 。
通過應用SMOTE方法(對少數過采樣進行合成的技術)來解決頻繁對分類數據進行復制的問題 。該方法在數據增強的背后應用了相同的思想,并通過在少數類的相鄰實例之間插值來創建新的合成樣本 。
過度擬合
正如我們所知,我們的模型通過反向傳播和最小化成本函數來學習/概括數據集中的關鍵特性 。每一個來回的步驟都被稱為一個輪次,并且隨著每一個輪次的調整進行模型的訓練和權值的更改,以最小化錯誤的代價 。為了測試模型的準確性,一個常見的規則是將數據集分為訓練集和驗證集 。
訓練集用于調整和創建模型,讓模型更加符合訓練前的目的 。驗證集測試基于不可見樣本模型的有效性 。
選擇網絡的大小和復雜程度將是過度擬合的決定性原因 。復雜的體系結構可能更容易過度擬合,但是,有一些策略可以防止過度擬合:
增加訓練集上的樣本數量;如果對網絡進行更多實際案例的訓練,它將具有更好的普遍性;
當過擬合發生時,停止反向傳播是另一種選擇,這樣可以保證成本函數和驗證集的準確性;
采用正則化的方法是另一個流行的選擇 。
L2正則化
L2正則化是一種通過向較大的個體權重進行分配約束來降低模型復雜度的方法 。通過設置懲罰約束,減少模型對訓練數據的依賴 。
Dropout
對于正則化來說,Dropout也是一種常見的選擇,它被用于較高層的隱藏單元上,然后我們為每個輪次建立了不同的架構 。基本上,該系統隨機選擇要在訓練中去除的神經元,通過不斷地重新調整權重,網絡被迫從數據中學習更普遍的模式 。
結語
【圖片識別軟件哪個好 圖像識別用什么軟件開發】正如我們所看到的,有各種不同的方法和技術來解決圖像識別中最常見的分類問題,每種方法和技術都有各自的優點和潛在的缺點 。存在的一些問題是數據不平衡,過度擬合,其中最通常的問題是不會有足夠的數據可用,但是,正如我們已經解釋過的,它們可以通過遷移學習、抽樣方法和正則化技術來解決 。
- 網頁背景圖片怎么設置 網頁設計怎么設置背景圖片
- 分布式應用是什么意思 分布式軟件開發是什么
- 金蝶k3安裝步驟 金蝶k3軟件安裝操作流程
- 人臉識別閘機功能 人臉識別閘機解決方案
- 有人拍到奧特曼真實圖 有人拍到了真奧特曼圖片
- pdf轉換word軟件 pdf格式轉換器word免費
- OPPO主題制作軟件安卓 oppo手機主題制作軟件下載
- 移動協同辦公系統下載 好用的協同辦公軟件
- 識別圖片文字小程序 微信小程序看圖識字
- 用手機ps怎么把模糊的照片變清晰 手機圖片有點模糊怎么用ps處理清晰
