數據的預處理包括哪些內容 數據的預處理包括哪些


數據的預處理包括哪些內容 數據的預處理包括哪些

文章插圖
數據預處理(datapreprocessing)即是指在主要的處理以前對數據進行的一些處理 。如對大部分地球物理面積性觀測數據在進行轉換或增強處理之前,首先將不規則分布的測網經過插值轉換為規則網的處理,以利于計算機的運算 。另外,對于一些剖面測量數據,如地震資料預處理有垂直疊加、重排、加道頭、編輯、重新取樣、多路編輯等 。常見的數據預處理技術有:
1、數據清理 。數據清理例程通過填寫缺失的值、光滑噪聲數據、識別或刪除離群點并解決不一致性來“清理”數據 。主要是達到如下目標:格式標準化、異常數據清除、錯誤糾正、重復數據的清除等 。
2、數據集成 。數據集成例程將多個數據源中的數據結合起來并統一存儲,建立數據倉庫的過程實際上就是數據集成 。
3、數據變換 。通過平滑聚集,數據概化,規范化等方式將數據轉換成適用于數據挖掘的形式 。
【數據的預處理包括哪些內容 數據的預處理包括哪些】