
文章插圖
數據預處理的四種方式是:
1、數據清理,數據清理例程通過填寫缺失的值、光滑噪聲數據、識別或刪除離群點并解決不一致性來“清理”數據 。主要是達到如下目標:格式標準化,異常數據清除,錯誤糾正,重復數據的清除 。
2、數據集成,數據集成例程將多個數據源中的數據結合起來并統一存儲,建立數據倉庫的過程實際上就是數據集成 。
3、數據變換 。通過平滑聚集,數據概化,規范化等方式將數據轉換成適用于數據挖掘的形式 。
4、數據歸約 。數據挖掘時往往數據量非常大,在少量數據上進行挖掘分析需要很長的時間,數據歸約技術可以用來得到數據集的歸約表示,它小得多,但仍然接近于保持原數據的完整性,并結果與歸約前結果相同或幾乎相同 。
【數據預處理的形式 數據預處理的四種方式】數據預處理(data preprocessing)是指在主要的處理以前對數據進行的一些處理 。主要是清理異常值、糾正錯誤數據現實世界中數據大體上都是不完整,不一致的臟數據,無法直接進行數據挖掘,或挖掘結果差強人意 。為了提高數據挖掘的質量產生了數據預處理技術 。
- 關于替嫁的新娘簡述 替嫁的新娘
- 冷藏的酸奶常溫會壞嗎 在冰箱冷藏過的酸奶在常溫后會變質嗎
- ps載入選區快捷鍵 ps載入選區的三種方法及快捷鍵
- 晚上熬的雞湯第二天可以喝嗎寶寶 晚上熬的雞湯第二天可以喝嗎
- 全民k歌送出的鮮花還能取消嗎
- 五竹的黑布后面是什么 五竹摘掉黑布
- 礦物質鋅對人體的作用 鋅對人體的作用
- 中秋的習俗
- 金彈子的栽培方法
- 貓頭鷹的生活習慣是什么
