數據脫敏是什么 脫敏數據如何匹配


什么是數據脫敏處理???
數據脫敏處理是指敏感數據發現:按照用戶指定或預定義的敏感數據特征 , 對數據庫進行識別 , 自動發現敏感數據 。
數據抽取:建立數據子集 , 并根據數據子集的范圍抽取數據 。抽取的數據中可進行關聯數據的自動識別和數據抽取 。
數據脫敏:對抽取的數據按照用戶指定或預定義的脫敏算法策略 , 對數據進行屏蔽、變形、替換、隨機等數據脫敏處理 。
數據加載:將脫敏完成后的數據根據用戶指定的目標數據庫或目標文件進行數據加載 。安華金和數據脫敏產品入選到國有大型銀行的供應商 , 國內應該最多2家入圍了 。
數據脫敏是什么?【數據脫敏是什么 脫敏數據如何匹配】
數據脫敏是指對某些敏感信息通過脫敏規則進行數據的變形 , 實現敏感隱私數據的可靠保護 。在涉及客戶安全數據或者一些商業性敏感數據的情況下 , 在不違反系統規則條件下 , 對真實數據進行改造并提供測試使用 , 如身份證號、手機號、卡號、客戶號等個人信息都需要進行數據脫敏 。數據安全技術之一 , 數據庫安全技術主要包括:數據庫漏掃、數據庫加密、數據庫防火墻、數據脫敏、數據庫安全審計系統 。數據庫安全風險包括:拖庫、刷庫、撞庫 。
1、靜態脫敏與動態脫敏使用場景和用途的區別
靜態脫敏適用于將數據抽取出生產環境脫敏后分發至測試、開發、培訓、數據分析等場景 。
原理是將數據抽取進行脫敏處理后 , 下發至脫敏庫 。開發、測試、培訓、分析人員可以隨意取用脫敏數據 , 并進行讀寫操作 , 脫敏后的數據與生產環境隔離 , 滿足業務需要的同時保障生產數據的安全 , 靜態脫敏可以概括為數據的“搬移并仿真替換” 。
動態脫敏適用于不脫離生產環境 , 對敏感數據的查詢和調用結果進行實時脫敏 。
原理是將生產庫返回的數據進行實時脫敏處理 , 例如應用需要呈現部分數據 , 但是又不希望應用賬號可以看到全部數據;運維人員需要維護數據 , 但又不希望運維人員可以檢索或導出真實數據 , 動態脫敏可以概括為“邊脫敏 , 邊使用” 。
2、靜態脫敏與動態脫敏的技術路線的區別
靜態脫敏直接通過屏蔽、變形、替換、隨機、格式保留加密(FPE)和強加密算法(如AES)等多種脫敏算法 , 針對不同數據類型進行數據掩碼擾亂 , 并可將脫敏后的數據按用戶需求 , 裝載至不同環境中 。靜態脫敏可提供文件至文件 , 文件至數據庫 , 數據庫至數據庫 , 數據庫至文件等不同裝載方式 。導出的數據是以脫敏后的形式存儲于外部存貯介質中 , 實際上已經改變了存儲的數據內容 。
動態脫敏通過準確的解析SQL語句匹配脫敏條件 , 例如:訪問IP、MAC、數據庫用戶、客戶端工具、操作系統用戶、主機名、時間、影響行數等 , 在匹配成功后改寫查詢SQL或者攔截防護返回脫敏后的數據到應用端 , 從而實現敏感數據的脫敏 。實際上存儲于生產庫的數據未發生任何變化 。
3、靜態脫敏與動態脫敏的部署方式的區別
靜態脫敏可將脫敏設備部署于生產環境與測試、開發、共享環境之間 , 通過脫敏服務器實現靜態數據抽取、脫敏、裝載 。
動態脫敏采用代理部署方式:物理旁路 , 邏輯串聯 。應用或者運維人員對數據庫的訪問必須都經過動態脫敏設備才能根據系統的規則對數據訪問結果進行脫敏 。
數據脫敏的處理方法
背景:
需要在非生產環境下對敏感信息進行數據脫敏 , 實現敏感隱私數據的可靠保護 。
脫敏數據特征:
1.保持原有數據特征:例如身份證由17位數字本體碼和1位檢驗碼組成 。
2.保持數據之間一致性:出生年月和出生日期之間的關系 。
3.保持業務規則的關聯性 。
4.多次脫敏之間的數據一致性 。
脫敏的方法:
1.數據替換
要求:用設置的固定虛構值替換真值 。例如將手機號碼統一替換為 13800013800
2.無效化
要求:通過對數據值得截斷、加密、隱藏等方式使敏感數據脫敏 , 使其不再具有利用價值 , 例如將地址以 ****** 代替真值 。數據無效化與數據替換所達成的效果基本類似 。
3.隨機化
要求:用隨機數據代替真值 , 保持替換值的隨機性以模擬樣本的真實性 。例如用隨機生成的姓和名代替真值 。
【注意】這個例子中我們針對數據脫敏引入了外部字典表 , 實際情況中可以根據數據脫敏要求 , 隨時引入任意外部字典表 , 通過數據的隨機化組合 , 實現替換真值數據的脫敏處理 。
4.偏移和取整
要求:通過隨機移位改變數字數據 , 例如日期 2018-01-02 8:12:25 變為 2018-01-02 8:00:00 , 偏移取整在保持了數據的安全性的同時保證了范圍的大致真實性 , 此項功能在大數據利用環境中具有重大價值 。
5.掩碼屏蔽
要求:掩碼屏蔽是針對賬戶類數據的部分信息進行脫敏時的有力工具 , 比如銀行卡號或是身份證號的脫敏 。將身份證號的出生日期進行掩碼屏蔽脫敏 。使用left()函數截取身份證號的左邊 6 位 + 字符串 ********+right()函數截取身份證號右邊 4 位替換源身份證字符串 。
6.靈活編碼
要求:在需要特殊脫敏規則時 , 可執行靈活編碼以滿足各種可能的脫敏規則 。比如用固定字母和固定位數的數字替代合同編號真值 。將合同編號進行自定義編碼脫敏 。自定義編碼規則:4 位固定碼 + 當前年份 + 源目標字符串 4 位號碼 +9 位數值組成 。
脫敏相關文章參考:https://www.jianshu.com/p/43d9882ed24a
數據脫敏是什么?
數據脫敏就是對敏感數據進行變形處理 , 其目的是保護隱私數據等信息的安全 , 例如機構和企業收集的個人身份信息、手機號碼、銀行卡信息等敏感數據 。數據脫敏從技術上可以分為靜態數據脫敏和動態數據脫敏兩種 。靜態數據脫敏一般應用于數據外發場景 , 例如需要將生產數據導出發送給開發人員、測試人員、分析人員等;動態脫敏一般應用于直接連接生產數據的場景 , 例如運維人員在運維的工作中直接連接生產數據庫進行運維 , 客服人員通過應用直接調取生產中的個人信息等 。可以找安華金和聊一下 , 他家數據脫敏技術已經很成熟了 。再不明白自己去百度下 。
關于脫敏數據和脫敏數據如何匹配的內容就分享到這兒!更多實用知識經驗 , 盡在 m.apearl.cn