撰寫數據分析報告6個步驟 數據分析怎么寫?


如何撰寫一份優秀的數據分析報告?1、分析框架=剝洋蔥+拆分

作為一個分析師 , 報告是重要的輸出 , 就好比我們是產品經理的話 , 那這份分析報告就是你的產品 , 所以無論是從廣度和深度來講 , 你都要體現出你的思維來 , 這樣廣深結合 , 才能贏得別人認可和信任 。

2、每頁核心指標展示的邏輯——公式思維

當我們做好數據分析后 , 如何在一頁PPT展示自己的分析變的更加重要 , 許多分析師在這塊不知所措 , 有時候是用戶趨勢圖 , 有時候又是行業規模圖 , 其實背后的分析邏輯可能很清晰 , 但你所展示的方式和布局老讓別人覺得還是思路混亂 。

一頁PPT要描述一個核心 , 而這個核心驗證的數據分析過程 , 最好的方式就是公式思維 , 這樣你呈現出來的指標才能和此頁的主題相呼相應 , 即使有人現場挑戰你 , 你也會對答如流 。

3、指標對比的合理性——業務思維

常看到一些報告 , 無論什么產品、什么業務 , 都是幾大指標 , 注冊用戶數、活躍用戶數、首次購、重復購 , 復購率、客單價等等 , 可笑的不是指標本身 , 而是拿業務不同的2個指標來對比 , 說自己多優秀!

關于如何撰寫一份優秀的數據分析報告的內容 , 青藤小編就和您分享到這里了 。如果您對大數據工程有濃厚的興趣 , 希望這篇文章可以為您提供幫助 。如果您還想了解更多關于數據分析師、大數據工程師的技巧及素材等內容 , 可以點擊本站的其他文章進行學習 。
數據分析報告怎么寫?這5個步驟你必須知道到年底 , 寫一份好的數據分析報告的重要性不言而喻(只要我寫的好 , 年終獎就少不了我)
大家都知道 , 數據分析報告的輸出是整個業務分析過程的成果 , 是評定一條業務線的參考依據 , 既然這么重要那當然要寫好它了 。
接下來我就分享我寫數據分析報告的5個步驟 , 供大家學習參考 。
一、明確分析目的
還是那句老話 , 在做任何事情之前 , 先想清楚做這件事的目的是什么 。寫數據分析報告也是 , 如果一開始就沒有明確清楚目的 , 盲目開始分析 , 最后的結果很可能就是 , 分析了半天卻離目標越來越遠 。所以搞明白研究這個事情的目的 , 是開始數據分析的第一步 。
二、拆解指標發現問題
在明確清楚我們的分析目的后 , 就要針對我們的分析目標進行指標拆解 , 通過拆解指標去發現問題 。這么說有點虛 , 舉個例子說明一下 。
背景:某制造業公司到年底 , 需要進行銷售線的業務復盤 , 因此需要檢查各銷售線人員的年度目標完成進度 , 并給出建議 。同時 , 通過統計發現 , 今年公司的毛利率有所下降 , 需要數據分析師通過數據去找到影響毛利率下降的原因 。
拆解流程:
①明確分析目標 ②確定問題 ③拆解問題 ④拆解指標&拓展緯度布局
第一步:明確分析目標
通過背景我們可以清楚知道 , 我們有兩個目標需要去完成 , 這里我用導圖的形式羅列出來
第二步:確定問題
在明確分析目標后 , 就需要確定為了達成該目標 , 提出圍繞該目標需要解決的問題 。可以使用思維腦圖 , 寫出在看到該目標后產生的問題 。
第三步:拆解問題
在確定問題后 , 就需要找到能夠數值化衡量這些問題的指標 , 以及它們的計算方式 。
第四步:拓展維度
計算方式確定 , 就可通過分析組成這些計算公式的指標來探究影響其的原因 , 比如銷售額=單價*數量 , 那么就可從單價、數量來分析銷售額變動 , 以一個指標為定量 , 分析對比其他指標變化 。
同時以計算公式結果為指標 , 拓展維度(比如地區、時間、品類等等)來探究不同維度下的指標差異 。
三、 給出結論
同樣的我們給出的結論需要和分析目的緊密相連 , 比如:
目的是了解業務的現狀 , 那結論可以是:該業務有問題x關鍵指標 , 每個指標的數值是xxx , 有什么樣的異常;
目的是了解數據到什么情況算好 , 那結論可以是:某指標可以以 xxx 作為判斷標準 , 原因是......;
目的是找出業務出現異常的原因 , 那結論可以是:經分析 , 有x各種原因 , 其中重點原因是...... ;
需要注意的是 , 如果是判斷業務的狀況 , 需要確定一個判斷標準:結論=數據+判斷標準
在對數據進行拆解分析的過程中 , 我們已經可以察覺到一些數據異常 。但是這些 異常到底是好是壞 , 我們需要通過一個標準來確定 。
比如說十月份銷量數據下滑 , 我們可以增加比對去年的數據 。如果去年也下滑了 , 說明是正常的月度下滑 。如果去年沒有下滑 , 那么說明今年下滑是個不正常現象 , 需要復盤解決 。
四、結合業務 , 給出建議和方案
如果數據不能驅動業務成長 , 那它毫無用處 。
下了結論以后 , 再結合對業務的理解 , 就可以就分析結果提出建議 , 甚至給出方案:
建議是:能解決業務問題的行動方向 , 是若干個潛在可行的范疇 。
方案是:制定一個具體行動計劃 , 方案要滿足 5w2h  , 要有具體的執行人、完成時間等等要素 。
五、撰寫分析報告
以上準備工作完成 , 如何撰寫一份分析報告增加它的可讀性呢?
架構清晰:參考經典的金字塔結構 , 結論先行 , 以上 , 先重要后次要 。以上統下的順序也符合數據分析過程中拆解指標的順序 , 更容易幫助讀者理解你的分析思路;
報告圖表化:用圖表代替大量堆砌的數字會有助于人們更形象更直觀地看清楚問題和結論 , 更容易做到有理有據;
FineBI制作
規范化:整篇文檔的圖表風格統一、名詞統一;
撰寫數據分析報告6個步驟 撰寫數據分析報告6個步驟
撰寫數據分析報告6個步驟 。在職場上 , 有的崗位是需要撰寫數據分析報告的 , 想要寫好數據分析報告就要知道寫它的步驟 。接下來就由我帶大家了解下撰寫數據分析報告6個步驟的相關內容 。
撰寫數據分析報告6個步驟1
1、明確目標
在「 明確數據分析目標的 3 個步驟 」這篇文章中 , 我們說過 , 要正確地定義問題、合理地分解問題、抓住關鍵的問題 。
當明確目標之后 , 我們需要梳理分析思路 , 搭建分析框架 , 開始思考以下問題:
采用哪些分析指標?
運用哪些分析思維?
使用哪些分析工具?
明確目標 , 是確保數據分析過程有效進行的先決條件 , 可以為后續的步驟提供清晰的方向 。
2、收集數據
收集數據是圍繞數據分析目標 , 按照分析思路和框架 , 收集相關數據的過程 , 為后續的步驟提供素材和依據 。
收集的數據包括原始數據和二手數據 , 其中原始數據包括公司內部的數據庫、調查得到的數據等;二手數據包括統計局發布的數據、公開出版物中的數據等 。
收集數據的基本要求是:真實性、及時性、同質性、完整性、經濟性和針對性 。
3、處理數據
處理數據 , 是從大量雜亂無章的原始數據中 , 抽取對解決問題有價值的數據 , 并進行加工整理 , 形成適合數據分析的樣式 , 保證數據的一致性和有效性 , 這是數據分析之前必不可少的階段 。
數據的處理主要包括數據清洗、數據轉化、數據抽取、數據合并、數據計算等過程 , 原始數據一般都需要經過一定的處理 , 才能用于后續的數據分析工作 。
在處理數據的過程中 , 準確性尤為重要 , 如果數據本身存在錯誤 , 那么即使采用最先進的數據分析方法 , 得到的結果也是錯誤的 , 不具備任何參考價值 , 甚至還會誤導決策 。
具體處理數據的方法 , 可以參考以下文章:
4、分析數據
分析數據 , 是對客觀真實的數據 , 運用恰當的方法和工具 , 進行科學有效的分析 。
參考文章:
如何用 Python 分析數據?
5、展現數據
通過數據分析 , 隱藏在數據背后有價值的信息逐漸浮現出現 , 此時需要通過合適的方式展現出來 , 讓人一目了然 , 提高信息傳遞的效率 。
通常情況下 , 展現數據的方式通常是用圖表說話 , 即數據可視化 , 常用的數據可視化圖表有很多 , 可以參考:
數據可視化話題集錦
6、結論建議
一份好的數據分析報告 , 需要有明確的結論建議 。
如果換位思考 , 站在決策者的角度 , 更想知道的是可行的解決方案 。
如果數據分析報告沒有明確的結論建議 , 那么也就失去了報告的靈魂 。
所以 , 要想制作出更有價值的數據分析報告 , 不僅要掌握數據分析的思維和工具 , 而且還要熟悉業務 , 這樣才能提出更好的建議 。
小結
數據分析報告的制作過程 , 通常可以分解為明確目標、收集數據、處理數據、分析數據、展現數據、結論建議等 6 個步驟 , 這是對整個數據分析過程的總結 , 為決策者提供科學、嚴謹的決策依據 , 從而降低企業的經營風險 , 提高企業的核心競爭力 。
如果把數據分析報告比作一個產品 , 制作報告的人就是產品經理 , 看報告的讀者就是用戶 。
作為「產品經理」 , 同理心很重要 , 通過自我體驗來理解他人 , 喬布斯能瞬間把自己變成傻瓜 , 這是同理心的一種表現 。數據分析的思維和工具也很重要 , 它們是數據分析的基礎 。想象力是廣袤的天空 , 但不是天馬行空 , 而是基于同理心的推演 , 運用數據分析的思維和工具 , 讓推演更加科學有效 。
在一份數據分析報告的背后 , 有許多枯燥的、基礎的準備工作要做 , 例如數據采集、數據倉庫、數據治理等等 。
如果沒有高質量的數據作為堅實的地基 , 那么數據分析報告的高樓大廈是不穩固的 。如果沒有明確數據分析的目標 , 那么后面的工作可能就是胡拼亂湊 , 用一堆圖表堆砌的花架子 , 并不能解決實際的問題 。
數據分析報告不要搞形式主義 , 而要有實質的內容 , 還要關注細節 。
撰寫數據分析報告6個步驟2
數據分析報告范文
項目數據分析報告是通過對項目數據全方位的科學分析來評估項目的可行性 , 為投資方決策項目提供科學、嚴謹的依據 , 降低項目投資的風險 。
項目數據分析報告—項目市場化操作的科學依據:
政策背景:隨著我國經濟體制變革的不斷深入發展 , 中國的決策高層已經完全意識到了項目分析的真正意義 , 這一佐證就是《國務院關于投資體制改革的決定》的出臺 。決定明確政府不再承擔對投資項目的審核評估 , 實行備案制 。而投資方和項目方 , 則對項目的風險承擔完全責任 , 完全按照市場經濟的模式來實施項目分析評估 。這就正式宣告 , 中國的項目分析 , 將徹底進入市場化的運作模式 。
時代需求:進入二十一世紀信息化時代 , 傳統意義上的經濟、管理和投資金融等學科和電子信息技術發生了不可分割的交融 。作為先進生產力代表的電子信息技術 , 成為經濟、管理和投資金融等領域創新變革的支撐和動力 。“項目數據分析”以專業技術的身份出現在經濟、管理和投資金融專業等領域 , 是信息化時代發展的必然結果 。
項目數據分析報告—項目可行性判斷的重要依據
任何欣欣向榮的企業 , 都是建立在所開發的優質項目基礎上的 。但如何才能確定項目的可行和優質呢?發達國家的做法是對項目的最終決策 , 一切以科學定量分析的項目數據為依據 。在中國 , 隨著世界經濟一體化進程的加速和全球投資市場的蓬勃發展 , 加上中國投資分析行業正處于發展的起步階段 , 投資人、企業管理層都迫切需要一個統一的、規范的標準來衡量投資項目的科學性和可行性 , 專業的項目數據分析報告在中國變得炙手可熱 。越來越多的投資人也選擇項目數據分析報告為他們準備投資的項目做出科學、合理的分析 , 以便正確決策項目;越來越多的風險投資機構把項目數據分析報告作為其判斷項目是否可行及是否值得投資的重要依據 。
有關數據分析報告的詳細樣本 , 建議你到一些權威的數據分析機構去找找 。。。
很多的 , 而且有非常多的數據分析模型和分析數據 , 還有案例
我給你介紹一個國內比較專業的數據分析機構
“開元研究” , 希望你去了解一下 。
透析審計領域的數據分析報告
一、目標定位
內容往往服務于目標 , 目標決定內容 , 因而數據分析報告的目標很大程度上決定其內容 , 我們應首先明確其目標定位 。
構建數據分析報告的目標概念在外延上有所側重 , 定位于為處于信息時代的審計服務 。因此 , 它需要統一并且服務于審計這個大目標 , 但也具有自身的特點 。根據《審計法》規定 , 我國國家審計的總目標是監督財政財務收支的真實性、合法性和效益性 。在這個大前提下 , 我們認為構建計算機數據分析報告的總體目標是結合業務審計的具體目標 , 通過數據分析 , 實現價值最大化的審計決策 , 從而支撐制訂的.審計實施方案 。這個總體目標總是可以劃分為具體層次上的目標 。我們認為 , 從屬于其總目標 , 構建數據分析報告的具體目標應可以描述為以下3個方面:
1、進行總體分析 。從審計工作需求出發 , 對被審計對象的財務、業務數據進行總量分析 , 把握全局 , 形成對被審計對象財務、業務狀況的總體印象 。
2、確定審計重點 , 合理配置審計資源 。在對被審計對象總體掌握的基礎上 , 根據被審計對象特點 , 通過具體的趨勢分析、對比分析等手段 , 合理的確定審計的重點 , 協助審計人員作為正確的審計決策 , 調整人力物力等資源達到最佳狀態 。
3、總結經驗 , 建立模型 。通過選取指標 , 針對不同的審計事項建立具體的分析模型 , 將主觀的經驗固化為客觀的分析模型 , 從而指導以后審計實踐中的數據分析 。
以上3個具體目標的聯系是緊密的 , 不是孤立的 , 只有在進行總體分析的基礎上 , 才能進一步的確定審計重點 , 并在對重點內容的分析中得出結果 , 進而實現評價的過程 。如果單單實現其中一個目標 , 最終得出的報告將是不完整的 , 對制訂審計實施方案也沒有可靠的支撐作用 。
二、適用范圍及對象
首先本文所論述的數據 , 是在信息化環境中審計人員開展審計時需處理的電子數據 。為了明確分析對象的范圍 , 我們制定了對于數據的三個限制條件:
①來源于信息系統中 , 包括財務、業務、管理等方面;
②能以數據庫中二維表的形式存儲于計算機中;
③有助于審計分析 。基于這些限制條件 , 數據應包括財務數據、業務數據和補充數據(從被審計單位以外的地方采集與數據分析相關的數據) 。我們可以根據需要分析其中一種或幾種數據 。
其次 , 數據分析報告所記錄的對象是計算機審計中審前調查階段所作的數據分析的過程及結果 。在實際審計工作中 , 數據分析報告應在計算機審計審前調查階段數據分析完成后撰寫 , 為制訂審計實施方案提供參考 。
三、原則
我們認為 , 編制數據分析報告總體上應當遵循以下原則:
1、規范性原則 。
數據分析報告中所使用的名詞術語一定要規范 , 標準統一 , 前后一致 , 基本上要與前人所提出的相一致 , 例如對商業銀行的盈利能力進行分析時采用了“稅收比率”這個已存在的指標 , 就不能自己重命名為“稅收收入比”等其他名稱 。
2、重要性原則 。
數據分析報告一定要體現審計的重點 , 例如在真實性、合法性審計中 , 就應該重點選取真實性、合法性指標 , 構建相關模型 , 從數據上進行分析 。并且反映在分析結果中對同一類問題的描述中 , 也要按照問題的重要性來排序 。
3、謹慎性原則 。
數據分析報告的編制過程一定要謹慎 , 體現在基礎數據須要真實完整 , 分析過程須要科學合理全面 , 分析結果可靠 , 建議內容實事求是 。
4、鼓勵創新原則 。
計算機審計技術是在不斷發展進步的 , 必然有創新的方法或模型從實踐中摸索總結出來 , 數據分析報告要將這些創新的想法記錄下來 , 發揚光大 。
總之 , 一份完整的數據分析報告 , 應當圍繞目標 , 確定范圍 , 遵循一定的前提和原則 , 系統的反映計算機數據分析的全貌 , 從而推動計算機審計事業的進一步發展 。
數據分析報告怎么寫 數據分析報告寫法介紹1、分析報告一般都要寫一段導語,以此來說明這次情況分析的目的、對象、范圍、經過情況、收獲、基本經驗等,這些方面應有側重點,不必面面俱到 。或側重于情況分析的目的、時間、方法、對象、經過的說明,或側重于主觀情況,或側重于收獲、基本經驗,或對領導所關注和情況分析所要迫切解決的問題作重點說明 。如果是幾個部門共同調查分析的 。
2、還可在導語中寫上參加調查分析的單位、人員等 。總之,導語應文字精練,概括性強 。應按情況分析主旨來寫,扣住中心內容,使讀者對調查分析內容獲得總體認識,或提出領導所關注和調查分析所要迫切解決的問題,引人注目,喚起讀者重視 。
3、主體是分析報告的主要部分,一般是寫調查分析的主要情況、做法、經驗或問題 。如果內容多、篇幅長,最好把它分成若干部分,各加上一個小標題 。
4、結尾的寫法靈活多樣,一般有以下幾種:(1)自然結尾 。如果主體部分已把觀點闡述清楚,作出了明確結論,就不必再硬加一條尾巴 。(2)總結性結尾 。為加深讀者的印象,深化主旨,概括前文,把調查分析后對事物的看法再一次強調,作出結論性的收尾 。(3)啟示性結尾 。在寫完主要事實和分析結論之后,如果還有些問題或情況需要指出,引起讀者的思考和探討,或為了展示事物發展的趨勢,指出努力方向,就可以寫一個富有啟示性的結尾 。(4)預測性結語 。有的報告在提出調查分析情況和問題之后,又寫出作者的預測,說明發展的趨向,指出可能引起的后果和影響 。這是在更廣闊的視野上來深化主題 。
如何寫好數據分析報告?1、進度性:由于日常數據通報主要反映計劃的執行情況 , 因此必須把計劃執行的進度與時間的進展結合起來分析 , 觀察比較兩者是否一致 , 從而判斷計劃完成的好壞 。為此 , 需要進行一些必要的計算 , 通過一些絕對數和相對數據指標來突出進度 。
2、規范性:日常數據通報基本上成了數據分析部門的例行報告 , 定時向決策者提供 。所以這種分析報告就形成了比較規范的結構形式 。一般包括以下幾個基本部分:反映計劃執行的基本情況、分析完成或未完成的原因、總結計劃執行中的成績和經驗 , 找出存在的問題、提出措施和建議 。這種分析報告的標題也比較規范 , 一般變化不大 , 有時為了保持連續性 , 標題只變動一下時間 , 如《XX月XX日業務發展通報》
3、時效性:由日常數據通報和性質和任務決定 , 它是時效性最強的一種分析報告 。只有及時提供業務發展過程中的各種信息 , 才能幫助決策者掌握企業經驗的主動權 , 否則將會喪失良機 , 貽誤工作 。對大多數公司而言 , 這些報告主要通過微軟Office中的Word、Excel和PowerPoint系列軟件來表現 。
如何寫數據分析報告相信很多數據分析師在寫數據分析報告的時候也會遇到一些困惑 , 因為我最近也在寫一個報告 , 在這里就梳理一下如何寫數據分析報告
數據分析報告是數據分析師常見的工具 , 寫好一份數據分析報告 , 不但能夠清楚描述問題 , 洞察數據并且提出一些有思考的舉措 , 也很能反映出一個數據分析師的思維和用數據講故事的能力 , 網上雖然也有很多關于寫好數據分析報告的文章 , 但是大部分都是偏重于理論 , 具體實踐的很少 , 我就在這里做一個匯總 , 希望能幫助一些朋友 , 以期拋磚引玉
--------分割線--------正式開始--------
一份好的數據分析報告離不開兩部分:數據部分和分析部分 。巧婦難為無米之炊 , 數據之于數據分析師就好像食材之于巧婦 , 數據的重要性可見一斑 , 分析部分是數據分析師將數據做成報告的最重要一步 , 是最體現一個數據分析師功底的部分 , 也是拉開差距的部分 , 下面就針對兩部分分別進行闡述
一. 數據部分
數據部分最重要的就是數據質量 , 數據質量的好壞直接決定一份數據分析報告的好壞 , 如果報告中某一個數據被質疑 , 會直接影響這份數據分析報告的可信度 , 本章說一說跟數據有關的一些內容
1.數據的質量
1.1數據類型
數據類型比較好理解 , 就是數據以什么樣的類型存儲的 , 不同的數據類型有不同的使用方法 , 因此在處理數據之前 , 必須要先了解數據類型 , 常見的數據類型有(這里只說一些常見的數據類型):
整數型
int :用于存儲整數 , 存儲從-2的31次方到2的31次方之間的所有正負整數 , 每個INT類型的數據按4 個字節存儲
bigint :用于存儲大整數 , 存儲從-2的63次方到2的63次方之間的所有正負整數 , 每個BIGINT 類型的數據占用8個字節的存儲空間
smallint :用于存儲小整數 , 存儲從-2的15次方到2的15次方之間的所有正負整數 。每個SMALLINT 類型的數據占用2 個字節的存儲空間
浮點型
real :存儲的數據可精確到第7 位小數 , 其范圍為從-3.40E -38 到3.40E +38 。每個REAL類型的數據占用4 個字節的存儲空間
float :存儲的數據可精確到第15位小數 , 其范圍為從-1.79E -308 到1.79E +308 。每個FLOAT 類型的數據占用8 個字節的存儲空間 。FLOAT數據類型可寫為FLOAT[ n ]的形式 。n 指定FLOAT 數據的精度 。n 為1到15 之間的整數值 。當n 取1 到7時 , 實際上是定義了一個REAL 類型的數據 , 系統用4 個字節存儲它;當n 取8 到15 時 , 系統認為其是FLOAT 類型 , 用8 個字節存儲它
字符型
char : 數據類型的定義形式為CHAR[ (n) ] , n 表示所有字符所占的存儲空間 , n的取值為1 到8000 ,  即可容納8000 個ANSI 字符 。若不指定n 值 , 則系統默認值為1 。若輸入數據的字符數小于n , 則系統自動在其后添加空格來填滿設定好的空間 。若輸入的數據過長 , 將會截掉其超出部分
nchar : 它與CHAR 類型相似 。不同的是NCHAR數據類型n 的取值為1 到4000 。因為NCHAR 類型采用UNICODE標準字符集(CharacterSet) 。UNICODE 標準規定每個字符占用兩個字節的存儲空間 , 所以它比非UNICODE標準的數據類型多占用一倍的存儲空間 。使用UNICODE標準的好處是因其使用兩個字節做存儲單位 , 其一個存儲單位的容納量就大大增加了 , 可以將全世界的語言文字都囊括在內 , 在一個數據列中就可以同時出現中文、英文、法文、德文等 , 而不會出現編碼沖突
varchar :VARCHAR數據類型的定義形式為VARCHAR[ (n) ] 。它與CHAR 類型相似 , n 的取值也為1 到8000 , 若輸入的數據過長 , 將會截掉其超出部分 。不同的是 , VARCHAR數據類型具有變動長度的特性 , 因為VARCHAR數據類型的存儲長度為實際數值長度 , 若輸入數據的字符數小于n , 則系統不會在其后添加空格來填滿設定好的空間 。一般情況下 , 由于CHAR 數據類型長度固定 , 因此它比VARCHAR 類型的處理速度快
時間和日期型
date :‘2018-01-17’
time :‘10:14:00’
timestamp :‘2018-01-17 10:14:00.45’
以上就是常用的數據類型 , 如果有其他的數據類型沒有說到 , 可以去網上搜一下 , 都比較好理解
1.2噪音數據
因為網上有非常多的關于噪音數據的解釋 , 都非常專業 , 我就不在這里做過多的詳細解釋了 , 我們只探討從sql取出數據的時候有一些異常值的處理辦法:
null
一般跑過sql的朋友肯定會發現 , 在跑出來的數據中會有null的情況 , 這個時候需要對null進行替換 , 如果是計算用 , 就把null替換成0 , 這個步驟可以在sql里面完成 , 也可以在excel里面完成
極大值
極大值會影響數據的計算結果 , 一般會進行處理 , 要么替換成除極大值以外的最大值 , 要么直接棄用
作為分母的0
如果0作為分母 , 在excel里會出現#DIV/0,這個時候可以直接把結果替換 , 或者在sql里面直接進行替換 , 用case……when……就可以替換
1.3數據的口徑
數據的口徑很重要 , 根據經驗看 , 大部分的數據出現問題是口徑造成的 , 數據的口徑一定要跟業務的口徑一致 , 拿留存率舉例:
留存率是周期比率型指標 , 一般在計算留存率的時候需要確定 留存周期 和 活躍判定的口徑
留存周期:留存周期通俗來講就是指用戶在多長時間范圍內活躍 , 并在下一個周期內仍然活躍 , 這里的多長時間就是指留存周期
活躍判定:指怎么判定一個用戶活躍 , 可以是啟動App , 可以是登陸 , 也可以是完成了一次其他特定行為 , 這個主要依照業務需求而定
實際計算:
周留存率的計算
分子:本周活躍 且 上周也活躍的用戶數
分母:上周活躍的用戶數
2.可能會用到的工具
在處理數據的過程中可以用很多工具 , 在這里就介紹一些比較常見的工具 , 大家耳熟能詳 , 學起來也不是特變難
2.1提取數據
mysql
hivesql
兩者的查詢語句有相似的地方也有不同的地方 , 主要看自己所在公司的數據存儲情況
2.2數據處理
python:一般寫個腳本做一些機械的操作(我目前是這么用) , 也可以用來做計算
mysql:在查詢的時候可以進行處理
excel:數據量比較小的時候 , 可以在excel上簡單處理
2.3數據可視化
python:可以用來做一些詞云圖
Tableau:可視化一些圖表 , 可以和sql結合著用
excel:做一些簡單的圖表 , 實際上數據處理的好的話 , 一般用excel就足夠了
二. 分析部分
在處理了數據以后就要開始進行報告的撰寫 , 寫報告會涉及到幾個部分的工作 , 這里分別進行介紹一下:
1.報告結構
一篇數據分析報告的結構是十分重要的 , 一個好的結構能夠將他人帶入到你的報告中 , 讓他人更好的明白你的意圖 , 減少信息傳遞之間的丟失 , 同時你的思維也主要展現在結構上 , 這就意味著在寫數據分析報告前 , 一定好想清楚數據分析報告的結構 , 當然這里說的報告結構即包括整個報告的結構 , 也包括每一個章節的結構 , 這里就放到一起說了
1.1 總 - 分 - 總(多用在整體結構)
我們在讀一本書的時候 , 打開目錄 , 會發現整部書的結構一般包括:
前言
第一篇
第二篇
……
第n篇
結尾
這就是典型的總 - 分 - 總結構 , 是最常見的結構 , 如果是對一個專題進行分析 , 用這種形式是非常好的 , 舉個例子:
某電商App近一個月內的銷售額出現下滑 , 讓你針對這個問題進行一次專題分析
分析思路:拿到這個問題 , 我們很容易想到的是 , 銷售額出現下滑出現的原因有兩個 , 一個是付費用戶數減少了 , 另一個是付費用戶的人均付費金額減少了 , 這兩個原因屬于并列的原因 , 不存在遞進關系 , 也就是說付費用戶數減少了與人均付費金額減少并不存在因果關系 , 沒有什么相關性 , 因此需要對兩個原因共同分析 , 最后輸出結論和提升建議 , 分析完以后 , 會發現總
- 分 - 總結構很適合這樣的分析 , 所以列出以下提綱
問題描述
銷售額近一個月下降多少?絕對值 , 環比 , 同比數據
原因假設:付費用戶數下降/人均付費金額下降
付費用戶數下降分析
付費用戶數降幅是多少?絕對值 , 環比 , 同比數據
定位下降人群:是整體下降還是某一群體用戶數下降
這里就涉及到用戶分群 , 用戶分群的方法有很多 , 涉及到用戶價值的分群常見的就是RFM模型 , 將分完群的用戶進行數據對比 , 看看上個月付費用戶的結構占比跟本月有什么不同 , 當然用戶分群的方法也不止這一個 , 還有按照會員等級分群(主要用會員等級進行用戶分群) , 按照活躍程度(新用戶/留存用戶/回流用戶) , 按照消費習慣(一般用戶表里面都會有用戶的標簽 , 標識這個用戶的消費習慣 , 表示這個用戶更喜歡購買哪一類的商品) , 不管用什么分群方法 , 都需要縱向對比 , 也就是這個月和上個月付費人群的對比
原因分析:
如果是付費用戶整體下降(這種是大家都不想看到的現象 , 欣慰大盤數據的驅動需要投入大量的資源 , 也有可能是自然波動) , 考慮可能的原因主要有:用戶整體流失 , 比如用戶流失到竟對;或者本月有什么特殊情況 , 影響到了整體的用戶活躍;或者是從活動維度去觀察 , 是不是活動的力度減小 , 影響了用戶付費的欲望
如果是某一個用戶群體下降:考慮的原因可能有商品品類的影響 , 是不是某一類商品在平臺沒有上架 , 或者某一類商品漲價;或者這一類用戶受到了哪些影響 , 一般可以從屬性和行為角度去分析
提出策略:
針對分析出的原因提出可落地的策略(策略一定要落地 , 要具體 , 比如如果你提出一條策略是:提升新注冊用戶數 , 那么等于沒說 , 老板多數會diss你 , 但是你如果說 , 通過減少注冊時填寫的非必要字段 , 如年齡/職業 , 來簡化注冊流程 , 挺升注冊轉化率 , 進而提升新注冊用戶數 , 那感覺是不一樣的)
人均付費金額下降分析
人均付費金額的降幅是多少?絕對值 , 環比 , 同比數據
定位原因
人均付費金額下降可能的原因主要有:訂單數量下降;每個訂單包含的商品數的下降/某一個品類購買數下降
提出策略:針對分析出的原因提出可落地的策略
總結問題
明確造成銷售額下降的原因到底是什么(定性以后 , 記得一定要量化 , 不量化會被diss)
提出有針對性的建議
如何預防再次發生
1.2遞進(可用于整體結構和章節內部結構)
這種結構適合對一個問題進行探索 , 就像上一個例子中 , 我們針對每一個可能原因進行分析的時候 , 就是采用的這種分析方法 , 這種分析結構特別適合對一個小問題進行深入的探索分析 , 層層遞進 , 深挖原因 , 這里在舉一個例子:
某一個App的新注冊用戶數環比上個月減少 , 需要你做一個深入的分析 , 找到原因 , 提供改進策略
分析思路:新注冊用戶數的的影響因素是一個典型的漏斗結構 , 也是一個典型的單向性用戶旅程 , 畫一張圖就能說明白:
如圖所示 , 影響注冊用戶數的原因全部標注在漏斗里面 , 但是注冊全流程這個漏斗只能看個大概流失 , 所以我們會對某一步進行細化 , 這張圖上 , 我們對用戶從啟動到注冊成功進行細化 , 細化到用戶行為 , 這樣能夠提出一些產品上的改進意見 , 這個時候 , 如果想要提升新注冊用戶數 , 只需要針對每一步流失原因進行分析 , 找到提升策略就可以了 , 基本上是所見即所得的分析
比如:我們想對提交注冊信息到注冊成功這一步進行優化 , 那么首先我們要找到用戶注冊失敗的原因有什么 , 一般有:
用戶已注冊
密碼格式不合規
系統錯誤
未勾選《隱私協議》
在提出建議的時候 , 只要針對以上原因提出具體改進意見就可以了
1.3并列結構(多用于整體結構)
這種結構一般遇到的情況不多 , 常見的有對不同的校區進行經營分析/對不同品類的商品進行售賣分析 , 基本都是以描述型分析為主 , 因為分析的主體是并列關系 , 所以只需要每個主體就行單獨分析就好 , 基本采用的分析思路是一樣的
1.4因果結構(多用于章節內部結構)
這種結構一般用在復盤分析報告中 , 復盤是常見的數據分析報告類型之一 , 也是很多公司比較重視的一個報告 , 比如雙十一復盤/新手活動復盤等等 ,  以電商某一次大促復盤為例  , 這里直接寫結構:
總體描述:
本次大促整體數據表現 , 整體活動節奏的介紹;銷售額是多少 , 同比提升多少;利潤情況;參與用戶有多少 , 同比提升多少;賣出商品有多少 , 同比提升多少;各個子活動的貢獻是多少
子活動1的效果分析
子活動1的簡介 , 作用 , 發力點
子活動1的貢獻是什么 , 對于直接提升結果指標或者間接提升指標有哪些貢獻
子活動1的成本是什么?投入產出比是多少?
子活動2的效果分析
子活動x的效果分析
最后匯總 , 提出優化建議
2.分析方法
講完了整體結構 , 我們就該進入到具體分析的過程里面 , 這里的分析方法 , 主要想說說怎么去針對不同的數據進行分析 , 也就是說怎么通過數據看出問題 , 這里介紹常用的5種分析方法 , 但是有一句話非常重要 , 想寫這節的最前面: 數據分析師一定要懂業務 , 在分析之前最好能把問題定位個大概 , 再去撈數 , 再去分析 , 否則每天會沉浸在漫無目的取數中 , 我認為一個數據分析師最重要的能力是要懂業務 , 從數據的角度看業務 , 才能驅動業務
2.1 對比分析
橫向對比
橫向對比就是把一個指標按照不同維度拆分 , 去對比不同維度的變化 , 舉個簡單的例子來說就是:
昨天的DAU增長了30% , 那么把DAU進行拆分 , 可以拆分成以下三種方式:
DAU=新注冊用戶數+留存用戶數+回流用戶數
DAU=北京活躍用戶數+河北活躍用戶數+山東活躍用戶數+……
DAU=北京活躍用戶數+河北的活躍用戶數+……
=北京的新增用戶數+北京的留存用戶數+北京的回流用戶數+河北的新增用戶數+河北的留存用戶數+河北的回流用戶數+……
這里留一個疑問 , 怎么去選擇優先下鉆的維度?想明白以后分析的效率就會有很大提升
縱向對比
在進行完橫向對比以后 , 就要開始進行縱向對比 , 縱向對比主要是在時間維度上 , 還拿上一個例子來說 , 我們按照第一種方式進行橫向對比以后 , 就要縱向對比 , 見下表:
2.2分布分析
分布分析一般是應用的場景比如用累計消費金額去分組/按照用戶一個月活躍天數去分組 , 這些場景都有兩個共性的特征:
屬性值都是數值類型 , 或者日期類型
屬性值非常多 , 比如累計消費金額可能從1-90000中間任意一個數字 , 也就是屬性值非常多 , 沒辦法用每一個屬性值去單獨分析 , 因此需要分組
還是上圖說明:
2.3交叉分析
交叉分析一般指多維度交叉 , 或者不同指標之間的交叉
多維度交叉其實有點類似對比分析的第三類分類方法 , 這里不在贅述了 , 還是那個圖 , 但是在實際分析中的作用其實很是強大 , 具體如何應用就需要大家舉一反三啦 , 仔細看看這張圖 , 可以換成哪些分析場景下的哪些場景的交叉分析:
不同指標交叉一般用在分析變化趨勢中 , 或者尋找相關因素的時候 , 上圖:
這樣既能看絕對值的變化 , 又能一目了然的看出變化趨勢 , 如果不同指標之間呈現一定的相關性 , 那就是相當完美了
2.4漏斗分析
漏斗分析模型比較好理解了 , 一般在行為分析中常用到 , 直接上圖吧:
是不是有點眼熟?漏斗分析一般分析應用在分析用戶使用某項業務時 , 經過一系列步驟轉化的效果 , 因為用戶會沿著產品設計的路徑到達最終目標事件 , 在分析每一步轉化的時候會用到這個模型
2.5矩陣分析
矩陣分析是一個不錯的分析模型 , 主要用在分類上面 , 常見的有用戶分類、產品分類等 , 比如像常見的RFM模型是一個三維矩陣 , 有八個象限 , 上兩個圖看看:
矩陣分析其實不難理解 , 但是涉及到一個比較關鍵的問題 , 就是臨界點怎么選擇 , 通俗來說就是第一象限和第二象限的臨界值是多少 , 有的是0 , 有的不是0 , 舉個例子:
我想用活躍度和累計消費金額對1萬個用戶進行分群 , 使用矩陣分析
我建好了這個二維矩陣 , 我第一件事就是先要確定原點的坐標值 , 也就是說用戶的累計消費金額大于x , 就會出現在第一/四象限 , 如果小于x , 就會出現在第二/三象限 , 想確定這個值需要一定的方法 , 會用到一些分類算法 , 這個可以去網上查一些關于分類的教程 , 有很多 , 后續我會寫一盤文章來介紹分類 , 這里就不細講了
以上就是數據分析最重要的兩個模塊 , 當然在實際操作中還有很多需要思考的地方 , 太細節的東西不太能夠面面俱到 , 這里留給大家去思考的空間 , 比如:
數據分析報告怎么講成一個故事 , 比如背景-現狀-原因-策略-預期結果-復盤結果?
每一頁PPT怎么排版會讓你的數據分析報告可讀性更高?
如果你的數據分析報告不采用上述的結構 , 還能用哪些結構?
怎么讓你的數據分析報告顯得更高大上?
可以留言交流哦
【撰寫數據分析報告6個步驟 數據分析怎么寫?】關于數據分析怎么寫和數據分析怎么寫?的內容就分享到這兒!更多實用知識經驗 , 盡在 m.apearl.cn