這個問題要拆分成兩方面來說。因爲不同場景,對於數據分析需要程度是不同的,需要的能力各不相同。

第一種:

有一部分人只是需要在一些工作中,分析部分數據,從而指導自己工作,爲之後計劃做支撐,這種類型的數據分析,薅一些數據分析的皮毛即可。

一、夯實基礎常識——建立數據分析概念

在夯基礎階段,你需要學習統計學相關知識,這些知識點一般在一些入門書籍、學習網站就可以get到

二、瞭解常用的方法論——形成數據分析的思維

什麼是數據分析方法論?方法論是從宏觀角度出發,從管理和業務的角度提出的分析框架,指導我們接下來具體分析的方向。

1、SWOT分析法

從優勢(Strength)、劣勢(Weakness)、機遇(Opportunity)、威脅(Threat)四個方面分析內外環境,適用於宏觀分析。運用這種方法,可以對研究對象所處的情景進行全面、系統、準確的研究,從而根據研究結果制定相應的發展戰略、計劃以及對策等。

2、PEST分析法

PEST 爲一種企業所處宏觀環境分析模型,從政治(Politics)、經濟(Economy)、社會(Society)、技術(Technology)四個方面分析內外環境,適用於宏觀分析。PEST分析與外部總體環境的因素互相結合就可歸納出SWOT分析中的機會與威脅。PEST/PESTLE、SWOT 與 SLEPT 可以作爲企業與環境分析的基礎工具。

3、AARRR海盜模型

一種以用戶爲中心的着眼於轉化率的漏斗型的數據收集測量模型,從獲取(Acquisition)、激活(Activition)、留存(Retention)、收益(Revenue)和推薦(Referral)5個環節增長。

AARRR在應用推廣運營各個層次(各個階段)需要關注的一些指標。在整個AARRR模型中,這些量化指標都具有很重要的地位,而且很多指標的影響力是跨多個層次的。及時準確地獲取這些指標的具體數據,對於應用的成功運營是必不可少的。

三、掌握常用的分析方法——培養數據分析習慣

1、趨勢分析

看數字、看趨勢是最基礎展示數據信息的方式。在數據分析中,我們可以通過直觀的數字或趨勢圖表,迅速瞭解例如市場的走勢、訂單的數量、業績完成的情況等等,從而直觀的吸收數據信息,有助於決策的準確性和實時性。

通常我們在數據分析產品中建立一張數據指標圖、線圖或者柱狀圖,然後持續觀察,重點關注異常值:

2、多維分解

多維分解是指從業務需求出發,將指標從多個維度進行拆分。爲什麼需要進行多維拆解?有時候一個非常籠統或者最終的指標你是看不出什麼問題來的,但是進行拆分之後,很多細節問題就會浮現出來。

比如,在分析物料不良率影響因素時,監控各來源渠道的物料不良率:

比如,某品牌服裝門店將月度銷售數量按照不同類型、不同大小進行拆分統計,監控不同款式的銷售效果:

3、漏斗分析

漏斗分析是一套流程式數據分析,絕大部分商業變現的流程,都可以歸納爲漏斗。漏斗分析是我們最常見的數據分析手段之一,無論是註冊轉化漏斗,還是商品下單的漏斗。通過漏斗分析可以從先到後還原用戶轉化的路徑,分析每一個轉化節點的效率。

其中,我們往往關注三個要點:

第一,從開始到結尾,整體的轉化效率是多少?

第二,每一步的轉化率是多少?

第三,哪一步流失最多,原因在什麼地方?流失的用戶符合哪些特徵?

漏斗分析要注意的兩個要點:

第一,不但要看總體的轉化率,還要關注轉化過程每一步的轉化率;

第二,漏斗分析也需要進行多維度拆解,拆解之後可能會發現不同維度下的轉化率也有很大差異。

4、對比分析

多變量進行對比時,一般會用到對比分析。對比分析也有很多種:

靜態對比:同一時間條件下對不同總體指標進行比較,如不同部門、不同地區、不同國家的比較,也叫“橫比”。比如:OPPO(南京)跟蹤訂貨量,將訂貨量細分爲城南、雨花區等各個區域進行對比監控,以便後期銷售量覆盤時,精細化分析數據支撐下一季度的佈局。

動態對比:同一總體條件下對不同時期指標數據的比較,也叫“縱比”。

除此之外,在特定行業,比如互聯網行業,常用的數據分析方法還包括用戶分羣、留存分析、用戶細查、A/B測試等等。

第二種:

專業的數據分析師能力從以下四個層次展開說:

一、需求層

需求層是最重要的,需求是數據分析的開始,也是你要分析的目標方向。

數據分析需求的來源往往有3種場景:

監控到現有的指標出現了異常情況需要通過數據分析去找原因;公司要對現有的運營模式或者某個產品進行評估確定是否需要進行調整或者優化;公司下達了戰略目標或短期目標需要通過分析看如何達成。要確定需求就必須與需求方進行溝通,清楚的確認需求的內容或者自己要分析前必須要清楚你想要的結果是什麼方向。

舉個簡單的例子:年底將近,雙十一大促銷在即,數據分析師們又到了一年最辛苦,最悲催的時間段。然而,有多少無意義的加班,是因爲業務部門不會提需求所導致的。需求提的不合理,業務部門看了不解決問題,就會反反覆覆的再提需求。導致數據分析師們辛苦加班還不落好,背上一個:“分析沒深度啊!”的壞名聲。其實這不能怪需求方不會提需求,而是你作爲數據分析人員要用你的經驗,你的專業技能,你的溝通技巧去引導,去確定,去達成一致。

所以要做到清晰的確定需求,你需要自身具備:

對業務、產品、需求背景有比較深的瞭解。瞭解的足夠對你才能去引導去判斷這個需求;光了解需求方是還不夠的,你需要從獲得的需求快速的去結合你所掌握的技能組工具有個初步的分析思路;綜合判斷後你再決定是否需要分析,應該怎麼分析,與需求方溝通確定清楚兩方理解是否一致。如果無法做到就會出現很多無法避免的問題。

理論上數據分析師所從事的工作是給出業務方相應的數據結果,而不是解決方案。雖然也有分析兩個字,但是如何設計解決方案是業務部門的事。運營部門就該做活動方案,產品經理就該出產品方案,銷售部門就該想東西怎麼賣。但是當下專業的數據分析師是需要比業務方更瞭解業務,你不瞭解業務下的結論領導或者需求方敢信任嗎?所以,一個業務技術雙精通的數據分析師,是可以替業務方搞定上邊所有問題的,不依賴業務方的判斷,因爲他自己就是個業務高手,有豐富的實戰經驗與業務能力。

但這種人是可遇不可求的。大部分數據分析師還是花70%時間處理數據的技術男。

在需求層我總結一下我們所需要具備的能力:

對業務、產品、需求背景有足夠的瞭解,如果不瞭解說明你在這塊應該先去充充電;然後當你無法想到分析方法的時候說明你對現有的數據不夠了解。你同樣該去了解了解數據的來源,數據的流轉,數據的定義。二、數據層

目標需求確定過後,現在的你就需要開始準備相關的數據了。數據層大致分爲:數據獲取、數據清洗、數據整理。數據應該從哪來呢?數據來源取決於你分析需求,有通過各統計網站進行數據下載(有哪些好的數據來源或者大數據平臺?、有哪些「神奇」的數據獲取方式?),有通過爬蟲技術在互聯網進行數據抓取,也有通過企業已經加工好的數據報表、有直接從企業數據庫通過SQL進行取數。

通過數據庫你能做到excel所無法做到的多樣性及細節化,你才能通過這些詳細的數據找出數據背後存在的問題。

現在的數據庫主要分爲關係類型數據,分佈式數據庫。關係類型數據代表產品爲mysql(免費開源的),分佈式數據庫代表hadoop。兩種都是使用sql語言進行數據提取,在數據分析中你將提取出來與分析相關的數據這步就是數據獲取。這裏你需要具備基礎的sql語言能力,要從海量的數據中找到你想要的部分。這個環節你也能對數據進行初步的清理,這裏取決於數據庫中的數據存儲是否完整規範。

當你數據清理好也整理好後就可以開始進行數據分析了。

三、分析層

分析的工具有很多,平民版的分析工具有excel、非專業的專業分析工具有spss、專業資深的分析工作有sas/R/python。

分析的思路一般來說都是“由淺到深”,分爲幾個步驟:描述分析——鎖定方向——建模分析——模型測試——迭代優化——模型加載——洞察結論。

描述分析是最基本的分析統計方法,在實際工作中也是應用最廣的分析方法。分爲兩大部分:數據描述和指標統計。數據描述:用來對數據進行基本情況的刻畫,包括:數據總數、時間跨度、時間粒度、空間範圍、空間粒度、數據來源等。如果是建模,那麼還要看數據的極值、分佈、離散度等內容。 指標統計:用來作報告,分析實際情況的數據指標,可粗略分爲四大類:變化、分佈、對比、預測。說了太多了,就不展開了。

洞察結論這一步是數據報告的核心,也是最能看出數據分析師水平的部分。一個年輕的分析師和一個年邁的分析師拿到同樣的圖表,完全有可能解讀出不同的內容。

舉個例子:

年輕的分析師:2013年1月銷售額同比上升60%,迎來開門紅。2月銷售額有所下降,3月大幅回升,4月持續增長。

年邁的分析師:2013年1月、2月銷售額去除春節因素後,1月實際同比上升20%,2月實際同比上升14%,3月、4月銷售額持續增長。

看到兩者的區別了嗎?2013年春節在2月,2012年則在1月,因此需要各去除一週的銷售額,再進行比較。如果不考慮這一因素,那麼後續得出的所有結論都是錯的。挖掘數字變化背後的真正影響因素,纔是洞察的目標。

四、輸出層

都到這一步了,相信各位對數據報告也不再陌生了。這一步中,需要保證的是數據報告內容的完整性。一個完整的數據報告,應至少包含以下六塊內容:報告背景、報告目的、數據來源、數量等基本情況、分頁圖表內容及本頁結論、各部分小結及最終總結、下一步策略或對趨勢的預測;

其中,背景和目的決定了你的報告邏輯(解決什麼問題);數據基本情況告訴對方你用了什麼樣的數據,可信度如何;分頁內容需要按照一定的邏輯來構建,目標仍然是解決報告目的中的問題;小結及總結必不可少;下一步策略或對趨勢的預測能爲你的報告加分。

相關文章