0. 序言

經過前期的讀取數據、清洗數據、操作數據、轉換數據和整理數據,接下來我們將進入分析數據的階段,這是數據分析工作的 重中之重

假設你的 客戶可能是你的領導,也可能就是你自己 ),給你發來一份銷售數據,他希望你分析分析,看看如何提高銷量。

你不妨先自己思考一下,當你接到這個分析任務的時候,你會怎麼做?然後再看看下面我是怎麼做的,這也是一種對比思維,促進自己多思考和總結,歡迎在文章下面留言分享你的想法。

1. 明確目標

上初中的時候,我們學過函數的概念,通常用 y = f(x) 來表示函數,它包含 3 個要素:自變量 x、因變量 y 和對應法則 f。我們可以把函數中的 y 理解爲目標,把 x 理解爲數據,把 f 理解爲實現目標的方法,要找到合適的方法不容易,這需要對業務有深刻的理解。

數據分析的第一步,是明確業務的目標,關鍵在於搞清楚 客戶 關心的是什麼 。如果未明確目標就進行數據分析,那麼就如同旅行沒有目的地,不知道終點在哪裏。


比如說,客戶的目標是提高銷量,但這還不夠明確,爲了搞清楚客戶的真正意圖,你得了解更多的信息,多問幾個「是多少」,使目標得到量化。例如:您希望銷量提高多少?

2. 應用思維

現實世界複雜多變,我們通常應用思維來理解業務的實際情況。

你的分析觀點往往來自於你的分析思維,所以正確地運用好分析思維是非常重要的

參考《 數據分析的 8 種思維 首先, 我們可以 運用 對比 思維,對數據進行有效的對比,這是數據分析工作的核心方法之一。

其次 ,我們運用 細分 思維,對數據進行細分, 關鍵是要找出高效的對比因子,先分維度,再分粒度。 通過多個維度的細分,將對比的差異按粒度逐級鎖定,對問題進行定位,尋找問題的根源。

然而,問題的答案可能還是沒有找到,此時 你可以運用 溯源 思維,密切關注更多的細節數據,想辦法從原始數據中進行追溯,思考用戶的行爲特徵,深入挖掘數據背後隱藏的信息。

在數據分析的過程中,我們可以運用假設等思維,大膽假設,小心求證。 無論是構建複雜的分析模型,還是進行簡單的數據決策,都要做出自己的設想和判斷。

最後,要做好思想準備,如果通過分析,發現數據有違你的假設,那麼就更加需要你進行詳細思考,仔細推敲,在這個過程中,你對用戶行爲的理解也會逐漸加深,從而數據分析的功力也會得到增強。

3. 處理數據

假設經過整理後的銷售數據如下表:

我們用 Py thon 進行讀取並預覽數據

通過觀察發現,數據中包含每天的實際銷量、目標銷量和目標完成率,爲了從更加宏觀的層面,把握銷售的整體情況,我們按月份進行彙總,首先,在表格最前面的位置插入一列:月份。

然後按月份進行彙總求和,重新計算月度彙總的目標完成率,並將彙總結果保存到 Excel 文件中。

4. 分析推理

仔細觀察上面的月度彙總數據,你會發現,與 7 月份進行對比, 8 月份的銷量 略有上升,但與目標進行對比,目標完成率反而下降,這是一個比較嚴重的問題。

爲了搞清楚這個問題產生的原因,你可以先進行探索性的數據分析。

在 Python 中,有一個很實用的包:pandas-profiling, 號稱用 1 行代碼就能生成數據分析報告。 如果你還沒有安裝的話,推薦你在命令行運行一下:pip install pandas-profiling,然後在 Jupyter Notebook 中運行以下代碼:

這是一份比較詳細的探索性數據分析報告,上圖僅顯示了其中一小部分信息,往下拉,可以看到每個變量的數據分佈等情況。

繼續往下拉,還可以看到各個變量之間的相關性,從圖中能夠直觀地看到:實際銷量與目標完成率之間具有比較強的正相關性,這也很好理解,因爲在目標銷量變化不大的情況下,實際銷量越高,目標完成率也就越高。

在做進一步的分析之前,你還需要熟悉業務的背景,假設公司經營的業務是在網上商城賣化妝品,提高  8 月份 目標銷量,是因爲 8 月份加大了廣告費的投入。但是, 廣告的效果 並沒有達到預期,所以目標完成率下降了。

對於「如何提高銷量」這樣一個大問題,我們很難直接回答,可以試着細分爲小問題,例如: 哪種促銷方式效 果更好? 我們的用戶希望得到什麼?

上面案例中的銷量數據,已經按時間的維度做了劃分,實際上, 除了按時間維度進行細分以外,還可以嘗試很多種不同的細分維度。 比如說,按地區的維度: 省份、城市等等, 按銷售渠道的維度: 京東、天貓等等。

現實情況往往是複雜的, 需要你運用相關思維, 理清各種 關係。比如說,從廣告展示,到用戶點擊,再到付款購買,形成一個銷售 漏斗 ,每個環節都有相應的轉化率指標。

爲了尋找提高銷量的機會,你可以嘗試運用假設思維,列出一些假設情況,例如: 假設換種促銷方式會怎麼樣?假設 降低產品的價格會怎麼樣?

假設你經過深入分析,在原始數據中,發現一些購買保溼霜的男性用戶,而這些保溼霜原本是專門爲女性用戶設計的。經過調研,你知道了這些男性購買化妝品的用途,原來 他們是用保溼霜來做剃鬚後的保養,這恐怕是一個有價值的發現

5. 提出建議

你懷着激動的心情,開始撰寫數據分析報告。此時你要記住,數據分析報告的重點,不是那些 花裏胡哨的圖表,而是提出有效的行動建議。

除非將數據分析用於做出更好的決策,否則,數據分析將毫無用處。

因此,作爲一名數據分析師,要想方設法提出有效的行動建議,爲業務創造價值。

首先,你要清楚地知道,自己從數據中發現了什麼,要指出 不確定 因素,小心防範並想辦法填補知識的空白,儘量避免作出過頭的結論,對分析結果負責,積累自己的信用,讓客戶更尊重和信任你,並理解你的分析和判斷也具有侷限性。

其次,你提出的行動建議,重點是要得到客戶的理解,鼓勵客戶以數據爲基礎,從而作出明智的決策。

最後,在數據分析報告中,你需要簡明扼要地闡述分析成果,並提出建議改善的措施。

例如:我深入地分析了銷售數據,做了很多種不同的大膽假設,並小心檢驗了假設的合理性。我發現有一羣男性用戶,他們用女性的保溼霜,來做剃鬚後的保養。這羣人對產品的需求很特別,但是,他們並不宣揚自己的這種需求,導致我們平時很難發現他們。因此, 建議 推出男性更容易接受的剃鬚保養產品, 增加 對這羣人的廣告投放 我認爲這將提高銷量。

6. 小結

本文介紹了分析數據、解決問題的一種思路。

首先,明確業務的具體目標。

其次,應用分析思維來理解業務的實際情況。

再次,用 Python 對數據進行彙總處理。

然後,綜合運用各種分析思維和分析工具,對數據進行分析推理。

最後,得出主要的分析結論,提出有效的行動建議。

限於文章的篇幅,本文 並沒有深入探究具體的業務細節,如果你想了解更多分析數據的 方法,請在文章下面留言告訴我

下面是本文的思維導圖:

相關文章