編輯導語:對於產品來說,數據是很重要的。有了數據才能發現問題、提升留存、留住客戶。那麼,我們如何才能藉助數據達成以上的目標呢?本文作者就爲我們介紹瞭如何用數據賦能產品,以及通過數據去幫助產品發現留存的關鍵行爲。

一、背景

產品除了活躍的數據,留存的數據也是至關重要的,優化好了留存,也就提升了活躍。所以數據分析師天天會被產品問到的一個問題就是:我們到底應該怎麼去提升我們的留存。非常煩,你們有沒有這樣的感觸?

互聯網思維中的一條就是用戶至上,留住用戶纔有故事。那麼我們怎麼通過數據去幫助產品去發現留存的關鍵行爲呢,去解決我們煩心的問題呢?

我們的分析目標: 影響留存的相關的關鍵行爲有哪些?這些行爲和留存哪一個相關性是最大的?這些關鍵行爲和留存是否存在因果關係?

二、分析思路

分析思路和方法:

首先是關鍵行爲的提取,這一步就是利用sql從數據倉庫中提取你想要的與留存相關的數據行爲,這一步是最麻煩也是最費時間的。

利用統計學的相關性的計算方法,可以計算第一步計算的每一個行爲與留存的相關性。相關性的係數越大就代表這個行爲跟留存是越相關的,就代表它可能就越影響留存。

比如刷抖音的次數跟留存的相關係數是 0.6,刷抖音的時長和留存的相關係數是0.8,就可以說明刷抖音的時間。

然而數據分析中的相關關係不一定是因果關係,比如很多人喜歡張傑跟他唱歌好聽是相關的,我們不能說他唱歌好聽是大家喜歡他的原因,可能真正原因是他的顏值。

類似的,我們的這些關鍵行爲也不一定是決定留存的原因,可能只是具有相關性。所以我們就要去推斷 a 是b 的原因,利用的方法是granger test因果檢驗的方法。

當我們已經判斷了XX 行爲就是留存的原因,比如你一週刷抖音的時間是你下一週是否會留存的原因,那麼接下來就是去發現到底刷抖音多長時間是留存的magic number。

這個magic number 非常神奇,就是比如你一週刷抖音288分鐘,你下週留存的概率會大大增加,這個”一週* 刷 * 288分鐘” 就是互聯網中最經典的magic number。抓住了magic number,也就抓住了一個產品的留存靈魂。

三、關鍵行爲特徵

拿某直播app 作爲例子,與留存的相關的行爲可以分爲:登錄行爲、觀看行爲、彈幕行爲、付費行爲,然後在每一個大的行爲分類進行小的指標的刻畫。

比如去描述登錄的行爲我們就可以用30天登錄天數、7天登錄天數;還可以用比率型指標,像最近30天的登錄天數和過去30天的登錄的天數的比值,這個反應了用戶活躍度的變化。

四、相關性分析

上一步已經提取完了所有跟留存相關的行爲特徵,這一步就要進行計算留存和這些特徵的相關性。

留存相關最大的四大因素:

  1. 30天或者7天登錄天數(cor: 0.66)
  2. 30天觀看品類個數(cor: 0.44)
  3. 30天觀看主播數 (cor: 0.37)
  4. 30天日均觀看時長(cor: 0.26)

五、因果分析

因爲我們只是找出了跟留存相關的行爲特徵,但我們不知道這些行爲特徵是否是留存的原因,所以就要通過granger test 因果推斷的方法去驗證這些行爲特徵是否是留存的原因。

兩個經濟變量X、Y之間的格蘭傑因果關係定義爲:若在包含了變量X、Y的過去信息的條件下,對變量Y的預測效果要優於只單獨由Y的過去信息對Y進行的預測效果;即變量X有助於解釋變量Y的將來變化,則認爲變量X是引致變量Y的格蘭傑原因。

原假設和是否拒絕:X 和 Y 是不存在因果關係,當經過格蘭傑因果檢驗後計算出來的 p 值大於0.05 則接受原假設,否則拒絕原假設。

主要結論:

六、Magic Number

發現了影響留存了原因以後,我們就要尋找這些行爲是達到一個怎麼樣的值以後,會大大影響留存的概率。所以我們計算了30天登錄天數、7天登錄天數、月日均觀看時長、30天觀看主播數、30天觀看品類數和留存的關係。

下面是畫出來的圖:

拿30天登錄天數作爲例子:橫軸就是30天內不同登錄天數,縱軸就是留存率;當橫軸爲7的時候,留存率趨於穩定,這時候就達到較穩定的狀態也被稱作 aha moment.

我們可以發現幾個神奇的magic number:

  • 月登錄4天
  • 周登錄三天
  • 月觀看7個主播數
  • 月觀看4個品類數
  • 月日均觀看時長4分鐘

本文由 @陳友洋  原創發佈於人人都是產品經理。未經作者許可,禁止轉載。

題圖來自 Pexels,基於CC0協議。

相關文章