作者: 黃成明

來源: 數據化管理

今天衛健委網站發佈的全國數據比往常都來的晚了一些,但湖北的數據倒是今天一大早就公佈了。 從昨天開始湖北公佈了臨牀診斷數據,今天就把這些數據合併到統計公報中了。 一早刷微博發現滿屏的驚詫。

做數據的人都知道,統計口徑是一個折磨人的小妖精,稍微一變動分析師們就各種不適。 當然我們沒有互聯網上的喫瓜羣衆這麼驚訝還是比較淡定的,面對統計口徑的調整我們可以通過數據規律進行還原,並且剔除異常數據等各種手段進行數據整理,目的當然是還原事件背後的事實。

今天我重點看看湖北的數據,看看口徑改變後的數據規律。 而往常每天發佈的全國數據暫停一期(原因你們懂滴),而各地病例傳播關係鏈圖今天還會繼續發佈,並且會增加不少城市數據(有近20個城市的傳播路徑圖)。

第一部分: 還原湖北確診數據

湖北今天增加了臨牀確診、臨牀治癒、臨牀死亡的數據,既單列又合併在總數據中了,特別是臨牀確診人數公佈的是累計值,但死亡和治癒只是昨天數據,難免有些遺憾。

先更新湖北的數據總圖, 總確診數據中臨牀佔27.7%,昨日死亡中臨牀佔55.8%,昨日治癒出院的臨牀佔52.7%。

湖北衛健委公告“ 2020年2月12日0時-24時, 湖北省新增新冠肺炎病例14840例(含臨牀診斷病例13332例) ”,從中我們可以算出老標準的確診昨日增加了1508人,比上幾日也是降低的。 我們如何處理13332例這個診斷數據呢? 做個假設,它肯定不是一天新增,而是每天正常統計在冊,之前只是沒有合併到確診數據而已。 所以每日確診人數變化規律和診斷數據規律應該是一樣的。 按照這個假設,我們其實可以把臨牀診斷數據按老口徑的確診數據規律分解到每一天。 這樣大體上可以還原湖北確診數。

還原到每天就是這樣的,趨勢還是向下向好,統計口徑的改變並不能改變數據的趨勢:

備註:臨牀數據爲根據確診數據推測

換一個角度看湖北確診數,可能大家都想知道到底哪個城市的確診患者密度更大? 我們找到了湖北各地級主城區的“建成區面積”和“居住用地面積”,然後用確診數據來計算哪個城市的確診密度更大。 ps: 只是主城區的密度,縣城數據已經剔除。

1、確診密度之建成區面積法

這個數據比有些按地級市行政面積靠譜很多,有些媒體用行政面積來算確診密度會鬧很大的笑話的,比如按照這種算法深圳(確診數391人,市區面積1997平方公里)的確診密度(0.20人/平方公里)遠大於江西新餘(確診數121人,市區面積1789平方公里)的密度(0.07人/平方公里)。 但看一直我文章的朋友們都知道,新餘在百萬人確診率中排全國非湖北城市的前5位,因爲新餘的農村面積大,而病毒的主要感染是城市人口,不能這樣算。

所以用行政面積誤差比較大,我用建成區的面積來計算,建成區定義是指建成區外輪廓線所能包括的地區,也就是這個城市實際建設用地所達到的範圍。

今天先看湖北的數據,武漢城區確診密度是52.5人/平方公里爲最高,有5個城市密度在10-20之間,還有19個在10以下。

備註:確診數據已經剔除縣城的確診數

2、確診密度之居住用地面積法

我們再把算法往下細分,甚至不用建成區這個概念,因爲城區中還包含很多山啦、水啦意義不大的地方。 我直接用城市建設用地面積中的居住用地來計算。

這種算法武漢的值是125.2人/平方公里,20人/平方公里的有9個城市,小於20人的有6個。

備註:確診數據已經剔除縣城的確診數

兩種方法計算後的排名沒有太大的差異,也說明城市建設結構差不多。 全國其他地區的數據彆着急,明天見。

————————

另外我必須要再次重申我對數據的態度:

經常有粉絲在我微博微信評論說疫情公告這個數據你也信? 數據是錯的分析有什麼意義? 其它地區的數據我信湖北的數據還是算了吧? ......

這些問題我是這樣看的: 這個世界上沒有絕對真實的數據,都是在一定標準或範圍內統計的,真實是一個相對概念。 湖北由於疫情嚴重漏掉的數據、不及時的數據、統計口徑改變造成誤差、其他原因不在統計範疇的數據肯定大概率是有的。 但我們不能因此就忽略數據,那纔是最大的疫情。 我個人的態度是重相對值重趨勢,輕絕對值輕人爲干擾大的值,但輕並不意味就是否定。 所以我的分析重點都在看趨勢。

比起大多數媒體只有乾巴巴的幾個確診死亡治癒的數據,我每日都會從不一樣的角度看疫情數據,每日環比趨勢、百萬人確診率、3日增速都是我不定期會發布的數據。 看我的數據再結合常識心裏就有底了,數據就是一種參考,丟掉這種參考無異於瞎子摸象,所以數據必須要看,必須要從不同的角度來看。

從有限的數據看出無限種可能這纔是真正的高手!

————————

第二部分: 城市 數據

我們的志願者團隊今天又出了十幾張圖,下面有廣西5市,吉林省、濟南、青島、深圳、西安、新餘、天津、南充、中山、駐馬店、合肥共12個省或城市的路徑圖,大家各取所需。ps如果看不清楚可以到我微博(ID:數據化管理)找到高清大圖

1、廣西(含南寧、防城港、來賓、河池、梧州)

2、吉林省

3、濟南

4、青島

5、深圳

6、西安

7、新餘

8、天津

9、南充

10、中山

11、駐馬店

12、合肥

————————

明天繼續更新,歡迎大家關注。

相關文章