隨着新型冠狀病毒感染肺炎疫情蔓延,傳染病防治關係到每一個人的生命健康。

在這次疫情的預防和治療中,大數據起到了很重要的作用。

哈佛大學免疫學和傳染病學博士內森 • 沃爾夫的《病毒來襲》,對傳染病進行了理智細緻的分析,教我們如何用應用大數據來預防和治療疾病。

《病毒來襲》

【美】內森 • 沃爾夫 著 沈捷 譯

湛廬文化 / 浙江人民出版社

大數據自從2008年以後變成一個很火的概念。事實上這個概念出自於金融行業,因爲金融行業對於數字是最敏感的,銀行業總是希望知道應該給什麼樣的人發放貸款,它們能夠保證收回貸款,還要收到利息,不能給什麼樣的人發放貸款。

所以在2021世紀初,金融行業發展出了一些模型,用來預測人們的消費行爲和他們的金融行爲之間的關係。這樣做的後果是什麼呢?銀行的業績大大的擴展了,然而次貸危機也發生了。

不管結果怎麼樣,這些模型已經顯示了它的威力,就是通過對於遺忘存在的海量數據的分析,可以對人類的行爲進行分類,進而可以預測人類的行爲。所以實際上大數據簡單講就是兩件事情:分類和預測,分類的目的是爲了預測。

明白了這一點,對於疾病來說,有沒有辦法對治療、愈後以及病情的發生發展進行預測?答案是肯定的。

當有了足夠多的數據,當有了足夠多的關於這些數據的處理的知識之後,那麼你就可以對發生了的疾病,會對在特定的人身上產生的效果作出預測,同時也可以對在什麼情況下會暴發什麼樣的疾病進行預測。

每年防疫系統都會發布流感的暴發趨勢的預測,他們的數據是怎麼來的呢?對於疾控系統來說,他們來自於所謂的各種各樣的哨點監測數據,什麼意思?就是在基層的診社區設立發熱門診,這些發熱門診會報告每天、每週、每月的發熱人數,這些發熱人數彙總起來了以後,通過模型的計算,可以從時間尺度上看出一些變化,比如說從10月底開始就會出現發熱的人數的增加,這個時候就可以預測出流感的高峯要來了。

另外一個路徑,比如說利用Google這個搜索引擎工具,它本身也是一個大數據工具。

當有人得了感冒,他會根據感冒的症狀,他會去這些搜索引擎上搜索感冒怎麼治?如果有100萬個人在同一天都發出這樣的搜索關鍵詞,那麼搜索引擎就會把這些相關聯的關鍵詞形成一個搜索頁面,然後就可以利用這個搜索頁面上呈現的數據做出預測。

兩年前Google發表了一篇論文,他們通過這種辦法,提前預測到了流感高峯的到來,甚至比美國疾控系統提前一週左右。Google現在也已經開發了這樣的工具,用戶可以用這種關鍵詞去進行搜索,通過這種方式就可以幫助大衆瞭解疾病發展的動態。

比如對這次疫情發佈實時新增和確診病例數據的丁香園,就是利用大數據來進行病情發展趨勢的預測。

全國新冠肺炎疫情實時動態

圖自丁香園

除此之外,大數據時代還有利於建立流行病毒的數據庫。

每當科學家對一個新的病毒進行基因測序之後,就會把這些數據上傳到世界衛生組織建立的數據庫裏,形成一個傳染性病毒的基因庫。這些數據也可以供世界各國進行再分析。比如基因序列分析,進而就可以知道病毒是如何進化來源是什麼。這樣做的好處是可以對病毒進行溯源了,另外還可以看到這些病毒的傳染性在分子層面上的變化。


相關文章