記者:孫自法

中國科學院科技論文預發佈平臺(ChinaXiv)9月22日發表一項基於新的大數據分析方法得到的溯源結果顯示,美國新冠“零號病人”大概率出現在2019年9月前後,最早是羅德島州首例感染髮生概率50%的日期爲2019年4月26日,遠早於美國官方公佈的全美首例確診日期2020年1月20日。

當前,新冠病毒溯源是全人類面臨的共同挑戰。一系列研究已顯示,美國、西班牙、法國、意大利、巴西等多國早在中國疫情暴發前就已出現遭病毒侵襲的痕跡。爲快速、精準地推進溯源,數學家開始嘗試基於大數據分析的溯源方法,和生物學家共同尋找“零號病人”。

最新這項大數據分析工作中,科研人員基於已公開數據並根據傳染病模型和統計方法,建立最優化模型,對美國部分州和中國武漢市、浙江省等地的疫情起源時間進行了推斷。該研究論文提出,結合數學模型和人工智能技術對傳染病進行定性和定量分析,可以揭示傳染病流行規律。目前,根據傳染病模型和數據進行疫情預測的研究比較多,但是利用大數據分析的方法建立數學模型“倒推”疫情變化的研究,中外都比較少。

在論文中,科研人員主要根據經典傳染病模型和統計方法,建立“模型與數據混合驅動的疫情傳播模型”,並且應用最小二乘估計和核密度估計方法,得到模型參數。他們利用美國東北部12州每日公佈的疫情數據,分別求出美國東北部這12州的初期疫情傳播模型所對應的參數。在此基礎上,推斷出它們各自的首例、50例和100例的感染時間及其對應的概率。

計算結果顯示,對於美國東北部的12州,新冠疫情首例感染髮生大概率出現在2019年9月前後,最早是羅德島州首例感染髮生概率50%的日期爲2019年4月26日,最晚是特拉華州首例感染髮生概率50%的日期爲2019年11月30日,均早於美國官方公佈的全美首例確診日期2020年1月20日。

此外,爲驗證這一新方法,論文研究團隊還利用同一模型和中國的公開數據,推斷了中國武漢市和浙江省首例、50例和100例病例感染時間。武漢市首例感染髮生概率50%的日期爲2019年12月20日,浙江省首例感染髮生概率50%的日期爲2019年12月23日。據此推斷,中國新冠疫情大概率從2019年12月下旬開始流行,這一結論與流行病學調查結果基本相符,證明該計算方法準確可靠。

該研究論文表明,如果其他國家或地區疫情傳播初期檢測數據比較準確,可以利用該方法對疫情起源時間進行推斷,在給定概率意義下計算出首例和若干例的感染時間。

原標題:《大數據溯源:美國新冠“零號病人”大概率2019年4月出現》

 

責任編輯:劉萬里 SF014

相關文章