來源:科技日報

22日,中國科學院科技論文預發佈平臺(ChinaXiv)上發表了一項基於新的大數據分析方法得到的溯源結果,美國新冠“零號病人”大概率出現在2019年9月前後,其中最早的首例感染有50%的概率發生在羅德島州,日期爲2019年4月26日,遠早於美國官方公佈的全美首例確診日期2020年1月20日。

一系列研究顯示,美國、西班牙、法國、意大利、巴西等多國早在中國疫情暴發前就已出現遭病毒侵襲的痕跡。在這項工作中,研究人員基於已公開數據並根據傳染病模型和統計方法,建立最優化模型,對美國部分州和中國武漢市、浙江省等地的疫情起源時間進行了推斷。

結合數學模型和人工智能技術對傳染病進行定性和定量分析,可以揭示傳染病流行規律。目前,根據傳染病模型和數據進行疫情預測的研究比較多,但是利用大數據分析的方法建立數學模型“倒推”疫情變化的研究,國內外都比較少。

研究人員主要根據經典傳染病模型和統計方法,建立“模型與數據混合驅動的疫情傳播模型”,並且應用最小二乘估計和核密度估計方法,得到模型參數。他們利用美國東北部12州每日公佈的疫情數據,分別求出美國東北部這12州的初期疫情傳播模型所對應的參數。在此基礎上,推斷出它們各自的首例、50例和100例的感染時間及其對應的概率。

計算結果顯示,對美國東北部的12州,新冠肺炎疫情首例感染髮生大概率出現在2019年9月前後,其中最早的首例感染有50%的概率發生在羅德島州,日期爲2019年4月26日,最晚的首例感染有50%的概率發生在特拉華州,日期爲2019年11月30日,均早於美國官方公佈的全美首例確診日期2020年1月20日。

此外,爲驗證這一新方法,研究團隊還利用同一模型和中國的公開數據,推斷了中國武漢市和浙江省首例、50例和100例病例感染時間。武漢市首例感染髮生概率50%的日期爲2019年12月20日,浙江省首例感染髮生概率50%的日期爲2019年12月23日。據此推斷,中國新冠肺炎疫情大概率從2019年12月下旬開始流行,這一結論與流行病學調查結果基本相符,證明該計算方法準確可靠。

研究表明,如果其他國家或地區疫情傳播初期檢測數據比較準確,可以利用該方法對疫情起源時間進行推斷,在給定概率意義下計算出首例和若干例的感染時間。

相關文章