摘要:”國家衛生健康委員會規劃信息司信息處處長沈劍鋒表示,標準的醫學影像數據庫不僅應該對數據進行標準化,還應該對病竈有清晰的標註,且兼顧年齡分佈、疾病分類等其他維度的信息。未來將加強相關標準化數據的採集、質量控制、數據分析工作,以便將數據提供給權威部門,助力建立醫學影像的專業數據庫。

“AI的‘燃料’是數據。”近日,在超聲 大數據 與人工智能應用與推廣大會上,上海交通大學附屬瑞金醫院教授詹維偉打了一個形象的比喻,他說,驅動AI落地臨牀,數據的可用性起着基礎性的作用。

“頂級期刊刊發的關於醫學影像AI的論文大多需要大樣本(10萬以上)數據庫訓練。”詹維偉說,海量的數據意味着數據可用、不被污染、且能實現標準化。

而事實上,中國的醫學數據看似很多,但是可用性並不高,正是因爲存在被污染、信息不健全、難以標準化的三大“痛點”。東南大學生物科學與醫學工程學院教授萬遂人表示,在多中心的數據庫建立過程中,經常出現對同一醫學問題的不同說法。他認爲需要經過幾年的時間,完成行業標準的工作。

另一方面數據的不統一還存在一定的客觀原因,例如不同品牌的儀器成像機理和標準不同,因此對於同一病竈輸出的影像並不相同,這也大大提高了數據庫標準化的難度。

爲此專家呼籲相關機構進行數據的標準化工作。“整個醫學人工智能的基礎是大數據,大數據的基礎是我們數據樣本的標準庫是否建立。”國家衛生健康委員會規劃信息司信息處處長沈劍鋒表示,標準的醫學影像數據庫不僅應該對數據進行標準化,還應該對病竈有清晰的標註,且兼顧年齡分佈、疾病分類等其他維度的信息。

據介紹,國家衛生健康委員會已經開始着手進行國家層面的數據標準庫的建立。併發布了《全國醫院信息化建設標準與規範》《全國醫院數據上報管理方案》等指導性文件,對包括數據在內的相關信息進行標準規範。

“擁有大數據的第三方公司也應該在數據規範方面從事更多的工作。”詹維偉說。

美年大健康集團董事長俞熔對此表示認同,他說:“我們的600家運營機構去年爲兩千多萬人次提供體檢服務,龐大的流量和數據理應承載更多的科研和技術突破的責任。未來將加強相關標準化數據的採集、質量控制、數據分析工作,以便將數據提供給權威部門,助力建立醫學影像的專業數據庫。”

當天,大數據算法與分析國家工程試驗室杭州創新中心、浙江省數理醫學學會、美年大健康集團三方達成合作,共建超聲大數據庫。醫學影像AI合作開發聯盟同步成立,併發出倡議呼籲各方積極推動資源的高效配置,推動醫學影像AI技術落地,通過聯合研發共同開展國家級和省市級重大專項、產業化基金、科技發展基金等項目的立項、申報和項目的執行工作,實現產學研的優勢結合。

相關文章