摘要:5 月 12 日,學術打假名人 Elisabeth Bik 發文指出,最近由中國科研團隊在《自然》發表的新冠病毒小鼠模型研究論文中,來自兩個不同組別的圖像出現了“可能的重合”。2016 年,Bik 團隊對生物醫學領域超過 2 萬篇論文進行了人工分析,認爲多達 4% 的論文包含有問題的圖片。

來源:科研圈

5 月 12 日,學術打假名人 Elisabeth Bik 發文指出,最近由中國科研團隊在《自然》發表的新冠病毒小鼠模型研究論文中,來自兩個不同組別的圖像出現了“可能的重合”。目前 Bik 的這條 Twitter 已經有上千個轉發,相關團隊和《自然》仍未公開回應。

圖像造假已經成爲生物醫學領域的一大問題。近日,多家學術出版商合作成立了工作組,探討如何建立圖像查重合作機制,並計劃對圖像問題進行更加明確的分類和界定。

編譯 戚譯引

5 月 7 日,中國研究團隊以加快評審形式在《自然》在線發表論文,題爲《SARS-CoV-2 在 hACE2 轉基因小鼠中的致病性》(The pathogenicity of SARS-CoV-2 in hACE2 transgenic mice),在小鼠中轉入人血管緊張素轉換酶 2(hACE2)基因,構建能夠感染新冠病毒的小鼠模型,以促進相關藥物和疫苗的研發。

該研究最初於 2 月 28 日發表於預印本網站 bioRxiv。研究由中國醫學科學院實驗動物研究所、北京新發傳染病動物模型重點實驗室、北京協和醫學院比較醫學中心和國家病毒性疾病控制預防研究所等單位合作完成,共同通訊作者爲中國醫學科學院醫學實驗動物研究所所長秦川教授、中國疾病預防控制中心病毒病預防控制所武桂珍研究員。

5 月 12 日,學術打假名人 Elisabeth Bik 指出,這篇論文的 Fig.2 中,本該來自兩個不同對照組的圖片出現了重合區域。在野生株小鼠(WB-HB-01)和 hACE2 空白對照小鼠(ACE2-Mock)的肺部組織 HE 染色圖片中,部分區域的紋理看起來高度一致(見藍框標註)。

有 PubPeer 用戶進行了圖像處理方面的分析,認爲兩張圖片藍框區域中強度和邊沿高度一致。

有網友詢問 Bik,這類重複使用圖片可能的動機是什麼,Bik 回答:“我注意到重合部分更有可能出現在兩個不同的對照組中,正如這個案例。這可能表示研究者只設置了一個對照組,以便節約實驗動物,或者應付評審人的要求。”

Bik 還表示:“這是一份‘未經編輯的稿件’,‘在最終發表前將會經過審校’。這很有可能被認定爲‘證明過程中的小失誤’。”但很顯然,一張有問題的圖片足以令同行感到強烈的不信任。許多人在 Bik 的推特下面列舉了論文中其他的疑點。

屢禁不止的圖像造假

如今論文文字查重技術已經比較成熟,相比之下,識別圖像造假的技術還有許多不足。2016 年,Bik 團隊對生物醫學領域超過 2 萬篇論文進行了人工分析,認爲多達 4% 的論文包含有問題的圖片。

近年來,Bik 團隊還揭發了多起中國學者的圖像造假事件。2019 年 11 月,Bik 團隊指出南開大學校長、中國工程院院士曹雪濤參與的多篇論文數據可疑,實驗圖片有 PS 痕跡。據《自然》報道,最終 PubPeer 上被指出有疑問的相關論文超過 60 篇,截止今年 5 月有 13 篇作出了更正,大多數更正聲明都宣稱研究結論沒有受到影響。

今年 2 月 21 日,Bik 團隊宣佈發現超過 400 篇論文可能都來自於同一個“論文作坊”。這些論文全部來自於中國的幾十家醫院,其中包含了多家三甲醫院,涉及不同作者、不同研究領域。其中許多論文也是因爲圖像高度相似而露出馬腳。

《自然》的另一篇報道指出,目前許多期刊都沒有僱用專人審覈論文中的圖片,理由是這樣做成本太高或太花時間。現有的技術也無法大量掃描論文圖片。一些公司已經開始提供小規模的圖片審覈服務,例如日本的 LPIXEL、以色列的 Proofig、意大利的 Resis 等。還有研究者在開發能夠對多篇論文中的圖片進行交叉對比的軟件工具。但是,大型出版商需要的是能夠處理大量圖片的軟件,並且它要能被整合到同行評審過程中,最好還能對大量論文中的圖片進行交叉對比。

圖像也需要“查重數據庫”

爲了解決這一問題,學術出版界已經行動起來。今年四月起,國際科學、技術和醫學出版商協會(STM)標準與技術委員會(STEC)成立了工作組,探討如何自動識別論文中的圖像問題。工作組由愛思唯爾學術誠信高級副總裁 IJsbrand Jan Aalbersberg 任組長,成員均來自施普林格·自然、威立、T&F 等學術出版商。

工作組的任務是梳理對圖片掃描軟件的最低要求,並探討出版商如何藉助這一技術處理數十萬甚至百萬計的論文。該團隊還希望對“圖像問題的類型和嚴重性”進行分類,並“制訂指南說明在何種情況下進行何種圖像調整是允許的”。

愛思唯爾出版服務主任 Catriona Fennell 也是工作組的成員,她表示愛思唯爾對少數論文的“工業化造假”高度關注。前文提到的論文作坊就屬於這種情況。她指出,不同論文中的相似之處很難在同行評審過程中被發現,不僅是因爲大多數審稿人不會留意這類問題,也因爲這種方式產出的論文會在同一時期被投往不同期刊,在保密情況下接受評審。因此,學術出版界需要一個共享數據庫,以識別論文之間重複使用的圖像,就像使用 CrossCheck 進行文字查重一樣。Fennell 說:“在圖像審覈方面,我們也需要同樣的合作模式。”

相關文章