作者 | 徐銳


論文太長不想讀怎麼辦?一個軟件就可以搞定。


據《自然》報道,一位科學搜索引擎的創造者推出了一款軟件,可自動爲研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。


這個免費工具被創建它的團隊稱爲TLDRs(“太長,沒讀過”的縮寫),已於日前在科學搜索引擎“語義學者”上投入使用。


“語義學者”是美國艾倫人工智能研究所(AI2)創建的搜索引擎。


TLDR軟件爲科學搜索引擎“語義學者”上的一篇計算機科學論文生成一句話摘要。來源:Agnese Abrusci/Nature


AI2語義學者小組管理者Dan Weld表示,目前,TLDR軟件只用於語義學者所涵蓋的1000萬篇計算機科學論文,軟件經過微調後——預計在12月左右,其他學科的論文應該也能通過該軟件自動生成一句話摘要。


初步測試表明,與查看標題和普通論文摘要相比,TLDR軟件能夠幫助讀者更快對搜索結果進行排序,尤其是在手機上。


“人們似乎真的很喜歡這個工具。”Weld說。


Weld創造TLDR軟件的靈感來源於同事在推特上分享的一些標記文章的簡短句子。與其他語言生成軟件一樣,該工具採用基於大量文本的深層神經網絡學習。


研究團隊創建了數萬篇與標題匹配的研究論文,這樣網絡就可以學會生成簡潔的句子。


然後,研究人員對該軟件進行微調,訓練一個新的數據集,將論文和摘要匹配起來,這些數據集由幾千篇計算機科學論文組成,其中一些論文的摘要由論文作者撰寫,另一些論文摘要則由本科生撰寫。


該團隊已經收集了一些培訓實例,以提高該軟件在其他16個研究領域的性能,其中生物醫學可能是第一位的。


一份描述TLDR軟件的論文4月1日在預印本平臺arXiv上首次發佈,並在11月接受同行評審後發表。


研究人員已經免費提供了代碼,還有一個可以使用該軟件的演示網站,任何人都可以試用這個工具。


“我預測這種工具在不久的將來會成爲學術搜索的標準功能。事實上,考慮到需求,我很驚訝過了這麼久纔將其投入實際應用。”


華盛頓大學信息科學家Jevin West說,他應《自然》的要求對該工具進行了測試。


“這個工具並不完美,但絕對是朝着正確方向邁出的一步。”


《中國科學報》 (2020-12-02 第2版 國際 原標題爲《論文“太長不想讀”?人工智能新軟件可生成一句話摘要》)

相關文章