專利的發展趨勢越來越良好,再加上人工智能的浪潮,知識產權出版社就順勢推出了"狼來了"!今年"4·26"世界知識產權日期間發佈了一款被翻譯工作者稱之爲"狼來了"的人工智能產品——科專笑飛人工智能機器翻譯系統,致力於提供專業的專利文獻翻譯服務。

“狼”來了?沒錯,專利文獻翻譯領域的“狼”來了

科專笑飛的成功問世是知識產權出版社在機器翻譯技術領域自主研發14年的成果。該系統不僅提升了專利審查質量要求的具體部署,也是落實國家知識產權局要求運用新技術推動審查質量提升的具體舉措之一。

2005年中國國家知識產權局在與歐洲專利局談合作意向時,對方表示他們的審查員閱讀中文專利文獻相當困難,可否提供英文的翻譯數據?

在當時大量的專利文獻只能夠靠人工翻譯來完成,成本高且效率低,因此中國國家知識產權局開始考慮研發一套專利文獻機器翻譯系統,並將此重任交給了知識產權出版社。

無技術、無人才是當時面臨的兩大困難,因此知識產權出版社將機器翻譯列爲當年的重點研發項目,組建了一支由專家牽頭的機器翻譯專業研發團隊,開啓了自主研發機器翻譯技術的發展之路。但在之後的很多年裏進展都並不太順利,技術長期落後於國際大公司。

“狼”來了?沒錯,專利文獻翻譯領域的“狼”來了

但是在2011年出現了轉機,知識產權出版社從中國科學院計算機語言信息工程研究中心"挖"來了機器翻譯領域的頂級專家張孝飛,在知識產權出版社成立科技文獻機器翻譯研究院後,由張孝飛擔任副院長帶領研究團隊不斷調整技術路線、完善技術方案,終於使科專笑飛的準確率穩定在了70%。

然而上面的領導卻表示準確率達不到80%沒有實用價值。達不到90%就沒有市場競爭力。

在技術攻關的關鍵時刻,科技文獻機器翻譯研究院院長諸敏剛親自參與指導,加強對機器翻譯的支持力度。諸敏剛熟悉日語、英語、德語多種語言,又瞭解專利申請文件的撰寫方式,這使得他很容易發現專利文獻翻譯的難點和痛點。爲此諸敏剛找出一些較難翻譯的專利文獻進行多次試驗,一旦發現問題立即與研發人員進行討論和改進。經過多次調整技術方案後準確率終於達到了90%以上,並於今年"4·26"世界知識產權日期間正式發佈。

“狼”來了?沒錯,專利文獻翻譯領域的“狼”來了

那麼經過半年的推廣和實踐,科專笑飛的實際效果如何?

據數據顯示科專笑飛10秒鐘可翻譯1萬字,日漢互譯的準確率接近98%、英漢互譯準確率接近95%、德漢互譯準確率接近90%。

科專笑飛翻譯的專利文獻質量已達到國際領先水平,其 BLEU值(國際上評價機器翻譯質量的一種經典方法)已經超越谷歌公司等多家行業巨頭,目前已有超過1500名審查員使用該系統,累計翻譯次數超過5萬人次。10餘家知識產權服務機構和企業開始使用,並有30餘家明確表達了簽約意向……

國家知識產權局專利局實用新型審查部審查員此前一直使用谷歌翻譯等工具,但由於操作流程複雜時間成本較高。自今年5月開始使用科專笑飛之後,審查員翻譯專利申請文件的效率明顯提升,翻譯完成能快速理解專利申請文件內容。

除審查員外,知識產權服務機構和企業是科專笑飛的另一大使用羣體。目前知識產權出版社已與中國國際貿易促進委員會專利商標事務所、商湯科技、法國Questel數據服務公司等10餘家服務機構及企業簽署了合作協議,並與美國高通、日本佳能等30餘家企業達成明確簽約意向。

"科專笑飛不僅能把專業性很強的詞彙翻譯得非常準確,還翻譯得非常流暢,更符合專利文本的表述習慣。使用該系統翻譯後的譯文基本不需要再進行較大幅度的修改,便可直接使用。"使用者表示,在翻譯過程中能感覺到科專笑飛對系統和算法所進行的優化,使之更符合科技術語和技術文件的表達習慣。

未來知識產權出版社將不斷提高機器翻譯質量,並繼續保持世界一流,打造具有國際競爭力的品牌,爲大專院校、科研人員閱讀理解專利文獻提供幫助,爲審查員縮短審查週期、提高審查效率做出貢獻,爲國家知識產權事業發展做出貢獻。

相關文章