俗話說,有人的地方就有江湖,就會充斥着各種立場和利益糾紛。科研領域亦如此,機器學習社區近來掀起來的一系列關於種族偏見的熱議就是鮮活的例證。我們先回顧一下這件事情的來龍去脈:

大約一週前,杜克大學提出了一種將高糊人臉照片轉換成清晰面部圖像的  PULSE 方法 ,但意外的是,研究中的一張生成圖像掀起了衆議,人們紛紛指責該方法存在種族偏見。

輸出後的奧巴馬變成了「白人小夥」。

之後,圖靈獎得主、Facebook 首席 AI 科學家 Yann Lecun 也因自己對此事的評價而遭到網友的口誅筆伐,最後不得不宣佈 退出推特

那麼問題來了,此次事件是否反映了機器學習社區對技術或數據持有明顯的偏向性態度呢?除此之外,機器學習社區還存在着哪些痼疾以及新出現的壞現象呢?

今日,reddit 用戶 yusuf-bengio 發帖總結了當前機器學習社區存在的 8 大「毒瘤」,內容涉及同行評審、盲目學術崇拜、 多樣性、過度重視頂會論文發表以及學術攻訐等,引發了網友的熱議。

我們先來看下這些問題的具體內容。

ML 社區的 8 大「毒瘤」

首先,同行評審的規則被打破。有四分之一的 NeurIPS 提交論文都被放到了 arXiv 上。DeepMind 的研究者公開質疑批評他們提交論文至 ICLR 的審稿人。最重要的是,儘管審稿人認爲應該拒收論文,放在 arXiv 上的知名機構提交的論文還是被頂會接收了。相較之下,AC 卻否決了一些評分很高的論文。

第二點,存在復現危機。在測試集上調整超參數似乎是目前的實踐標準了。沒有打破當前 SOTA 紀錄的論文沒有機會被較好的學術會議接收。因此很多研究只是對超參數進行調整以及提出一些細微的技巧,使其看起來存在性能增益,但實際上並沒有。

第三點,存在盲目的學術崇拜。與斯坦福、DeepMind 這些頂級機構有關的論文都會得到高度讚譽,即使並沒有什麼重大突破。比如,BERT 被引用的次數是 ULMfit 的 7 倍。谷歌的從屬關係爲論文提供瞭如此多的信譽和曝光度。每次 ICML 會議,無論研究內容是什麼,DeepMind 的 poster 都會吸引很多人。同樣的事情還發生在 ICLR 2020 在 Zoom 上舉辦的虛擬會議上。

此外,即使都是機器學習頂會,但 NeurIPS 2020 的論文提交量卻是 ICML 的兩倍。爲什麼會如此?爲什麼 “neural” 這個詞如此受歡迎?還有,Bengio、Hinton 和 LeCun 確實是深度學習的先驅,但是稱呼他們爲 AI“教父”就太瘋狂了。這實在是種過度崇拜。

第四點,雖然 Yann LeCun 談論偏見和公平性的方式顯得有點事不關己,但他遭受的口誅筆伐也超出了合理的範疇。讓 LeCun 或者其他人閉嘴解決不了任何問題。

第五點,機器學習和計算機科學社區普遍存在着嚴重的「多樣性」問題,其中最明顯的就是教授和學生中的男女比例問題。女性在博士或博士後期間休育嬰假常常意味着其學術生涯的結束。並且,這種「多樣性」的缺乏又經常被濫用,成爲某些人免受任何批評的藉口。將學術探討中的每個負面評論歸咎於種族和性別會營造不良的學術氛圍。人們越來越害怕被他人看作「種族主義者」或「性別歧視者」,這反過來又加劇了這種「多樣性」問題。

第六點,爲其他人隨意扣上道德倫理喪失的帽子。近期以來,美國國內的政治和種族抗議活動主導了一切學術討論。

第七點,社區存在着一種殘酷的「不發表,就發臭」的心態。如果你每年不能發表 NeurIPS 或 ICML 等學術會議論文,就會被稱爲「失敗者」。此外,研究團隊的規模變得越來越大,有時 PI 甚至叫不全手底下博士生的名字。有的研究者癡迷於投頂會論文,每年甚至提交數十篇論文。這太可怕了。寫論文的唯一目標變成了在簡歷上添加一筆頂會接收論文的經歷,所有的一切都變得很功利。在提交論文時,質量是次要的,想法設法通過同行評審成爲了主要目的。

第八點,學術探討變得粗暴無禮。舉例來說,Schmidhuber 稱 Hinton 爲「小偷」,Gebru 稱 LeCun 爲「白人至上主義者」,Anandkumar 稱 Marcus 爲「性別歧視者」。大佬之間尚且相互攻訐,這終歸不利於構建健康和諧的機器學習環境。

所以,我們是否可以停止妖魔化持有不同觀點的人,允許不同觀點的存在,不要吹毛求疵。如果我們僅僅因爲觀點不同而強迫他們閉嘴,那恐怕也宣告了科學和社會進步的終結吧!

不止 ML 社區,其他領域亦是如此

上文提到的這些「毒瘤」的確存在,也不可避免地對機器學習社區的學術氛圍產生了負面的影響。網友對這些問題持什麼態度呢?點贊最多的便是第三點的學術盲目崇拜現象。

網友表示,一些不知名學者的有趣研究雖能引起注意,但評論的人卻少之又少;與之相比,機器學習名人的一篇推特卻能有數百條評論。這種現象恐怕不利於新研究或技術的推廣和持續發展。

還有網友提到了其他社區,如物理社區,稱這類社區或許不像機器學習社區那樣充斥着攻訐和分裂。他表示,機器學習固然存在着廣泛的社會影響,但人們將他們的政治理念強加在自身的研究上是多麼的荒謬。

但這位網友的觀點遭到了其他人的反駁,表示物理、數學、邏輯和哲學等其他領域恐怕亦是如此。

對此,你有什麼看法?

參考鏈接:https://www.reddit.com/r/MachineLearning/comments/hiv3vf/d_the_machine_learning_community_has_a_toxicity/

相關文章