作者 | 年素清
責編 | 王曉曼
出品 | 程序人生(ID:coder_life)

在很多人眼中,傑夫·迪恩(Jeff Dean)就是谷歌技術的代名詞,谷歌今天的強大離不開他的付出,他是MapReduce、BigTable、Spanner、TensorFlow 等谷歌衆多知名軟件的重要貢獻者,這些成果不僅奠定了他在谷歌的地位,也爲他在業界贏得了無數的崇拜者。

高中爲父親寫軟件


迪恩於 1968 年 7 月出生在美國夏威夷,他的父親是一位熱帶病學研究員,母親則是一名通曉六種語言的醫學人類學家,良好的家境往往意味着良好的教育環境。

讀小學時,迪恩和父親共同對一臺 IMSAI 8080 計算機進行編程探索,他們將升級程序焊接在機器上,並深入研究了這臺設備的構造和運行原理。

因爲父親的職業緣故,他們不得不經常搬家。十三歲時候的迪恩提前結束了自己八年級的學業,隨父母一同來到索馬里西部的某難民營。

迪恩在讀高中時,曾爲父親和其同事們編寫了一款叫做“Epi Info”的程序,用於收集病理相關的數據,後來這款軟件成爲流行病專家們在野外工作的標配工具,推出了十幾種語言的版本,用戶數量達十幾萬。

1990年,迪恩以最優等的成績從明尼蘇達大學計算機與經濟學系取得學士學位。 之後進入華盛頓大學,攻讀計算機科學博士學位。 在此期間,他曾爲世界衛生組織的愛滋病全球方案開發軟件,在HIV傳播的統計建模、預測和分析,取得了良好的成效。

谷歌的黑科技


1996年,博士畢業後的迪恩進入DEC公司的Western Research Lab工作。三年後,迪恩跳槽加入創期的Google。從1999年至今,迪恩在谷歌的主要工作成就包括設計並部署了Google廣告、抓取、索引和查詢服務系統的大部分內容,以及位於Google大部分產品下方的各種分佈式計算基礎架構,同時他也是Google新聞、Google翻譯等產品的開發者。他發起創辦了Google大腦,並一手打造了目前全球份額第一的深度學習框架平臺TensorFlow。

雖然目前官方給他定義的職位是“Google高級研究員”,但谷歌內部所有的員工都知道,他在Google的地位僅次於兩位創始人拉里•佩奇(Larry Page)和謝爾蓋•布林(Sergey Brin)。

Google作爲全球知名的科技巨頭企業,不乏各種黑科技,但業界稱谷歌最大的黑科技就是迪恩,他是整個公司唯一受到全體程序員崇拜的人。

主導開發出MapReduce


在迪恩的谷歌職業生涯中,他總共設計並主導實施了谷歌基礎架構五次更新換代,其中規模最大的一次升級在2003年,由他與同事桑賈伊·馬沃特(Sanjay Ghemawat)共同完成。

在開始升級前,他們發現每次解決一個重要問題,所面向的都是在無數計算機上協同運行,因此只有對解決方案進行全面推廣,才能避免一次又一次重複面對同樣的問題。他們需要創建一款工具,確保谷歌公司的每一位程序員都能夠利用其運行數據中心內的機器。

最終,他們花費了四個月的時間編寫出了一種面向大規模數據處理的並行計算模型——MapReduce。

在接下來的一年裏,迪恩與馬沃特以 MapReduce 任務的形式重寫了谷歌的爬取與索引系統。當其他工程師意識到 MapReduce 的強大作用後,他們也開始利用它來處理視頻,並在谷歌地圖上渲染圖塊。由於MapReduce可以普遍應用於很多大規模數據的計算問題,不久之後,Google公司內部進一步將其廣泛應用於很多大規模數據處理問題,很快有上萬個各種不同的算法問題和程序都使用MapReduce進行處理。

MapReduce的推出給大數據並行處理帶來了巨大的革命性影響。2004年,Google公司在國際會議上發表了一篇關於MapReduce的論文,公佈了Google的MapReduce的基本原理和主要設計思想,這爲後來“Hadoop之父”道格·卡廷(Doug Cutting)設計出大數據處理框架Hadoop提供了重要的技術支持。可以說,沒有MapReduce,就沒有大名鼎鼎的Hadoop。

力排衆議引進神經網絡


迪恩在讀本科時,就已經能夠用C語言爲神經網絡編寫並行計算的代碼,他有關神經網絡的畢業論文被評爲最優等本科論文,至今仍保存在明尼蘇達大學的圖書館中。但在那個時候,學者們對神經網絡的研究僅限於理論,還無法使用它來解決真實世界中的問題。

2011 年,全球雲計算悄然興起,迪恩認識了來自斯坦福大學的計算機科學教授吳恩達,後者正在谷歌負責領導一個關於神經網絡研究的項目“Project Marvin”。吳恩達告訴迪恩,斯坦福大學的研究人員們發現向神經網絡提供大量數據之後,即可獲得一系列意想不到的結果。吳恩達認爲,在谷歌龐大的業務規模支撐之下,神經網絡將在實用性層面有所提升,意義非凡。

本科畢業已過去近二十年,迪恩對於神經網絡的知識早已生疏,於是他決定每週拿出一天的時間來重溫相關的技術知識。

當時,公司內部有很多人對這項技術持懷疑態度。時任谷歌高級副總裁艾倫點尤斯塔斯(Alan Eustace)說道:“這簡直是在浪費人才。”就連他之前的搭檔馬沃特也對迪恩的舉動無法理解,他勸誡迪恩說:“你的工作在於管理基礎設施,而不是把時間浪費在那些沒用的東西上!”

但迪恩不爲所動,他後來一手主導了深度學習項目“谷歌大腦”的創立。

主導TensorFlow 的完成


2012 年,迪恩、吳恩達及格雷格·科拉多(Greg Corrado)三人合作進行了一場試驗:將 1.6 萬個處理器相連接創建出了全球最大的中樞網絡系統,自主學習 1000 萬張圖片後,在 YouTube 視頻中成功認出了貓的圖像。這個試驗結果轟動一時,迪恩激動地說:“在訓練中我們從沒說過這是一隻貓,從本質上,它發明了‘貓’這個概念。”

在接下來的幾年時間裏,谷歌大腦團隊開發出了遠超以往最佳方案的機器翻譯以及語音與圖像識別神經網絡。最終,這些神經網絡模型取代了谷歌最重要的搜索結果排序與定向廣告算法,這也使得谷歌大腦團隊成爲公司內增長速度最快的部門之一。

有位谷歌的資深工程師說道,迪恩的參與標誌着谷歌內部人工智能開發工作的歷史性轉折點,“當時有人相信神經網絡,也有人不信,但迪恩證明了它確實有效。”

爲了簡化和重構相關的代碼庫,使其變成一個更快、更健壯的應用級別代碼庫,迪恩率領團隊合力研發出了TensorFlow。TensorFlow 極大降低了將神經網絡分配至多臺計算機的門檻,從而將大量計算設備視爲統一的龐大主腦。

2015 年,TensorFlow 正式推出,很快成爲人工智能領域的客觀標準。谷歌 CEO桑達爾·皮查伊(Sundar Pichai)驕傲地宣佈谷歌是一家“AI 優先”的企業,並任命迪恩領導公司內的所有 AI 開發項目。

充滿仰慕之情的段子


因爲迪恩在計算機領域的卓越貢獻,他於2009年以41歲的年紀當選美國工程院院士。

然而,名譽頭銜時常有,用來表達敬佩之情的段子卻不是每個大佬都能擁有。圈內人都知道,網上有專門調侃迪恩的段子,多爲谷歌內部員工所作。這些段子有真有虛,但無一不是表達了他們對他如滔滔江水一般的敬仰之情。

相傳迪恩被Google面試時被問及如果P=NP意味着什麼,他回答說,“P=0 或者 N=1”。然後在所有的面試官還沒笑完之前,迪恩看了一眼Google的公共證書並在白板上寫出了對應的私鑰。

據說在2002年,有一次Google的索引服務器掛了,迪恩手工回答用戶的問題2小時,評估數據顯示期間搜索質量提高了5%。迪恩在斯坦福做演講的時候,來聽的人太多以至於著名的計算機大佬Don Knuth只能坐在地板上聆聽。

人們說編譯器從來不給迪恩編譯警告,而是迪恩警告編譯器。更瘋狂的是,有人說有迪恩咬了一隻蜘蛛,然後這隻蜘蛛獲得了超能力並掌握了C++。

看完大佬的故事,你是不是也想去咬他一口?

參考鏈接:

https://baike.baidu.com/item/迪恩%20Dean/6597840?fr=aladdin

https://blog.csdn.net/weixin_42137700/article/details/84934488

https://zhuanlan.zhihu.com/p/33047210

https://cloud.tencent.com/developer/article/1596757

#歡迎來留言#

對此,你怎麼看?

留言點贊數量最多的前三名

程序人生攜手【北京大學出版社】送出

《大型互聯網應用輕量級架構實戰》一本

截至7月28日12:00點

更多精彩推薦
☞成都一名程序員跳樓,程序員眼中的成都和天府軟件園
☞真香!如何用300行代碼寫完一個Spring基本框架?
☞微信停止服務印度用戶;阿里回應“馬雲遭印度法院傳喚”;fastjson 1.2.73 發佈 | 極客頭條
☞殘差網絡的前世今生與原理 | 贈書
☞觀點 | ETH 2.0 經濟模型分析報告簡述
☞推特驚爆史詩級漏洞,App 惡意竊取用戶隱私,雲端安全路向何方?
點分享點點贊點在看
相關文章