雪花新聞

搜索大變天!谷歌推出Bard對抗ChatGPT,打響保衛戰

新的變革已經到來

硅星人 文| 油醋 VickyXiao 編輯| VickyXiao

面對ChatGPT的來勢洶洶,谷歌徹底慌了。

OpenAI發佈ChatGPT也不過是4個月之前。但是在這4個月裏,已經有不少預言,稱ChatGPT帶來的變革,將會顛覆谷歌的現有搜索產品和商業模式。

於是,谷歌CEO桑達爾·皮柴(Sundar Pichai) 開啓“戰備”狀態:先是在ChatGPT問世兩週內就拉起了“紅色警報”,然後創始人拉里·佩奇和謝爾蓋·布林時隔3年再度被緊急喚回。

今天皮柴更是在官網上稱,谷歌一直在研發一款名爲Bard的實驗性對話AI服務,今天起,谷歌將把它對信任的開發者開放,然後將在接下來的幾周內,把它向更廣泛的受衆開放。

谷歌終於加入了這場智能聊天機器人對搜索引擎發動的大戰。

01 谷歌宣戰

谷歌的第23號員工,Gmail的締造者保羅·布赫海特在2月1號發推悲觀表示,谷歌將會在一兩年內被徹底顛覆——當人們的搜索需求能夠被封裝好的、語義清晰的答案滿足,搜索廣告將會沒有生存餘地。而佔據全球接近84%搜索市場的谷歌,到現在仍然是一家50%營收直接來自搜索廣告的公司。

圖源:推特

眼看ChatGPT引起的戰火燒到了自家主場,谷歌終於反應過來,在今天宣佈推出類ChatGPT產品——一款實驗性的對話AI服務Bard。

皮柴在今天發出的博文裏稱,谷歌一直希望通過大語言模型,把這些深度研究和突破變成產品來幫助人們。兩年前,谷歌推出了大語言模型LaMDA,此後,谷歌就在LaMDA的基礎上,開發出了Bard。

今天,谷歌將先對信任的開發者開放這項服務,然後將在接下來的幾周內,把它向更廣泛的受衆開放。

谷歌強調,巴德會把世界上的信息知識和谷歌的大語言模型所帶來的能力和智能相結合,它會獲取網絡上的信息,來提供新鮮的、高質量的回覆。這意味着和ChatGPT受限於2021年以前的數據不同,巴德會是基於實時網絡數據的,谷歌將把它與LaMDA的輕量級模型版本一起發佈。

從博文裏的圖片來看,Bard也是和ChatGPT類似的聊天框形態,能做的事除了簡化複雜的主題,比如”向9歲的孩子解釋NASA的韋伯望遠鏡帶來的新發現“,還能幫助人們做一些複雜的任務,包括”計劃朋友的新生兒派對“、”比較兩部奧斯卡提名的電影“和”根據冰箱裏的食物給出一些午餐點子”等。

圖源:谷歌

在谷歌看來,這個小得多的模型需要更少的算力,從而可以擴展到更多的用戶,獲得更多的反饋。他們會將外部反饋與自己的內部測試相結合,以確保 Bard 的回答在質量、安全性和真實信息的基礎性方面達到高標準。谷歌希望通過這一階段的測試,來提高 Bard 的質量和速度。

皮柴還在博文裏稱,很快,谷歌還將很快在搜索中整合基於AI的功能。除了像ChatGPT一樣會將複雜的信息和多個視角提煉成易於理解的回答,谷歌還將進一步提供更多網頁信息的選擇。

不過,根據硅星人獲得的消息,Bard大部分由華人團隊開發,而且這次Bard的發佈有點趕,在內部算不上完全準備好,所以纔在現在以面向有限開發者的形式推出,而非像ChatGPT一樣,一開始便開放給大衆使用。

同時,谷歌內部對ChatGPT感到恐懼的另外一層原因,是人才的流失。和很多公司一樣,谷歌內部也採用賽馬制,有好幾個做類似模型的團隊,但內部其它大語言模型團隊向OpenAI流失人才的情況比較嚴重。

當然,不管內裏如何焦慮,皮柴至少在博文裏信心滿滿地宣佈,下個月,谷歌將開始讓個人開發者、創作者和企業嘗試自家的生成語言 API (Generative Language API),該 API 最初會由 LaMDA 提供支持,並有一系列模型可供選擇。“隨着時間的推移,我們打算創建一套工具和 API,讓其他人可以輕鬆地使用 AI 構建更具創新性的應用程序。”

與此同時,ChatGPT開發者OpenAI背後的金主微軟,也在緊鑼密鼓地想要把ChatGPT整合進自己產品中。

微軟正在與OpenAI洽談一筆100億美元的投資,並在年初傳出計劃將ChatGPT添加到自己的搜索引擎Bing中,搜索結果將首次顯示爲帶有信息來源的完整句子,這個新的版本會在3月左右發佈。

而就在皮柴的博文發出不久,微軟就宣佈,將在明天召開一場發佈會,主要就是關於微軟和OpenAI的合作,以及ChatGPT和微軟Bing搜索的整合。

與此前的危機都不同的是,這是谷歌的搜索根基在20多年後第一次受到挑戰。幾年以後“Google it.”會不會讓位給“ChatGPT it.”?這是讓人興奮的地方。Bing和百度們想追上谷歌,谷歌不想變成雅虎。

谷歌的搜索霸權會在今年被動搖嗎?

02 停滯的搜索

讓我們的目光先回到谷歌誕生之初。

拉里·佩奇和謝爾蓋·布林在千禧年前夕嗅到了互聯網繁榮在即與信息檢索陳舊邏輯之間的間隙,貫穿谷歌生命的算法Page Rank由此誕生。

20世紀90年代,互聯網僅僅是一個爲全球2%的人受用的先鋒概念。網絡資源匱乏,雅虎甚至以手工錄入的方式就足夠建立起最初的互聯網搜索概念。1995年Alta Vista出現,互聯網歷史上有了第一個全網頁內容的索引工具,後者第一次設計出爬蟲技術(web crawl),並在1995年8月完整完成了第一次網絡爬取。

圖源:源於網絡

但以Alta Vista爲首的搜索工具對搜索關鍵詞與索引結果之間的關聯分析仍然十分薄弱,這很大程度源於搜索工具最初的受用人羣。在互聯網普及之前,信息搜索只是服務於文獻查找的工具,其框架長久建立在學術圈以關鍵詞加權平均爲信息搜索基礎的邏輯上。

極度理性且表達精確的學術內容搜索邏輯並不適用於互聯網的信息抓取。反映在Alta Vista上,就是它能搜索到大量信息,但準確性卻非常低。

只有拉里·佩奇注意到了互聯網信息之間關聯性的利用潛力。

他將互聯網想象成一個多節點的矩陣,每一個網頁都是“點”,網頁之間的超鏈接關係則是“邊”。指向一個網頁的超鏈接越多,則這個網頁被判斷爲越重要,這個過程中每個網頁都可以找到統一標尺下的重要性參數。

圖源:推特

這個這是日後知識圖譜技術甚至圖計算的最初想象,也是算法作爲一種思維第一次進入搜索領域。

受制於互聯網的發展階段,雅虎和Alta Vista是不可能產生算法思維的,而Page Rank對Alta Vista的取代則成爲“搜索”歷史上最閃耀的時刻。

但至今關於“搜索”的所有變革,也在24年前Page Rank誕生那一刻就宣告結束了。

無論是2001年出現的百度,2009年出現的Bing(當然也包括使用Bing核心搜索技術的雅虎),都再也沒有逃出以Page Rank所建立起的邏輯框架,即把用戶的開放性問題轉換成互聯網信息圖譜上具有關聯性優先級的、一個更具體的選項擴列,再還給用戶去甄別。

2021年新興的搜索引擎You.com,最大的賣點僅僅是集成式的把推特等其他平臺的搜索結果分門類得納入到了信息搜索結果中,並且賦予用戶對於信息來源平臺一定的權重設計能力。

在搜索的發展停滯中,這樣一個“谷歌的挑戰者”就足夠獲得2000萬美元的種子輪融資。

中文互聯網世界裏沒有另一個綜合搜索引擎獲得長期繁榮,反倒是在移動互聯網信息孤島的壓迫下,微信和字節跳動提供的更垂直的搜索服務開始佔領百度的內容盲區。

類似You.com的搜索引擎短期內仍然不會在國內出現,這是百度遺憾的地方。而無論抖音搜索或是微信搜一搜,也都沒有從搜索技術效率上取代百度的野心。一個自有生態內的內容連接器角色已是這類垂直搜索服務的上限,這本質上是新的互聯網巨頭們適應各自商業邏輯所做的模式創新,而非技術創新。

所以抖音搜索們對抖音重要,對“搜索”卻不重要。

2002年加入谷歌並主導設計了後者日中韓文搜索算法的吳軍在2012年出版的《浪潮之巔》中這樣描述Page Rank:

“雖然今天Google和其他搜索引擎相比當初的Google已有了長足的進步,但是這種進步基本上屬於量變。搜索引擎領域迄今爲止的質變只有Page Rank取代Alta Vista那一次。”

這個判斷到現在仍不過時,直到ChatGPT帶着生成式搜索的面目出現。

03 未必顛覆一切

ChatGPT可以寫代碼、需求文檔甚至初步實現所有辦公軟件的AI化,但大部分人用不着這些——就像大部分搜索引擎的用戶只是簡單的提問,然後要一個答案。

於是撇開這些,ChatGPT與谷歌(或者百度)相比最大的優勢,是它可以——幾乎是畢其功於一役的——生成一個極高質量的首條信息結果。

康乃爾大學的研究人員曾經通過眼部追蹤實驗獲得了精確的谷歌搜索結果的用戶行爲分析。分析結果顯示,首條結果獲得了 56.38% 的搜索流量,第二條和第三條結果的排名依次降低,但遠低於排名第一的結果。

圖源:Search Engine Journal

這十分考驗ChatGPT生成內容的準確性,而這個大型語言模型背後是一個信息來源與即時性的黑盒。

由於ChatGPT的回答中並不展示信息來源,用戶目前無法從回答中分辨信息真僞。

在即時性上,ChatGPT無論是以頻繁增加標註數據並一次次重新對模型進行預訓練的方式,還是用Fine-Ture的思路來修改現成的訓練結果,都會遇到新的問題。前者是極大的算力成本,後者是新知識對原有知識的過度覆蓋隱患。

ChatGPT是搜索領域苦等的一次效率革命,被認爲是一種“導彈”對“弓箭”的降維打擊。但如果說Page Rank是算法邏輯第一次進入搜索領域,ChatGPT也並沒有背離這個技術原點。

ChatGPT的成功基於一場以1萬個英偉達V100 GPU支撐、用深度學習和人工智能對人類信息歷史反覆咀嚼的苦功。從這個角度上看,它仍然是漸進式的,並非一個完全的顛覆者。

而哪怕谷歌本身,也並不意外ChatGPT在技術層面所實現的東西,

去年開發者大會 I/O 上,谷歌展示了大語言模型LaMDA如何以冥王星作爲對話主體來與人進行交流,這種回答是即時生成的,並不是學習了大量預定義的結果。大語言模型LaMDA和多模態多任務模型MUM所表現出來的素質,意味着谷歌已經具備與ChatGPT相近的AI能力。

圖源:源於網絡

而讓皮柴感到緊張的是,ChatGPT在上線五天就成功吸引了超過100萬的用戶,這個數字在兩個月後漲到1億。

OpenAI做了第一個喫螃蟹的人,而大衆接受了它。

而一家市值超過1.4萬億美元的大公司註定比小型創業公司更保守。

谷歌人工智能負責人傑夫·迪恩在幾個月前對員工表示,倘若通過(ChatGPT)這樣的服務提供錯誤信息,會給谷歌帶來更大的“聲譽風險”。

谷歌的一位高級工程師曾在去年公開表示大語言模型LaMDA“有意識,有靈魂”,隨即被勒令停職。他在被停職的前一天把一些包含谷歌及其技術涉嫌宗教歧視的證據交到了一名美國參議員的辦公室。

種種困擾,讓谷歌即使有了大語言模型LaMDA,也無法輕易拋出一個可能會亂說話,又容易動搖自己商業化根基的聊天機器人。

但OpenAI可以冒這樣的風險。

這看起來就像曾經拉里·佩奇和謝爾蓋·布林在對雅虎所做的事。現在時隔多年再次因爲搜索業務現身谷歌硅谷辦公室所需要面對的,是一個神奇,卻仍然算力成本困擾籠罩,生成內容充滿漏洞的ChatGPT,兩人或許在OpenAI的莽撞中看到了曾經的自己。

1997年,拉里·佩奇和謝爾蓋·布林在買下google.com域名後,提着窮的叮噹響的西裝口袋爲谷歌找了一年的投資,最後終於在1998年遇到了斯坦福校友、太陽公司創始人安迪·貝託謝姆的一張10萬美元的支票。

今時已不同往日,根據CB Insights提供的市場情報,與生成式AI概念相關的初創公司已經達到250家以上,其中有接近7成已經拿到至少天使輪的融資,其中11%的公司已經走到B輪以上。在這衆多初創公司中,價值最高的就是OpenAI。

那張陳年的10萬美元支票打開了一扇互聯網搜索引擎的門,而人們現在對於ChatGPT的信心和期望,也幾乎是從那個成功的谷歌延續而來。

谷歌也在近日拿出了3億美元提前佈局與OpenAI的攻守戰。這筆投資給到了Anthropic——一家以前OpenAI核心員工爲骨幹,同樣做生成式AI,並且此前估值已高達50億美元的人工智能公司——換取了後者10%的股份,以及一個獨家雲提供商的身份。

此外,谷歌選擇對內部的類ChatGPT項目Bard壓下重注。

與ChatGPT不同的是,Bard在描述中可以涉及當下的時事,這意味着其可以解決ChatGPT所欠缺的信息即時性問題。

百度的“ChatGPT計劃”也將以生成式搜索的形式出現。目前在內部“高度機密”,甚至不可以被公開討論,最終這項會融入目前的百度搜索引擎中。

李彥宏在去年年底的一次內部講話中表示,AIGC和ChatGPT這些新的技術進展會變成什麼樣的AI產品,

仍然有很多不確定性,但這件事“百度必須做”。對於這個即將在下個月面世的項目,李彥宏給出的定位是“引領搜索體驗的代際變革”。

現在無論主動還是被動的,蝴蝶效應已起。

“搜索”這片已經平靜20多年的湖面,一顆石子久違地拋下了。

*參考資料:

《浪潮之巔》,吳軍

《百度將推出類似ChatGPT服務》,財經網

相關文章