一場科技競賽正在美國硅谷上演。

5月15日,谷歌舉辦了2024年I/O開發者大會,AI是全場的主題,谷歌CEO桑達爾·皮查伊和他的同事們發佈了Gemini 1.5 Pro的新版本,在100萬Tokens的窗口能力上,進一步擴大至200萬Tokens,它們的最終目標是無限上下文。

谷歌還展示了新的搜索產品,比如從本週開始,谷歌搜索引擎將在美國推出“AI概覽”(AI Overviews)的功能,搜索引擎會直接歸納總結搜索結果。此外,谷歌還推出了新的TPU,第六代TPU芯片Trillium,較上一代芯片的算力表現翻4.7倍。

就在這場發佈會前一天,OpenAI舉行了春季發佈會,發佈最新GPT-4o多模態大模型,相較於GPT-4 Trubo速度更快、價格也更便宜。接下來的一個月裏,硅谷還將迎來兩家科技巨頭的重磅大會——5月21日左右,微軟將舉行Build年度開發者大會;6月10日左右,蘋果將舉辦全球開發者大會。一場有關AI的大比拼在大洋彼岸開賽。

伴隨着OpenAI的崛起,以及谷歌在AR眼鏡等失利,外界一度評價谷歌已經成爲一家爲“賺錢”打造的機器,失去了創新激情。

不過,谷歌仍然擁有谷歌搜索、YouTube、雲服務、Gmail、Android以及自動駕駛Waymo等業務,僅YouTube就有20億月活用戶,Android也擁有20億月活用戶,可以說,谷歌掌握着全球最多的用戶場景、數據以及設備接口。

谷歌發佈更新產品後,谷歌-C股價微漲0.6%,收盤價爲171.93美元,市值2.12萬億美元,股價較2024年開年上漲了23%。

在剛剛過去的財季,谷歌展現出強有力的競爭力。2024年第一季度,谷歌實現營收805.39億美元,同比增長15%,非美國通用會計準則下淨利潤爲236.62億美元,同比增長57%。

谷歌艱難守陣地

大會一開場,皮查伊就介紹說,現在已經有超過150萬開發者正在使用谷歌的原生多模態大模型Gemini。Gemini在2023年12月上線,它被認爲超過了GPT-4。

皮查伊宣佈,Gemini 1.5 Pro向全球所有開發者開放,並支持200萬Tokens的Gemini 1.5 Pro模型的預覽,他們的目標是“無限上下文”。

此次開發者大會,谷歌着墨最多的是搜索,這是谷歌的起家業務,現在谷歌要重新定義搜索,它要把搜索做成多輪對話的推理,用戶只需要問就可以了。

皮查伊以“重新定義搜索”的架勢,連續上線多款基於Gemini的產品,比如總結谷歌搜索引擎結果的“AI概覽”功能,支持用戶存儲圖片的AI搜索Ask Photos。

以練瑜伽爲例,谷歌會幫用戶找到排名更靠前的工作室,並介紹他們的服務,可以看到每個門店的距離。谷歌搜索會把更大的問題分解成各個部分的問題,比如排名、評論、營業時間以及其他更多的研究。

但“重新定義搜索”的最大主動權可能不在谷歌手裏,而在OpenAI這邊。今年年初有傳言說,OpenAI計劃上線AI搜索業務,不過在5月14日OpenAI的發佈會上,並沒有展現該業務,這可能與算力成本有關係。

成熟大公司對待創新公司的崛起仍然毫無辦法。對標OpenAI,谷歌仍在努力顯示自己的存在。

在此次發佈會上,谷歌還展示了一個名爲Astra的項目,這是谷歌開發的通用人工助理,在演示視頻中,Astra通過手機攝像頭能識別真實環境中的物體,實現了能看、能說、能聽。這與前一天OpenAI上線的GPT-4o功能類似,都實現了人機交互的新形式。但谷歌似乎不滿足於此,Astra更強調指向人、機器與現實世界的三重交互。

大模型最大的挑戰是解決響應時間的問題。谷歌介紹說,它們在Gemini模型的基礎上,開發了通過連續編碼視頻幀,更快地處理信息的代理,同時,將視頻和語音輸入組合到事件的時間線中,捕捉並有效記憶。這些代理可以更好地理解用戶所處的環境,並在對話中快速響應,使交互的速度和質量更加自然。

Gemini也將支持語音實時交互,同時今年晚些時候還將上線實時視頻交互功能。未來幾個月內,谷歌也將推出類似於GPTs的自定義AI助手Gems。它將能與“谷歌全家桶”進行交互。

“Gems易於創建,它們可以充當你的瑜伽閨蜜、你的私人副主廚、聰明的微積分導師、代碼的同行評審員。”谷歌的相關負責人說。

谷歌發佈會上還宣佈了安卓生態的AI新進展,今年晚些時候,能夠在本地運行的多模態Gemini Nano模型將登陸Pixel手機,它更智能,更注重隱私保護,比如,如果用戶接到詐騙電話,將會提醒用戶。

如果沒有OpenAI,上述谷歌的創新技術可以稱得上可圈可點,但奈何“既生瑜,何生亮”。

硅谷科技競賽升級

在發佈會上,谷歌只提到一家科技大公司,那就是英偉達。皮查伊發佈了第六代TPU(張量處理器,谷歌爲機器學習定製的專用芯片)芯片Trillium,較上一代芯片的算力表現翻4.7倍,TPU是谷歌自己研發的GPU芯片。

同時,皮查伊說,谷歌雲將在2025年初,用上英偉達的最新Blackwell架構GPU。在過去數年,谷歌投資了200萬英里的地面和海底光纖。

今年3月,英偉達發佈了基於“Blackwell”架構的B100芯片與B200 GPU加速器,英偉達創始人黃仁勳說,這是迄今爲止,英偉達最強大的GPU芯片,在生產出首批服務器之後,黃仁勳將一臺服務器送給了OpenAI。

GPU在過去一年多時間成爲堪比黃金的硬通貨,各大科技公司不得不排隊數月來等貨,這讓黃仁勳成爲硅谷最受歡迎的CEO,人們爭相排隊和他見面,英偉達也是所有科技公司的合作伙伴。

而在GPU大熱的背後,硅谷正在進入新一輪的科技競賽。

2022年底,OpenAI發佈ChatGPT開始,整個硅谷進入亢奮狀態,這裏甚至誕生了AI一條街,五六個人就可以組建一個公司,依靠一個想法獲得融資,比如斯坦福博士生郭文景和同學創辦的Pika,短短數月間就完成5500萬美元融資,並推出了視頻生成器Pika1.0。

科技巨頭之間的關係變得異常緊張,主要是AI重構了邊界,大公司重新變得野心勃勃:

微軟重新盯上了搜索,扶持Bing發展;Meta向第三方硬件製造商開放VR頭顯操作系統Meta Horizon OS,進一步蠶食蘋果生態;爲應對OpenAI的崛起,蘋果不得不放棄數十年的造車計劃,集中資源搞AI。

進化以羣體聚集的形式在硅谷上演,大公司你追我趕,它們之間的合縱連橫也讓AI競賽變得複雜。

蘋果公司計劃和OpenAI合作,將OpenAI的技術引入iPhone之中,但微軟是OpenAI的最大出資方;谷歌正和OpenAI酣戰,支持其開源系統Android的AI進化,以展開和蘋果iOS系統之間的競爭。

席捲全球的這次科技競賽浪潮頗有點20世紀七八十年代硅谷的意味。那時,原生技術層出不窮,1968年,英特爾成立;1969年,AMD成立;1976年,喬布斯創辦蘋果電腦;1977年,甲骨文成立;1984年,思科公司成立。

只不過,50年前,是芯片等硬件造就了創業潮,創造了財富;現在,AI以及產品化則是最新的動力。

在AI時代,中國互聯網同樣也迎來了新發展機會,但正如大部分中國AI創業者所說,雖然一家又一家公司會在這次浪潮中轉型甚至退場,但是千萬不要低估中國創業者的生命力。

本文來自微信公衆號“中國企業家雜誌”(ID:iceo-com-cn),作者:閆俊文,編輯:李薇,36氪經授權發佈。

相關文章