谷歌與OpenAI突然將焦點轉向AI智能助手

每經記者可楊每經編輯張海妮

不是萬衆期待的AI搜索，競爭焦點突然轉向了AI智能助手。

近期，OpenAI推出了全能模型GPT-4o，它能夠接受多種方式輸入的內容並生成相應的輸出內容，展示了毫秒級反應和多模態交互的新能力。與此同時，谷歌在其I/O開發者大會上展示了其AI助手Astra和旗艦大模型Gemini。

一些業內人士認爲，OpenAI此次並沒有達到市場預期的突破，而是將現有的技術進行了整合。此外，谷歌在AI搜索領域的佈局和創新，以及其在智能手機操作系統優化上的努力，顯示了其在AI領域的深厚積累和戰略佈局。

比賽行至白熱化階段，似乎已經告別了單純的技術競爭，更是應用和用戶體驗的競爭。當影響因素變得複雜，專注投入大模型前沿的OpenAI還有多大幾率成爲贏家？

突襲谷歌，OpenAI先一步公佈AI個人助理

預想之中圍繞AI搜索的“戰爭”沒有打響，焦點轉移到了AI智能助手上。

當地時間5月13日，OpenAI在谷歌I/O 開發者大會的前一天召開發佈會，發佈了最新產品GPT-4o，“o”即omni，意爲“全能”。OpenAI官網介紹，GPT-4o是邁向更自然人機交互的一步，因爲它接受文本、音頻和圖像的任意組合作爲輸入內容，並生成文本、音頻和圖像的任意組合輸出內容。

OpenAI首席技術官米拉·穆拉蒂在發佈會上表示，GPT-4o的速度比現有的GPT-4 Turbo快了兩倍，但成本僅爲其一半。GPT-4o可以實時對文本、音頻和圖像進行推理，響應時間幾乎達到人類水平。

在26分鐘的直播中，GPT-4o展示了其毫秒級反應、識別人類情緒進行音視頻交互，可多模態輸入/輸出等一系列新能力。與此同時，GPT-4o覆蓋桌面與App且完全免費向用戶提供。

而谷歌則在其I/O開發者大會上，展示了自身全能的AI能力，在會上連續發佈、更新了十多款產品，包括AI助手Astra、文生圖模型Imagen3、對標Sora的文生視頻模型Veo，以及旗艦大模型Gemini。

在谷歌的演示視頻中，使用AI助手Astra時，只要打開手機攝像頭，對準任意物品，AI可以準確說出物品的名稱。只要將手機攝像頭對準某個物體，Gemini就可以識別它，比如一個紅蘋果，還可以回答諸如“鏡頭中什麼東西是可以發聲的”這種問題。

此外，谷歌方面表示，夏季將擴展Gemini的多模態功能，包括增加用語音進行深入雙向對話的能力，該功能被稱爲Live。通過GeminiLive，用戶可以與Gemini交談，並可以從各種自然的聲音中選擇它回應的聲音。用戶甚至可以按照自己的節奏說話，或者在回答過程中打斷並澄清問題，就像在任何人類對話中一樣。

據彭博社報道，近日，蘋果公司被曝正與OpenAI敲定一項協議，今年將後者的部分技術引入iPhone。而在本次發佈會上，谷歌產品管理副總裁Sameer Samat明確表示，谷歌將通過Gemini進一步優化安卓操作系統。這種優化將首先在谷歌自家手機Pixel上得到體現。

GPT-5缺席，OpenAI降速？

對於OpenAI的突襲更新，行業不再是統一的讚歎。“發佈會雖然驚豔，但谷歌看完應該是不慌了。”獵豹移動董事長兼CEO、獵戶星空董事長傅盛在其個人微博表示。

在5月14日發佈的短視頻中，傅盛談及“所有國內人工智能從業者都在熬夜等着大洋彼岸放‘核彈’，但是沒想到‘核彈’沒有放，卻掏出了一堆‘摔炮’”。他表示，讓人失望的是這次OpenAI沒有發佈GPT-5.0，連GPT-4.5也沒有看到，反而是發佈了GPT-4o，“就是把一系列的引擎給結合在一起，比如圖片、文字、聲音，這樣你就不需要來回去切換了”。

不過，傅盛後續也表示：“OpenAI這次爲了能夠讓更多的用戶使用它，可以說是鉚足了勁，一系列的應用，API降價，GPT免費。我們當然希望OpenAI能夠使得這個行業更好發展，我們也能認真地去學習，這次的發佈會真正告訴我們應用大有可爲，所有人都應該努力。”

“GPT-4o出來，又比原來進步一大截，它（OpenAI）每次一升級就會‘死’一些公司，這次一些做GPT實時語音交互的團隊，直接可以宣佈解散了。”GPT-4o發佈的第二天，一名大模型行業創業者對《每日經濟新聞》記者感嘆道。

清華大學新聞學院元宇宙文化實驗室主任瀋陽同樣在第二天試用了GPT-4o，在其發佈的視頻號中提到，在文生圖層面，GPT-4o在毛髮細膩度、光影效果等細節上更加優異。

隨着雙方在智能助手上的對碰，瀋陽認爲，當前的競爭格局已經更加明晰，谷歌正在進一步推其基於Gemini的AI助手，蘋果公司與OpenAI也初步達成了合作，將在蘋果手機上搭載ChatGPT。

瀋陽表示，以本次發佈會作爲轉折點，ChatGPT被改造成了靈魂伴侶，所以產業格局已經明晰了，就是蘋果用內置的ChatGPT對抗谷歌Gemini的手機助手。Meta也將上線基於Llama的手機助手。對於產業來說，AI助手有望從1億量級的用戶量走向10億量級。

“GPT-4o，發佈的時候我覺得它很強大，但如今我覺得谷歌最新的產品也完全把它的這些成績趕上了，我覺得後面OpenAI應該更加緊張，因爲應用公司、超級大平臺公司全部趕上來了，它的優勢越來越少。”順福資本創始人、行行AI董事長李明順對《每日經濟新聞》記者表示，目前來看OpenAI的用戶增長已經不太明顯，技術領先和成本優勢都不一定是最佳，與此同時，強應用時代越來越快到來，在這個背景下，谷歌這次把它所有的應用與大模型集合在一起，形成了更強的用戶依存度，還是更勝一籌。

在李明順看來，下個階段，美國的平臺應用公司，包括微軟、蘋果、戴爾，以及中國的騰訊、字節、阿里都會陸續結合自身的應用與大模型能力，推出超級應用，逐步邁向綜合競爭時代，靠一個大模型打江山將更難。

搜索之爭未竟，谷歌反“圍剿”OpenAI

喫下巨頭的“蛋糕”沒有那麼容易。發佈會前，市場充斥着OpenAI圍繞搜索佈局的煙霧彈，有報道稱，OpenAI很可能推出基於ChatGPT技術的新搜索引擎。與此同時，名爲“GPTSearch”的網頁已經上線，但目前只有會員才能訪問。知名記者PeteHuang此前發推特預告，表示GPTSearch將在5月9日正式上線。

最終在這一輪交手中，谷歌守住了陣地。谷歌首席執行官桑達爾·皮查伊（Sundar Pichai）在演講中提到，Gemini帶來的最令人興奮的變革之一是在Google搜索中，“我們最大的投資和創新領域之一是我們的創始產品——搜索”。

從發佈會看，谷歌已經率先將AI能力與其搜索引擎相結合。谷歌方面宣佈，能夠總結谷歌搜索引擎結果的“AI概覽”（AI Over-views）功能，將於本週在美國推出。在這一功能中，谷歌將向用戶展示AI生成的答案。

據谷歌介紹，AI概覽是爲了響應較複雜的搜索，幫助用戶尋求解決方案。例如，當人們搜索素食準備或出行計劃時，AI提供的答案會出現在搜索頁面頂部。

谷歌還提升了搜索的視覺功能，支持通過視頻提出問題。在I/O 開發者大會上，谷歌演示了當面對唱片機故障時，用戶可以一邊拍攝視頻一邊提問，通過新搜索得到包括修理步驟和資源在內的AI概覽。

儘管在智能助手層面先一步狙擊谷歌新品，但對於市場期待的搜索產品，這項自GPT-3.5發佈以來就被寄予厚望的革命性功能，卻在一陣又一陣煙霧彈後，依舊未見進一步動作。在搜索市場，谷歌的基本盤依舊穩固，與此同時其全面的AI能力正在對競爭對手隱隱形成包圍之勢。

與巨頭爭奪領地的另一面，對於OpenAI而言，內憂隱患猶在。

就在GPT-4o發佈一天之後，消失在大衆視線很久的OpenAI聯合創始人、首席科學家Ilya Sutskever官宣離開OpenAI。去年11月，OpenAI管理層發生動盪，Sutskever被認爲是這場風波背後的推手。不久前，OpenAI創始成員之一Andrej Karpathy也在Sora發佈前夕離職。

在這場全新的技術革命中，隨着競爭的重點由大模型技術轉向應用側，以“黑馬”姿態一度引領方向的OpenAI開始降速，新的轉折點也許已經出現。