每經記者 可楊    每經編輯 張海妮    

不是萬衆期待的AI搜索,競爭焦點突然轉向了AI智能助手。

近期,OpenAI推出了全能模型GPT-4o,它能夠接受多種方式輸入的內容並生成相應的輸出內容,展示了毫秒級反應和多模態交互的新能力。與此同時,谷歌在其I/O開發者大會上展示了其AI助手Astra和旗艦大模型Gemini。

一些業內人士認爲,OpenAI此次並沒有達到市場預期的突破,而是將現有的技術進行了整合。此外,谷歌在AI搜索領域的佈局和創新,以及其在智能手機操作系統優化上的努力,顯示了其在AI領域的深厚積累和戰略佈局。

比賽行至白熱化階段,似乎已經告別了單純的技術競爭,更是應用和用戶體驗的競爭。當影響因素變得複雜,專注投入大模型前沿的OpenAI還有多大幾率成爲贏家?

突襲谷歌,OpenAI先一步公佈AI個人助理

預想之中圍繞AI搜索的“戰爭”沒有打響,焦點轉移到了AI智能助手上。

當地時間5月13日,OpenAI在谷歌I/O 開發者大會的前一天召開發佈會,發佈了最新產品GPT-4o,“o”即omni,意爲“全能”。OpenAI官網介紹,GPT-4o是邁向更自然人機交互的一步,因爲它接受文本、音頻和圖像的任意組合作爲輸入內容,並生成文本、音頻和圖像的任意組合輸出內容。

OpenAI首席技術官米拉·穆拉蒂在發佈會上表示,GPT-4o的速度比現有的GPT-4 Turbo快了兩倍,但成本僅爲其一半。GPT-4o可以實時對文本、音頻和圖像進行推理,響應時間幾乎達到人類水平。

在26分鐘的直播中,GPT-4o展示了其毫秒級反應、識別人類情緒進行音視頻交互,可多模態輸入/輸出等一系列新能力。與此同時,GPT-4o覆蓋桌面與App且完全免費向用戶提供。

而谷歌則在其I/O開發者大會上,展示了自身全能的AI能力,在會上連續發佈、更新了十多款產品,包括AI助手Astra、文生圖模型Imagen3、對標Sora的文生視頻模型Veo,以及旗艦大模型Gemini。

在谷歌的演示視頻中,使用AI助手Astra時,只要打開手機攝像頭,對準任意物品,AI可以準確說出物品的名稱。只要將手機攝像頭對準某個物體,Gemini就可以識別它,比如一個紅蘋果,還可以回答諸如“鏡頭中什麼東西是可以發聲的”這種問題。

此外,谷歌方面表示,夏季將擴展Gemini的多模態功能,包括增加用語音進行深入雙向對話的能力,該功能被稱爲Live。通過GeminiLive,用戶可以與Gemini交談,並可以從各種自然的聲音中選擇它回應的聲音。用戶甚至可以按照自己的節奏說話,或者在回答過程中打斷並澄清問題,就像在任何人類對話中一樣。

據彭博社報道,近日,蘋果公司被曝正與OpenAI敲定一項協議,今年將後者的部分技術引入iPhone。而在本次發佈會上,谷歌產品管理副總裁Sameer Samat明確表示,谷歌將通過Gemini進一步優化安卓操作系統。這種優化將首先在谷歌自家手機Pixel上得到體現。

GPT-5缺席,OpenAI降速?

對於OpenAI的突襲更新,行業不再是統一的讚歎。“發佈會雖然驚豔,但谷歌看完應該是不慌了。”獵豹移動董事長兼CEO、獵戶星空董事長傅盛在其個人微博表示。

在5月14日發佈的短視頻中,傅盛談及“所有國內人工智能從業者都在熬夜等着大洋彼岸放‘核彈’,但是沒想到‘核彈’沒有放,卻掏出了一堆‘摔炮’”。他表示,讓人失望的是這次OpenAI沒有發佈GPT-5.0,連GPT-4.5也沒有看到,反而是發佈了GPT-4o,“就是把一系列的引擎給結合在一起,比如圖片、文字、聲音,這樣你就不需要來回去切換了”。

不過,傅盛後續也表示:“OpenAI這次爲了能夠讓更多的用戶使用它,可以說是鉚足了勁,一系列的應用,API降價,GPT免費。我們當然希望OpenAI能夠使得這個行業更好發展,我們也能認真地去學習,這次的發佈會真正告訴我們應用大有可爲,所有人都應該努力。”

“GPT-4o出來,又比原來進步一大截,它(OpenAI)每次一升級就會‘死’一些公司,這次一些做GPT實時語音交互的團隊,直接可以宣佈解散了。”GPT-4o發佈的第二天,一名大模型行業創業者對《每日經濟新聞》記者感嘆道。

清華大學新聞學院元宇宙文化實驗室主任瀋陽同樣在第二天試用了GPT-4o,在其發佈的視頻號中提到,在文生圖層面,GPT-4o在毛髮細膩度、光影效果等細節上更加優異。

隨着雙方在智能助手上的對碰,瀋陽認爲,當前的競爭格局已經更加明晰,谷歌正在進一步推其基於Gemini的AI助手,蘋果公司與OpenAI也初步達成了合作,將在蘋果手機上搭載ChatGPT。

瀋陽表示,以本次發佈會作爲轉折點,ChatGPT被改造成了靈魂伴侶,所以產業格局已經明晰了,就是蘋果用內置的ChatGPT對抗谷歌Gemini的手機助手。Meta也將上線基於Llama的手機助手。對於產業來說,AI助手有望從1億量級的用戶量走向10億量級。

“GPT-4o,發佈的時候我覺得它很強大,但如今我覺得谷歌最新的產品也完全把它的這些成績趕上了,我覺得後面OpenAI應該更加緊張,因爲應用公司、超級大平臺公司全部趕上來了,它的優勢越來越少。”順福資本創始人、行行AI董事長李明順對《每日經濟新聞》記者表示,目前來看OpenAI的用戶增長已經不太明顯,技術領先和成本優勢都不一定是最佳,與此同時,強應用時代越來越快到來,在這個背景下,谷歌這次把它所有的應用與大模型集合在一起,形成了更強的用戶依存度,還是更勝一籌。

在李明順看來,下個階段,美國的平臺應用公司,包括微軟、蘋果、戴爾,以及中國的騰訊、字節、阿里都會陸續結合自身的應用與大模型能力,推出超級應用,逐步邁向綜合競爭時代,靠一個大模型打江山將更難。

搜索之爭未竟,谷歌反“圍剿”OpenAI

喫下巨頭的“蛋糕”沒有那麼容易。發佈會前,市場充斥着OpenAI圍繞搜索佈局的煙霧彈,有報道稱,OpenAI很可能推出基於ChatGPT技術的新搜索引擎。與此同時,名爲“GPTSearch”的網頁已經上線,但目前只有會員才能訪問。知名記者PeteHuang此前發推特預告,表示GPTSearch將在5月9日正式上線。

最終在這一輪交手中,谷歌守住了陣地。谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)在演講中提到,Gemini帶來的最令人興奮的變革之一是在Google搜索中,“我們最大的投資和創新領域之一是我們的創始產品——搜索”。

從發佈會看,谷歌已經率先將AI能力與其搜索引擎相結合。谷歌方面宣佈,能夠總結谷歌搜索引擎結果的“AI概覽”(AI Over-views)功能,將於本週在美國推出。在這一功能中,谷歌將向用戶展示AI生成的答案。

據谷歌介紹,AI概覽是爲了響應較複雜的搜索,幫助用戶尋求解決方案。例如,當人們搜索素食準備或出行計劃時,AI提供的答案會出現在搜索頁面頂部。

谷歌還提升了搜索的視覺功能,支持通過視頻提出問題。在I/O 開發者大會上,谷歌演示了當面對唱片機故障時,用戶可以一邊拍攝視頻一邊提問,通過新搜索得到包括修理步驟和資源在內的AI概覽。

儘管在智能助手層面先一步狙擊谷歌新品,但對於市場期待的搜索產品,這項自GPT-3.5發佈以來就被寄予厚望的革命性功能,卻在一陣又一陣煙霧彈後,依舊未見進一步動作。在搜索市場,谷歌的基本盤依舊穩固,與此同時其全面的AI能力正在對競爭對手隱隱形成包圍之勢。

與巨頭爭奪領地的另一面,對於OpenAI而言,內憂隱患猶在。

就在GPT-4o發佈一天之後,消失在大衆視線很久的OpenAI聯合創始人、首席科學家Ilya Sutskever官宣離開OpenAI。去年11月,OpenAI管理層發生動盪,Sutskever被認爲是這場風波背後的推手。不久前,OpenAI創始成員之一Andrej Karpathy也在Sora發佈前夕離職。

在這場全新的技術革命中,隨着競爭的重點由大模型技術轉向應用側,以“黑馬”姿態一度引領方向的OpenAI開始降速,新的轉折點也許已經出現。

相關文章