谷歌、OpenAI指明方向!第一個AI“殺手級應用”、AI手機必爭之地?

有觀點認爲,兩款AI助手看似功能強大,但實際效用仍是未知。

本文作者:李笑寅

來源:硬AI

OpenAI搶發重磅新品次日,谷歌也“放大招”直接對壘GPT-4o。

當地時間5月24日週二,年度Google I/O開發者大會上,谷歌CEO Sundar Pichai發佈了一系列與AI有關的新品和新功能,包括:AI Overviews技術生成摘要功能、Gemini 1.5 Pro上下文窗口拓寬至200萬Tokens、多模態Gemini Nano模型、第六代TPU芯片Trillium等。

圍繞AI搜索引擎方面,谷歌帶來了一系列更新。值得一提的是,谷歌發佈了一款多模態AI項目Astra,用來處理音頻、視頻等多模態的輸入內容。

演示視頻顯示,Astra可以通過手機攝像頭辨別物體,還能夠識別所處位置。

谷歌、OpenAI指明方向!第一個AI“殺手級應用”、AI手機必爭之地?

Video Player is loading.

Play Video

Play

Loaded0%

Current Time 0:00

/

Duration 0:00

1x

Playback Rate

  • 2x
  • 1.5x
  • 1.25x
  • 1x, selected
  • 0.75x

Mute

Fullscreen

This is a modal window.

No compatible source was found for this media.

Beginning of dialog window. Escape will cancel and close the window.

Text

Color

White

Black

Red

Green

Blue

Yellow

Magenta

Cyan

Transparency

Opaque

Semi-Transparent

Background

Color

Black

White

Red

Green

Blue

Yellow

Magenta

Cyan

Transparency

Opaque

Semi-Transparent

Transparent

Window

Color

Black

White

Red

Green

Blue

Yellow

Magenta

Cyan

Transparency

Transparent

Semi-Transparent

Opaque

Font Size

50%

75%

100%

125%

150%

175%

200%

300%

400%

Text Edge Style

None

Raised

Depressed

Uniform

Dropshadow

Font Family

Proportional Sans-Serif

Monospace Sans-Serif

Proportional Serif

Monospace Serif

Casual

Script

Small Caps

Reset restore all settings to the default valuesDone

Close Modal Dialog

End of dialog window.

不論是定位還是功能,谷歌這款AI助手的到來顯然對GPT-4o產生了威脅。

華盛頓大學專門研究在線搜索的教授Chirag Shah對此評論道:

“最終,你會有一個真正瞭解你的代理,可以爲你做很多事情,並執行跨任務和跨領域的命令。”

谷歌還在發佈會上表示,今年夏天開始,Gemini也將支持語音實時交互,並在今年晚些時候上線實時視頻交互。未來幾個月內,谷歌也將推出類似於GPTs的自定義AI助手功能,叫做Gems,能夠與整套“谷歌全家桶”聯動。

第一個AI“殺手級應用”?

從OpenAI和谷歌的發佈會來看,GPT-4o目前只能處理靜止圖像,但Astra可以處理視頻,這是一個顯著的優勢。

並且,谷歌在發佈會上還對Gemini 1.5 Pro大模型進行了諸多更新,使其可以擁有更自然的聲音、更長的對話、對音頻和圖像的更好理解、更多的邏輯推理和規劃能力,以及更好的代碼生成。

不過,GPT-4o背後的技術創新同樣令人深刻。據悉,該原生多模態模型能夠直接接收/生成語音,而無需經過語音-文字的轉化過程,大大縮短了運行週期;並且在執行任務所需的參數量也大幅降低,從而提高運行速度、縮減成本。

就當前進展而言,很難判斷OpenAI和谷歌的AI助手中誰更勝一籌,但二者對該領域的重視程度是無疑的。

據媒體此前報道,蘋果也在考慮在其手機語音助手Siri中引入GPT技術,以支持AI功能。

科技巨頭們相繼發力,是否意味着AI助手會成爲下一個AI“殺手級應用”?

答案尚不肯定。

有分析指出,雖然目前GPT-4o和Astra展示出的用例都很有趣,但“幾乎沒有一個”是幫助人們完成工作的。也就是說,這兩款AI助手看似功能強大,但實際效用仍是未知。

分析稱,如果AI助手後續能夠更理解用戶的個人偏好,可能其“代理”屬性能夠有所增強,幫助用戶真正完成日常工作,比如網購、預訂、填表……

AI手機下一步需要解決什麼?

雖然OpenAI和谷歌的AI助手可以直接通過語音、視頻等形式運行,但有觀點認爲,二者仍不能被稱作是一個AI助手。

原因在於,GPT-4o和Astra雖然都可以回答問題並執行搜索工作,但它們不能真正執行任務。

華爾街見聞此前提及,OpenAI的在發展邊緣AI方面的痛點即爲:端側應用權限、系統級權限。這可能也是它尋求與蘋果合作的原因之一。

就目前而言,只要AI助手產品還沒有真正接入到手機系統中去,Siri之類的語音助手的地位就無法被撼動。

有觀點指出,確定性要比AGI(通用人工智能)更重要,靠譜纔是第一的。

該觀點認爲,即使是目前最好的AI系統,也沒有做足準備真正實現個人助手的功能;而手機自帶的語音助手雖然沒那麼“有趣”,但至少不會出錯。

本文來自微信公衆號“硬AI”,關注更多AI前沿資訊請移步這裏

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

相關文章