【宅男財經|專家面對面】當地時間5月13日上午,OpenAI舉行春季發佈會。這次發佈的產品並非搜索引擎或GPT-5,而是GPT-4的迭代版本——GPT-4o。OpenAI首席技術官Mira Murati表示,GPT-4o具備GPT-4的智能水平,但處理速度比GPT-4 Turbo快了一倍。

GPT-4o技術水平如何?中關村信息消費聯盟理事長、通信專家項立剛表示,GPT-4o在人工智能計算、理解能力上和GPT-4並沒有本質不同。從產品命名的角度看,它之所以不叫GPT-5,可能也是因爲它沒有革命性的突破,但GPT-4o也有一定的能力提升。

發佈會上,GPT-4o表現出多模態理解和輸出能力,它能夠跨聲音、文本和視覺進行智能推理,可以就用戶給出的截圖、照片,或含有文本和圖像的文件展開對話。項立剛表示,此前ChatGPT主要是通過“文字對文字”的形式工作,即它在接收相關文字後經過處理,輸出的也是文字,而GPT-4o擁有了多模態理解和輸出能力,它接收的信息可以是文字、圖片、聲音和影像。

比如在發佈會上,OpenAI的研發負責人就與GPT-4o進行了語音對話;同時,GPT-4o在處理視頻時,還能在一定程度上理解人的情緒。項立剛認爲,GPT-4o雖然沒有在人工智能的計算能力方面實現質的飛躍和革命性的改變,但是它的一系列表現,以及理解和輸出能力從單模態向多模態的轉變,未來它會更真實地瞭解和理解世界。這些能力可能會被植入到機器人中,使它能夠通過攝像頭或感應器對周圍的環境,包括人的情緒、態度等有更深入地理解。

“雖然GPT-4o的表現並非盡善盡美,但是我們可以看到它的發展方向,在人工智能的推理計算上的革命性飛躍可能目前還無法達到,而在這個過程中對於多模態進行識別理解並輸出的發展方向越來越明顯。”

項立剛提到,GPT-4o發佈的背後也反映出OpenAI所面對的一些實際情況。比如GPT-4o同時面向付費用戶和免費用戶,雖然付費用戶的消息限制是免費用戶的5倍,但一定程度上反映出OpenAI目前的用戶增長不是非常多,它的收入情況不是很好。在這種情況下,公司爲了維持自己的用戶數就不得不開放免費註冊,然而免費用戶的加入也並不會產生收入,未來OpenAI或許還會面臨一定的困難。

項立剛稱,通過OpenAI的發佈會可以看到,GPT技術在不斷積累中已經從算力堆砌發生改變,逐漸開始變得更加關注人性化及多模態理解和輸出能力,這種能力對未來的人形機器人發展更有幫助,它在與人交流溝通的過程中會更加順暢、更加方便,並且更加理解普通人的感受。

(記者 董湘依 製作 常晴朗 餘坤航 宅男財經出品)

來源:中新經緯

編輯:餘坤航

廣告等商務合作,請點擊這裏

未經過正式授權嚴禁轉載本文,侵權必究

相關文章