作者 梁謙剛

當地時間5月13日,OpenAI發佈一款名爲GPT-4o的新旗艦生成式AI模型,並計劃在接下來的幾周內“迭代”推出到公司產品中。

據介紹,GPT-4o的文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅爲GPT-4 Turbo的一半,視頻、音頻功能得到改善。

現場演示中,它的表現彷彿一個人正坐在旁邊,和人類的對話節奏自然、融洽,完全聽不出是個AI,在短短232毫秒內,GPT-4o就能對音頻輸入做出反應,並且它可以將文本、音頻、圖像任何組合作爲輸入和輸出。這意味着OpenAI朝着更自然的人機交互邁出了重要一步。

OpenAI創始人Altman表示,GPT-4o是OpenAI有史以來最好的模型,它很聰明,速度很快,是天然的多模態。

國盛證券研報認爲,GPT-4o是邁向更自然的人機交互的重大進步,新功能帶來了嶄新的多模態交互能力,通過新的端到端模型實現了體驗上的新突破,有望在各類終端實現用戶體驗的最大化,利好智能終端Agent、機器人等方向。

儘管多模態AI尚處於初期階段,但已有多個模型開始湧現。谷歌的 Gemini Ultra模型在多學科多模態理解和推理基準測試中超越了GPT-4,顯示出多模態模型的潛力。 爲了保持競爭力,更多的大型語言模型開發者將跟進開發多模態功能。多模態AI預計將解鎖新的商業機會,如Artera在醫療保健領域的應用、谷歌將Gemini集成到搜索中、Ghost Autonomy在自動駕駛領域的探索,以及Meta將其應用於消費設備如智能眼鏡。

今年以來,全球AI大模型端都持續迭代升級,包括海外的Sora、Llama3等,國內的Kimi、崑崙天工AI、階躍星辰等。華泰證券指出,伴隨模型能力的升級,2C應用有望迎來加速發展。2C應用核心要解決的是產品性能以及用戶的付費意願,伴隨底層基礎模型的能力優化,2C應用的使用效果顯著提升,同時應用模態正在加速拓展。

多模態被視爲生成式人工智能(AIGC)行業2024年重要趨勢之一。量子位發佈的《中國AIGC應用全景報告》顯示,2024年中國AIGC應用市場規模將達200億元,2030年達萬億元規模,2024年到2028年的年平均複合增長率將超30%。

身處AI這一熱門賽道,要想在其中取得競爭優勢,高強度的研發必不可少。據證券時報·數據寶統計,多模態AI概念股2023年研發支出合計達到327.53億元,佔營收比例爲11.2%,這一比例是同期A股整體水平的4.46倍。

雲從科技-UW、格靈深瞳、阿爾特、虹軟科技2023年研發支出佔營收比超過50%,相當於拿出超一半的營收投入研發。

雲從科技-UW研發支出強度最高,公司2023年研發支出爲4.91億元,佔營收比例爲78.1%。報告期內,公司與天津港集團、浙江海港集團、華爲公司、天津超算中心聯合研發的港口大模型PortGPT項目正式啓動。

通過調研上市公司,機構可以更加了解其最新的產業佈局情況。

據數據寶統計,今年以來合計有61只多模態AI概念股迎來機構調研。湯姆貓、蘇州科達因賽集團中科信息、中科創達、值得買獲調研次數均在5次及以上。參與調研機構數量最多的是中科創達,合計達到457家;其次是廣聯達、湯姆貓、大華股份等。

(本版專題數據由證券時報中心數據庫提供 陳錦興/製圖)

相關文章