作者 梁谦刚

当地时间5月13日,OpenAI发布一款名为GPT-4o的新旗舰生成式AI模型,并计划在接下来的几周内“迭代”推出到公司产品中。

据介绍,GPT-4o的文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。

现场演示中,它的表现仿佛一个人正坐在旁边,和人类的对话节奏自然、融洽,完全听不出是个AI,在短短232毫秒内,GPT-4o就能对音频输入做出反应,并且它可以将文本、音频、图像任何组合作为输入和输出。这意味着OpenAI朝着更自然的人机交互迈出了重要一步。

OpenAI创始人Altman表示,GPT-4o是OpenAI有史以来最好的模型,它很聪明,速度很快,是天然的多模态。

国盛证券研报认为,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化,利好智能终端Agent、机器人等方向。

尽管多模态AI尚处于初期阶段,但已有多个模型开始涌现。谷歌的 Gemini Ultra模型在多学科多模态理解和推理基准测试中超越了GPT-4,显示出多模态模型的潜力。 为了保持竞争力,更多的大型语言模型开发者将跟进开发多模态功能。多模态AI预计将解锁新的商业机会,如Artera在医疗保健领域的应用、谷歌将Gemini集成到搜索中、Ghost Autonomy在自动驾驶领域的探索,以及Meta将其应用于消费设备如智能眼镜。

今年以来,全球AI大模型端都持续迭代升级,包括海外的Sora、Llama3等,国内的Kimi、昆仑天工AI、阶跃星辰等。华泰证券指出,伴随模型能力的升级,2C应用有望迎来加速发展。2C应用核心要解决的是产品性能以及用户的付费意愿,伴随底层基础模型的能力优化,2C应用的使用效果显著提升,同时应用模态正在加速拓展。

多模态被视为生成式人工智能(AIGC)行业2024年重要趋势之一。量子位发布的《中国AIGC应用全景报告》显示,2024年中国AIGC应用市场规模将达200亿元,2030年达万亿元规模,2024年到2028年的年平均复合增长率将超30%。

身处AI这一热门赛道,要想在其中取得竞争优势,高强度的研发必不可少。据证券时报·数据宝统计,多模态AI概念股2023年研发支出合计达到327.53亿元,占营收比例为11.2%,这一比例是同期A股整体水平的4.46倍。

云从科技-UW、格灵深瞳、阿尔特、虹软科技2023年研发支出占营收比超过50%,相当于拿出超一半的营收投入研发。

云从科技-UW研发支出强度最高,公司2023年研发支出为4.91亿元,占营收比例为78.1%。报告期内,公司与天津港集团、浙江海港集团、华为公司、天津超算中心联合研发的港口大模型PortGPT项目正式启动。

通过调研上市公司,机构可以更加了解其最新的产业布局情况。

据数据宝统计,今年以来合计有61只多模态AI概念股迎来机构调研。汤姆猫、苏州科达因赛集团中科信息、中科创达、值得买获调研次数均在5次及以上。参与调研机构数量最多的是中科创达,合计达到457家;其次是广联达、汤姆猫、大华股份等。

(本版专题数据由证券时报中心数据库提供 陈锦兴/制图)

相关文章