苹果推出300亿参数MM1多模态大模型，可识别图像推理自然语言

港股那点事 2024-03-17 18:52

据IT之家，近日，在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中，苹果正式公布自家的多模态大模型研究成果 —— 这是一个具有高达300亿（其他为30亿、70亿）的多模态模型系列，它由密集模型和混合专家（MoE）变体组成，不仅在预训练指标中实现SOTA，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。MM1多模态大模型拥有图像识别和自然语言推理能力。

苹果推出300亿参数MM1多模态大模型，可识别图像推理自然语言

热门新闻

周热门

苹果推出300亿参数MM1多模态大模型，可识别图像推理自然语言

人文社会科学应尽快加入论文预印本平台

Claude 3 成功破解未公开算法？智商测试 101 分碾压 GPT-4

大模型幻觉问题无解？理论证明校准的LM必然会出现幻觉

GPT-4变笨！回答新问题性能太差，想保持水准只能不断训练新模型

盖棺定论？韩学会：无证据证实LK-99为常温超导体

未来有望抽管血就可诊断和预测老年痴呆，科学家研发出新 AI 算法

材料行业迎来“待发掘宝石库”？谷歌宣称通过AI发现超百万种新材料

北格陵兰岛冰架总体积1978年至今已减少逾30%

地球遭死亡恒星伽马射线轰击：可将人烧焦 科学家无法解释

不只是统计机器！MIT研究人员重磅论文引围观：大型语言模型是"世界模型"，甚至有独立的"时间和空间神经元"

支持科学数据开放共享新模式《数据论文出版元数据》国家标准正式发布

固态电池难产原因找到！《科学》杂志发布重磅研究：还得考虑它

超越美国！我国各学科最具影响力期刊论文数量首次位居世界首位

Nature：为啥室温超导支棱不起来

拼上 24 条染色体最后一块拼图，人类 Y 染色体完全测序

热门新闻

周热门

地球遭死亡恒星伽马射线轰击：可将人烧焦科学家无法解释