Meta 聯合 HuggingFace 等機構推出 AI 基準測試 GAIA

據品玩 12 月 8 日報道，Arxiv 頁面顯示，Meta 近日聯合 HuggingFace 和 AutoGPT 等機構，推出了一款名爲 GAIA 的基準測試，可用於對通用 AI 助手性能進行測試。作者表示，GAIA 測試涵蓋了一系列現實世界的問題，需要 AI 助手具備推理、多模態處理、網絡瀏覽和一般工具使用能力等基本技能。GAIA 的問題對人類來說很簡單，但對大多數先進的 AI 來說具有挑戰性。研究顯示，人類受訪者的回答正確率爲 92%，而先進的 AI 助手回答正確率只有 15%。

Meta 聯合 HuggingFace 等機構推出 AI 基準測試 GAIA

熱門新聞

週熱門

Meta 聯合 HuggingFace 等機構推出 AI 基準測試 GAIA

百度網盤宣佈推出漫畫頭像AI生成創意功能

達摩院東南亞語言大模型入選聯合國AI for Good案例集

日月光鎖定AI應用 推出powerSiP™創新供電平臺

Salesforce帶頭暴跌，美國軟件股全線崩盤，AI時代不轉型就是死？

Core DAO通過“2025年Q2前將Core Chain的驗證者數量擴展到31個”的提案投票

CryptoQuant創始人：當前BTC市場氛圍類似於2020年年中，或有鯨魚正進行場外交易

albertyang.eth因網絡釣魚損失約21枚stETH

自FTX下跌以來，只有8種代幣兌BTC突破了之前的最高價

Matter Labs：商標是目前唯一可用的合法工具

今日跌幅TOP榜05-31 12:03

今日漲幅TOP榜05-31 12:03

Luna Foundation大額轉賬系更換託管方案

某地址花費218枚ETH買入50,635枚TRUMP

Luna Foundation Guard地址將197.4萬枚AVAX轉至0x134開頭地址

Polymarket數據：特朗普罪名成立後，贏得大選的概率從56%降至54%

熱門新聞

週熱門

日月光鎖定AI應用推出powerSiP™創新供電平臺