智東西5月8日消息,據外媒The Information 5月6日報道,微軟正在訓練一個5000億參數的AI模型MAI-1,公司希望MAI-1能與OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude等先進模型有一戰之力。

自2019年起,微軟便與OpenAI展開合作,共同研發OpenAI旗下的生成式AI模型和支持這些模型訓練的超級計算技術。據外媒報道,微軟迄今共向OpenAI投資了130億美元。據The Information稱,微軟打算在AI領域尋求一條獨立發展的路徑,因爲目前微軟的“Copilot”助手均依賴於OpenAI的技術。

微軟公司正在AI領域採取一種雙軌道發展策略,既開發成本較低、適合端側運行的小語言模型,又着手於開發更先進的大語言模型。4月23日,微軟開源了其小語言模型Phi-3-mini。

據內部人士透露,微軟正在研發的MAI-1的規模將遠超其曾訓練的任何開源模型。MAI-1預計將擁有約5000億個參數,雖然仍小於GPT-4的1萬億參數,但也足以使其成爲一個龐大而複雜的模型。

微軟的這一新模型將需要顯著的計算能力和大量的訓練數據,相應地,其成本也更爲高昂。儘管MAI-1的具體用途尚未確定,The Information稱微軟願意投資於AI技術的長期發展。

爲了支持這一雄心勃勃的項目,微軟正在配置大量的服務器集羣,這些服務器配備了由英偉達生產的圖形處理單元(GPU)。同時,公司正在積極訓練MAI-1的數據集,包括使用GPT-4生成的文本以及互聯網上的公共數據。

據悉,MAI-1的開發是由微軟AI的首席執行官穆斯塔法·蘇萊曼(Mustafa Suleyman)領導的,他曾在2010年擔任DeepMind的創始人,隨後於 2022 年加入Inflection AI擔任首席執行官。其中,Inflection AI在今年三月末通過微軟的“非直接收購”方式被併入微軟。

The Information稱,雖然微軟納入了Inflection AI大部分員工並以6.5億美元的價格購買了該公司的知識產權,但MAI-1是微軟自研發的模型,並非基於前者模型架構。兩位微軟內部員工透露,MAI-1在訓練過程可能會用到Inflection AI的訓練數據和技術。

根據知情人士透露,微軟可能會在5月21到23日的微軟Build開發者大會上展示MAI-1模型的更多細節,讓我們敬請期待月末的消息。

本文來自微信公衆號“智東西”(ID:zhidxcom),作者:長頸鹿,編輯:李水青,36氪經授權發佈。

相關文章