雪花新聞

大動作不停,Google加入開源戰局!低配版“Gemini ”Gemma來了!相當於OpenAI把GPT-3開源了

來源:硅星GenAI

幾家巨頭之間的大模型競爭,越來越像打牌了。你出完炸彈我出炸彈。

這不,又一個深夜炸彈。

2月21日,在與閉源的OpenAI打得火熱的同時,Google突然加入了開源的戰局。北京時間夜間Google突然宣佈,開源了一個新的模型系列Gemma,這個模型使用了與它最強的Gemini同源的技術,並且在一系列的標準測試上秒殺了幾款今天最熱門的開源模型。

怎麼理解這個動作的重要性呢?你可以粗暴的理解爲:

這有點像現在正在訓練更強大的GPT-5的OpenAI,把GPT3的低參數版給開源了。(前幾天Sam Altman被問過這個問題,你們是否會在未來把GPT3開源,他沒有直接回答。現在看來Google針對性很強啊。)

(X上一張有意思的圖)

根據Google官方對Gemma的介紹,它的基本信息如下:

Gemma谷歌開源的一個大型語言模型,而非像Gemini那樣是多模態的,它基於與Gemini相同的技術構建,但完全公開並允許商用授權。

Gemma模型有兩個主要版本,分別是Gemma 7B70億參數)和Gemma 2B20億參數)。這些模型在大規模的數據集上進行了訓練,數據集包含了以英語爲主的網絡文檔、數學數據以及代碼數據,總量達到了6萬億tokens

Gemma模型的特點包括:

  1. 架構細節Gemma模型具有不同的參數規模,Gemma-2B18層,d_model2048,而Gemma-7B28層,d_model3072。這些模型還具有不同的前饋隱藏維度、頭數和KV頭數,以及詞彙量。

  2. 新技術Gemma採用了一些新技術,如Multi-Query AttentionRoPE EmbeddingsGeGLU激活函數以及Normalizer Location,這些技術有助於提高模型的性能。

  3. 評測結果:谷歌官方宣稱Gemma模型在70億參數規模的語言模型中表現最佳,甚至超過了一些參數量更大的模型。

  4. 開源情況Gemma模型遵循一個自定義的開源協議,允許商業使用。

發佈完,Jeff Dean就對這個系列模型劃了重點:

可以看到Jeff DeanGoogle這次都十分強調開源模型的安全性和具體的實打實的配套設施和舉措。這似乎也直至被詬病Close AI且被外界質疑安全性保障的OpenAI

現在,憋壞了的Google正式四面開戰了。未來它將用Gemma對抗Llama,用Gemini對抗GPT

無論是開源還是閉源,競爭越來越焦灼了。

相關文章