據界面新聞報道,1 月 24 日,巖芯數智正式發佈自研大模型“Yan 模型”。Yan 模型採用非 Transformer 架構,爲非 Attention 機制的通用自然語言大模型。據瞭解,該大模型有相較於同等參數 Transformer 的 7 倍訓練效率、5 倍推理吞吐和 3 倍記憶能力。
相關文章