在國內外科技企業的密集推動下,大模型呈現加速爆發趨勢。賽迪顧問數據顯示,截至2023年7月,中國累計有130個大模型問世,拉開了“百模大戰”的帷幕。相比國際企業更注重通用大模型,國內大模型產業化應用呈現出通用類、專業類並行的發展態勢,有望重塑產業格局,爲千行百業創造經濟價值。

然而,要推動大模型從嚐鮮期走向落地期,從“好玩”走向“好用”,還需要底層軟硬件技術棧的驅動和賦能。英特爾正在AI的道路上奮力奔跑,並瞄準大模型這一AI最新趨勢儲備彈藥。

無處不在的AI需要更加堅實的數字底座

AI正在賦能千行百業越來越多的流程和環節,小到一張票據的自動識別和信息錄入,大到造福全民健康事業,AI正在引發生產生活方式的蝶變。

在企業的財務辦公室,光學字符識別正在將員工從紙堆般的票據中解放出來。該技術能夠對海量的單據、文檔等圖片進行處理,實現信息的自動錄入,在減少人工錄入工作量的同時,使數據更加容易保存,還減少了票據存檔管理費用和紙張佔用空間。

在物流園區,視覺AI技術讓分揀、裝卸等流程更加順暢,並更好地保障了生產安全。AI技術的識別和分析能力,不僅降低了快件錯分率及錯派、人工覈對成本等潛在損失,還能有效監測園區內是否存在危險作業、違規作業或安全問題,讓流程更加高效安全。

與此同時,AI還應用於提升疾病檢測和篩查效率、保護金融大數據安全、預測新能源輸出功率等領域,爲產業的轉型升級和提質增效注入動能。

AI無處不在的同時,也爲算力基礎設施帶來越來越沉重的負擔。比如光學字符識別會帶來較大的AI算力開銷,增加了基礎設施平臺的性能與總體擁有成本壓力;邊緣視覺AI應用涉及大量的推理運算,會產生高昂的硬件成本;結合深度學習算法的AI醫學影像解決方案會讓AI平臺執行推理等活動的計算量和複雜度急劇增加等。

英特爾基於軟硬件一體化解決方案,助力企業更有效地應對AI帶來的性能挑戰。在硬件方面,英特爾提供了第四代至強可擴展處理器,每個插槽多達60個核心,支持8通道 DDR5內存,在內存帶寬方面實現了50%的性能提升,整體實現了60%的代際性能提升。該處理器還內置了英特爾高級矩陣擴展AMX,能夠爲AI工作負載的訓練和推理提供更強性能。在光學字符識別應用中,英特爾AMX支持從FP32到INT8/BF16的量化,從而在可接受的精度損失下,提升系統吞吐量和推理速度。

在軟件方面,英特爾提供了一系列開源的工具套件,讓開發和運維更加簡捷。針對物流園區可能採用多種算力芯片和深度學習框架來實現視覺AI的場景,英特爾OpenVINO工具套件提供的模型優化器,可將基於其他深度學習框架的模型轉換爲統一且性能經過優化的OpenVINO IR模型,降低了模型優化與運維的複雜程度。此工具套件還提供了免費且預訓練好的深度學習模型及演示應用供用戶選用,進一步降低了用戶的模型開發難度並縮短了應用開發時間。同時,在英特爾oneAPI和OpenVINO工具套件的支持下,模型還可實現XPU的無縫切換,且幾乎不會對應用層造成任何影響。

以上僅僅是已經落地的AI應用在英特爾平臺上得到的優化,此外,英特爾還在將技術服務和解決方案上向大模型延伸,以求爲互聯網企業利用大模型創造商業價值、行業用戶通過大模型提升競爭能力創造更多可能。

工具鏈條加速大模型落地部署

大模型與行業融合不斷深入的過程中,計算參數也水漲船高。賽迪顧問數據顯示,在國內已發佈的100餘個大模型中,10億參數規模以上的大模型佔比超過80%以上,投入商用的大模型參數量基本在千億級。

如此量級的參數,對大模型的落地部署帶來了挑戰。

一方面,大模型對算力基礎設施的內存、帶寬、系統資源帶來沉重的負擔,讓一般的科技公司難以承受,也難以實現運行準確性與能效的平衡。採用量化等壓縮方式爲大語言模型“瘦身”,以降低內存空間佔用並提升推理效率,成爲降低大模型部署難度的常用方式。2022年提出的SmoothQuant量化方案能夠實現1.56倍的加速,內存需求減少2倍。在英特爾平臺上提升大語言模型的訓練後量化表現的增強型SmoothQuant技術,在OPT-1.3b和BLOOM-1b7模型上的準確率比默認的SmoothQuant分別高5.4%和1.6%。量化後的模型也縮小到FP32模型的四分之一,顯著減少了內存佔用空間,從而提升了大模型在英特爾平臺的推理性能。

另一方面,大模型的龐大參數量,使維護和調優變得更加複雜。傳統調優方式不僅要求相關人員熟練掌握微調技巧,還需要付出高昂的訓練成本。在這種趨勢下,參數高效微調等成本更低、應用簡捷的調優方式正在逐步取代傳統調優方法應用在大模型中。英特爾提供了一整套軟硬件支持方案,使“只改一行代碼”就實現大模型調優成爲可能。在硬件層面上,英特爾AMX通過快速處理矩陣乘加運算,顯著提升了運算速度;至強CPU Max系列提供的最高達1TB/s的內存帶寬支持,滿足大模型微調所需的大內存帶寬,以獲得更好的運行性能。在軟件層面,英特爾MPI庫能夠更有效地整合和分配內核資源,進一步發揮CPU的整體效率,以創建和維護更加複雜的應用。

安全或許不是大模型性能指標的直觀體現,卻是大模型行穩致遠的底線。如何保證數據,尤其是隱私數據在推理和訓練過程中的保密性,如何保證數據在調用過程中端到端的安全,都是大模型興起與應用帶來的安全挑戰。從第三代英特爾至強可擴展處理器開始內置的SGX(軟件防護擴展)技術,其可信執行環境的容量最多可達單顆CPU 512GB,雙路共計1TB容量,可滿足目前千億大模型的執行空間需求。此外,該技術支持的機密計算可實現應用層、虛擬機、容器和功能層的數據隔離,無論在雲端、邊緣還是本地環境,都能更全面地保護計算與數據的私密性和安全性。

從“好看”到“好用”,從“潮玩”到“普適”,大模型的商用落地是結合場景定義、訓練、調優、運維等多個步驟的螺旋式上升過程。作爲AI底座的建設者,英特爾正結合軟硬件能力,賦能開發者和生態夥伴,進一步釋放AI的創新潛能。

作者丨張心怡

編輯丨趙晨

相關文章