[第一時間]被“卡脖子”兩週年 韓國奮力擺脫對日本依賴

作者: 程實 張弘頊

[ 我們對20位科學家和工程師的深度調研進行了比較分析,總結出了中國可以通過算法和軟件的應用創新在四個方面持續強化中國現有價值鏈。這四個方面分別是:智能化產品服務設計、智能化生產製造、智能化供應鏈管理以及智能化運營管理。 ]

[ 我們認爲,核心算法和軟件的持續創新根本上還是取決於基礎科學的發展和投入。無論是關鍵的軟件還是硬件技術,每一種產品都是基礎科學幾十年來理論積累的產物。因此,我們強調基礎科學投入的長期性與穩定性是提高核心算法與軟件原創性的關鍵所在。 ]

在上一篇文章《中國突圍中高端價值鏈,應發力硬科技》中,我們採用機器學習聚合分類研究,在全球5228種產品類別中系統性地識別了當前中國高度進口依賴的88種“卡脖子”關鍵產品。而爲了突破西方對中國在關鍵技術上的制裁,本文基於美國麻省理工學院經濟學家阿西莫格魯(Acemoglu)提出的偏向性技術進步理論,結合近期我們對全球及國內頂級學術機構及科技互聯網公司共計20位人工智能科學家、算法工程師和數據分析師的調研分析,發現了當前發達國家對中國在中高端價值鏈上的制裁主要集中在以芯片、光刻機和半導體爲代表的硬件技術上。

而相比硬件,近年來中國在軟件方面的自主研發和迭代速度進步明顯。因此,我們建議中國可通過自身市場、資本與數據要素優勢,集中突破部分“卡脖子”的關鍵軟件和算法技術。具體來說,中國可利用對軟件與算法的創新應用,持續強化現有的七大優勢產業鏈。在穩固現有價值鏈競爭優勢的基礎上,圍繞一些數據敏感度較低且可貿易度較高的行業(如光學器件、化學、機電控制等),不斷提升中國軟件技術與西方高端硬件技術相互間的依賴性,最終幫助中國順利邁入全球中高端價值鏈。

破局之機:

數據密集型產業的崛起

回顧人類歷史上的經濟增長變化,東西方世界真正出現巨大經濟增長差距就是從19世紀工業革命初開始。圍繞這種差異,一大批經濟學家試圖解釋經濟增長的源泉到底是什麼。古典增長理論認爲勞動和資本要素是經濟增長的核心動力。而新古典經濟學家在此基礎上進一步納入了全要素概念將技術視爲外生變量解釋經濟增長。而從20世紀80年代開始, 盧卡斯(Lucas)和羅默(Romer)等人試圖把技術進步內生化,並解釋了經濟增長的源泉是知識的分享和積累。

近10年來,隨着以大數據、雲計算和人工智能爲代表的新一代信息技術的發展,瓊斯(Jones)和託內特(Tonetti)研究了數據在生產過程中的基本模式,並定義了數據作爲生產要素對經濟增長的作用。儘管數據作爲信息,其本身無法被直接應用於生產,但通過分析和預測數據(信息)指導經濟物品的生產與應用,將顯著降低經濟物品的交易成本,從而提高勞動生產率。

偏向性技術進步理論指出了當技術創新使某生產要素邊際產出相對其他生產要素顯著增長時,技術就會“青睞”(偏向)該要素。同時,該要素的邊際產出和規模報酬將呈現遞增特徵。結合中國經濟增長的實際情況,依靠傳統生產要素投入拉動中國經濟增長的潛力越來越小,無論是勞動還是資本要素的邊際產出近年來均呈現顯著遞減特徵。相反,以數據爲代表的新生產要素近年來呈現出邊際產出遞增的特徵。這是因爲信息時代下新一代技術創新(比如雲計算、大數據、人工智能、區塊鏈等)幾乎都是圍繞數據要素生產和發展的。正如偏向性技術進步理論的核心觀點,技術創新偏向數據要素從而帶動市場資源集中流入數字產業,最終導致數字密集型產業規模報酬顯著遞增。

根據我們的預測,2025年中國所擁有的數據規模將佔世界數據圈的30%,這意味着中國將成爲擁有數據規模全球第一的經濟體。龐大的數據規模將進一步支持中國發展數據密集型產業以支持中國經濟增長。

數據產業的核心競爭力:

軟件和算法

儘管中國數據規模正以驚人的速度持續擴張,但如何高效地使用數據來指導經濟產品服務創新,是數據密集型產業向高質量方向發展的關鍵,也是中國經濟持續增長的源泉。我們認爲,真正對數據密集型產業擁有絕對控制權,不僅僅取決於數據規模,更取決於核心算法和軟件系統。

基於我們的研究,長期以來,中國在軟件與核心算法上依舊整體處於被西方國家“卡脖子”的狀態。比如,在覈心工業軟件領域,國產EDA(電子設計自動化)與發達國家EDA工具相比,在性能上(如工具完整性、穩定性、工藝設計等)仍存在代際差距。在操作系統上,絕大部分手機和個人電腦依舊被三家美國公司(谷歌蘋果微軟)所壟斷。在覈心算法方面,中國國產的高端機器人在穩定性和易用性上仍與日本、美國、德國和瑞士等國家存在差距,反映了中國在中高端製造業上仍未能掌握相匹配的核心算法。

然而,基於我們對全球和中國頂級高校及科技互聯網公司20位人工智能科學家和工程師的最新調研情況來看,相比當前“卡脖子”的硬件技術,中國在關鍵軟件領域率先突破的可能性更高。這是基於目前中國在算法和軟件領域具備的三大優勢:

一是在經濟層面。中國擁有數據、人力資本與市場要素優勢。正如我們提到的,中國擁有全世界最大的數據圈。同時,龐大的消費市場能夠爲數據密集產業提供豐富的應用場景。另外,根據2020年中國專業IT社區CSDN(Chinese Software Developer Network)的統計,在中國從事軟件開發與算法設計相關的學生或工程師已經超過800萬人(根據CSDN活躍用戶計算),其中一線開發人員已經超過60%。強大的人力資本優勢使得軟件和算法開發可以快速在豐富的場景中進行迭代應用。

二是在制度層面。政府將大力支持數據要素市場的培育。2020年4月中共中央、國務院公佈了《關於構建更加完善的要素市場化配置體制機制的意見》,明確了將數據作爲新型生產要素。意見同時指出了未來中國將圍繞數據要素在數據共享、數據融合、數據確權、數據定價以及數據安全等一系列方面推行改革。毫無疑問,國家“數據紅利”的釋放將推動數據密集型產業的發展應用,這將有利於軟件和算法的迭代創新。

三是在技術層面。受益於開源軟件運動,高級算法與軟件的可得性不再困難。開源軟件被描述爲其源碼可以被公衆使用的軟件,並且此軟件的使用、完善和分享方面不受許可證的限制。根據全球最大開源項目託管平臺GitHub統計,到2025年全球參與開源軟件的平臺用戶數量將達到1億用戶。其中,中國開源軟件參與者的數量及開源貢獻度增長已成爲全球最快。

破局之道:

加快軟件與算法在中國價值鏈上的應用與創新

正如上述分析,我們認爲中國有能力通過自身市場、人力資本與數據要素優勢,集中突破部分“卡脖子”的關鍵軟件和算法技術。進一步,利用軟件與算法的快速迭代和持續創新強化中國現有的七大優勢產業鏈。在穩固現有價值鏈的競爭優勢基礎上,圍繞一些數據敏感度較低且可貿易度較高的行業,不斷提升中國軟件技術與西方高端硬件技術間的依賴性,最終幫助中國順利邁入全球中高端價值鏈。

首先,基於我們對全球及國內20位AI科學家和工程師的調研發現,中國在軟件和算法優化與應用層面與西方國家的距離越來越小。比如激光雷達技術從2019年到現在,短短兩年間進步巨大。2019年的時候,激光器、接收器、主控FPGA和採樣用的ADC,這四個最核心軟硬件都是被國外壟斷的。現在國內已經有頂級的激光器生產商,主控和採樣都ASIC(特殊應用集成電路)化了,只剩接收器還沒有完全解決。再如,在語音識別領域,目前全球最先進的新一代語音識別系統“Wenet”也是由中科院和西工大AI科學家自主創新完成的,且整套算法框架完全不同於英國AI科學家Danial Povey所創造的“Kaldi”語音識別系統 (上一代國際最先進的語音識別系統)。

進一步,我們對20位科學家和工程師的深度調研進行了比較分析,總結出了中國可以通過算法和軟件的應用創新在四個方面持續強化中國現有價值鏈。這四個方面分別是:智能化產品服務設計、智能化生產製造、智能化供應鏈管理以及智能化運營管理。

1。智能產品與服務設計。利用增強學習(Reinforcement Learning)、神經網絡模型(Neutral Network)以及自然語言處理(Natural Language Processing)對客戶的消費行爲和模型進行預測,從而設計新的產品。

在我們的調研中,很多公司早已開始利用大數據對客戶體驗和購買模式進行預測,從而進一步基於預測結果對產品服務進行設計和創新。此外,工程師和設計師可以採用創成式設計(Generative Design)實現產品創新。即通過設定對產品的約束條件(比如顏色、形狀、材料、體積),結合創成式算法(如參數化系統、進化系統、形狀語法及拓撲優化算法等)可自動生成上萬種產品設計方案。

2。智能化生產製造。通過監督式和無監督式機器學習(Supervised Learning & Unsupervised learning)算法,提高產品生產製造的效率和品質。比如,中間品製造生產過程中有諸多分揀作業,如果採用智能化機器分揀,則可大大提高產品生產效率。此外,通過對質量差異化的產品進行深度學習(Deep Learning),再基於對產品各個生產環節上所獲得的監控數據,可使機器視覺更快、更精確地識別出產品表面的不同生產缺陷。

3。智能化供應鏈管理。利用深度學習算法可優化供應鏈運輸路線和倉位管理。比如通過將歷史運輸路線和實際交付成果進行神經網絡訓練,從而分析運輸方案對供應鏈上交易成本的影響,以幫助管理者確定最優運輸路線。此外,基於神經網絡算法,可幫助製造商實時檢測庫存變化、及時調整庫存規模,從而有效控制庫存短缺或過剩的狀況。

4。智能化運營管理。監督式學習可有效幫助企業優化運營決策並降低運營成本。利用迴歸模型(Regression)、決策樹(Decision Tree)及隨機森林模型(Random Forest)對生產管理系統或機器設備進行故障預測,從而有效降低運營成本。另外,製造商通過傳感器監控可收集設備所處環境的溫度、照明及溼度變化,從而預測故障事件發生的概率以降低故障產生帶來的不確定性。針對一些生產任務,機器學習可以對生產複雜程度與生產規模進行匹配分析,從而計算具體生產任務所需的員工數量。

最後,在我們的調研分析中,絕大多數人工智能科學家表示中國在軟件和算法的應用層面與美國等發達國家幾乎是齊頭並進。在中國的優勢產業鏈上,我們看到已經有越來越多的企業開始湧入人工智能浪潮,通過對圖像處理、語音處理、自然語言理解等應用性算法將人工智能應用在各個產業鏈的不同場景中。在國家政策和代碼開源的支持下,價值鏈上更多的中小企業可積極通過算法和軟件應用,來強化或提高自身在製造生產環節上的競爭力。而在穩固現有價值鏈競爭優勢的基礎上,在部分細分行業中,提升西方高端硬件技術在中國軟件系統上的使用依賴性是中國邁入中高端價值鏈的關鍵突破口。

比如,中國在無人機、自動駕駛和區塊鏈等細分領域上的軟件和算法創新,很可能未來會讓部分國外製造商逐步適應和接受中國的軟件系統。在EDA領域,儘管在先進製程IC(集成電路)設計方面,EDA工具幾乎被國際三大巨頭所壟斷,但國產EDA在40納米及28納米制程工藝上近年來進步非常明顯,結合5G、汽車電子、區塊鏈等新興領域對IC設計的新需求,這可能爲EDA與國外中高端製造商提供相互合作與學習的方向。

破局之障:

軟件與算法創新的瓶頸——基礎科學

企業的數字化和智能化不可能一蹴而就,目前全球也沒有一個通用的模板可以套用。在中國價值鏈上,對於大部分提供中間品、資本品和消費品的泛製造業公司來說,如何對算法和軟件進行創新,並根據不同的細分場景提供相應的解決方案,依舊是當前主要面臨的挑戰。在我們所調研的20位AI科學家和工程師中,幾乎所有人都提到了中國在覈心算法與軟件原創性上仍與發達國家有不小的差距。此前西方國家可能將關閉對中國GitHub開源代碼分享的消息讓國內很多算法工程師和科學家都感到了緊張。

我們認爲,核心算法和軟件的持續創新根本上還是取決於基礎科學的發展和投入。無論是關鍵的軟件還是硬件技術,每一種產品都是基礎科學幾十年來理論積累的產物。因此,我們強調基礎科學投入的長期性與穩定性是提高核心算法與軟件原創性的關鍵所在。其次,要尋求在重點基礎科學領域實現引領和突破。軟件和核心算法的原創性本質上就是數學信息科學與技術理論的原創。因此,立足當前實際情況,集中要素資源支持數學信息科學領域的基礎理論發展與創新是必要的。另外,儘管西方部分學術機構對中國存在諸多戒備,但我們還是需要鼓勵中國科研機構更加廣泛、積極地與國際頂級學術機構進行合作。多元化和國際化的科學研究團隊有利於持續推進基礎科學領域的創新。

(程實系工銀國際首席經濟學家,張弘頊系工銀國際資深經濟學家)

相關文章