摘要:徐宗本長期從事Banach空間幾何理論與智能信息處理的數學基礎方面的教學與研究工作,主要學術貢獻包括:將數據建模從“輔助作圖”層次提升到“認知模擬”層次,系統提出了基於視覺認知的數據建模新原理與新方法。徐宗本說,“我們積攢的數據可以用於生產,從數據到信息、知識、決策的轉化就是用計算、算法來分析出價值原理,數據的可複製、可加工能夠讓數據價值倍增”。

CCAI 2019

2019年中國人工智能大會(Chinese Congress on Artificial Intelligence 2019,簡稱“CCAI 2019”)將於9月21日-22日在青島膠州召開。西安交通大學教授、陳嘉庚獎獲得者、中國科學院院士徐宗本將作爲嘉賓出席大會並發表演講。

徐宗本長期從事Banach空間幾何理論與智能信息處理的數學基礎方面的教學與研究工作,主要學術貢獻包括:將數據建模從“輔助作圖”層次提升到“認知模擬”層次,系統提出了基於視覺認知的數據建模新原理與新方法;發現非歐氏框架下的“類二項式公式”數據建模新工具(Xu-Roach定理),奠定了機器學習正則化方法的分析基礎;提出壓縮感知L1/2正則化理論,解決了稀疏信號處理、神經網絡系統、模擬進化計算中的一些重要基礎問題。此外,他還主持完成國家973、863、國家自然基金、香港UGC科學基金等國家級科研課題15項。

近年來人工智能的發展取得了令人矚目的成績,這離不開大數據的支持。作爲數據與信息技術領域的專家,徐宗本多次談到他對大數據發展的理解和對信息技術行業未來的判斷。讓我們一起了解。

如何準確理解大數據

如今“大數據”的概念幾乎無處不在,但對它的理解,僅僅停留在“大”上是不夠的。

徐宗本對大數據的解釋,是從“資料”開始的。他提出,資料是生產過程、管理過程,乃至經濟、社會、生活過程的記憶,這些記憶可能表現在一個文件、一段演講或一段文字上,這些資料放在計算機裏就叫數據,因此,數據是指以編碼形式存在的信息載體。大數據是指大而複雜的資料集,具有海量性、時變性、異構性、分佈性等特點,是人們從互聯網的數據中能夠觀察到的特徵。只要數據量超過臨界量,就叫大數據。

徐宗本認爲,大數據技術是人工智能的核心。人工智能是人類腦科學、認知科學的進展,它的可見趨勢是“大數據+場景”,由感知智能向認知智能的發展。

他還進一步提出了大數據背後的三個原理。

首先是量變到質變原理。大數據之所以有用,是因爲數據的量積攢到了可以引起質變的程度,人們通過分析就可以得知數據背後的故事。

其次是分析價值原理。大數據不僅是數據存儲、建立數據中心,更關鍵的是對數據的變現和分析,把不同的數據聚合在一起,就是大數據的價值來源,這其中有一種累積效應。徐宗本說,“我們積攢的數據可以用於生產,從數據到信息、知識、決策的轉化就是用計算、算法來分析出價值原理,數據的可複製、可加工能夠讓數據價值倍增”。

最後是跨界關聯原理。徐宗本以火鍋店爲例,假設老闆想提高營業額,他會收集一年當中的採購量、現金流等各種資料,這些是企業的內部數據。但對火鍋店的經營而言,外部數據的價值同樣是極爲重要的,比如周圍的人口分佈數據、該地區的天氣預報數據等等。這就是所謂的跨界關聯原理。

徐宗本指出,伴隨着大數據的出現,我們有很多觀念要改變,要認識到數據是資產,用戶是資源,服務即感知。

那麼,大數據有哪些價值呢?徐宗本認爲,這四個方面值得大家關注。

第一,大數據可以提供社會科學的方法論,實現基於數據的決策,支持管理科學與實踐的革命。

第二,大數據可以提供科學研究的新範式,支持基於數據的科學發現。

第三,大數據可以形成高新科技的新領域,推動行業深化發展並形成大數據產業。

第四,大數據可以形成社會進步的新引擎,深刻改變人們的思維、生產和生活方式,推動社會進步。

大數據的機遇與挑戰

在徐宗本看來,當前大數據爲全球提供了幾個重要機遇。

首先是管理創新機遇。通常來說,管理問題很難找到普適的方法論,不同的管理哲學因時地因素的差別,很容易出現“水土不服”。此外,決策問題也難以精確建模分析。於是,大數據認識論與方法論爲管理與決策科學研究與實踐提供了歷史性機遇。比如,在市場分析與精準營銷、輿情分析(社會、商業等)、政策分析與評估、金融風險分析和監控、工業系統智能控制、公共安全監控與治理、產業與經濟形勢評估等方面,管理者都可以充分利用大數據。

其次是產業發展機遇。徐宗本分析到,中國市場大、人口多的優勢,鑄就了大數據資源優勢,從而爲國家間競爭帶來了彎道超車的可能性,也爲產業的不斷升級、形成新價值、新產業提供無限可能性。

再次是科學研究機遇。徐宗本表示,現在的科學研究完全突破了過去的方式,甚至包括高等物理研究的方式都和以往大有不同。如今,數據收集、處理與分析能力的加強,將顯著提升人們對客觀世界的洞察深度,和可程序化探究問題的廣度,幫助人們發現新知識,創造新價值,形成新理念。

最後是學科發展機遇。大數據催生了數據科學、數據科學與人文社會科學、管理科學等學科的深度交叉與融合,將徹底打破和革新學科領域,對大學的學科設置和人才培養將產生重大影響。在未來,人文科學與理工科是需要跨領域交叉的。

儘管上述機遇令人鼓舞,徐宗本明確提出,大數據想要實現美好願景,還面臨着一系列的挑戰。

第一,重建分析基礎,包括重建統計學基礎和計算理論。

第二,革新計算技術,包括創新計算模式和計算方法。

第三,建立真僞性判定準則。

新一代信息技術的聚焦點

如今,伴隨着網絡技術和人工智能的發展,新一輪科技革命的到來已成共識。徐宗本認爲,這一輪新科技革命有三個突出特徵:數字化、網絡化與智能化。這“三化”也是新一代信息技術的焦點。

他提出,數字化爲社會信息化奠定基礎,其發展趨勢是社會的全面數據化;網絡化爲信息傳播提供物理載體,其發展趨勢是信息物理系統(CPS)的廣泛採用;智能化體現信息應用的層次與水平,其發展趨勢是新一代人工智能。

具體來看,數字化正從計算機化向數據化發展,這是當前社會信息化最重要的趨勢之一。徐宗本強調,數據化除包括數字化外,更注重對數據的收集、聚合、分析與應用,強化數據的生產要素與生產力功能。

網絡化正由互聯網向信息物理系統進發。從產業角度看,信息物理系統的涵蓋範圍小到智能家庭網絡、大到工業控制系統乃至智能交通系統等國家級甚至世界級的應用。這種涵蓋不僅是將現有的設備簡單連在一起,還會催生出衆多具有計算、通信、控制、協同和自治性能的設備,下一代工業將建立在信息物理系統之上。徐宗本指出,信息物理系統不僅會催生出新的工業,甚至會重塑現有產業佈局。

在智能化方面,新一代人工智能主要包括大數據智能、羣體智能、跨媒體智能、人機混合增強智能和類腦智能等。儘管在人臉識別、機器翻譯、棋類競賽等領域超越了人類,深度學習仍然面臨拓撲設計難、效果預期難、機理解釋難等重大挑戰。深度學習是典型的大數據智能,可應用性以存在大量訓練樣本爲基礎。而在未來,小樣本學習將是深度學習的發展趨勢。徐宗本把元學習視爲人工智能發展的下一個突破口,學會學習、學會教學、學會優化、學會搜索、學會推理等新近發展的元學習方法,已經展現了這類新技術的誘人前景。

劉老師

平平

王老師

相關文章