傳統行業應用AI面臨三大挑戰高質量數據是應用前提

　　傳統行業想獲得AI加持，爲何這麼難

　　近日，知名人工智能學者吳恩達發表文章，闡述了他對於人工智能在傳統行業中應用緩慢的理解。無論是刷短視頻時的個性化推薦，還是外賣配送時的耗時預估，或者是移動支付時的人臉識別，以算法爲代表的AI技術在消費互聯網行業被應用得“得心應手”。然而提到傳統行業，人們卻很難快速想起非常成熟的應用人工智能的典型案例。爲何AI技術在傳統行業的應用速度和範圍遠不如消費互聯網等行業?

　　消費互聯網行業應用AI更具優勢

　　“AI技術的應用主要取決於數據、算力和算法。”天津大學智能與計算學部副教授朱鵬飛介紹，首先數據要達到一定的體量，這是應用的基礎，此外算力也要能支持大規模的模型訓練，而後算法方面需要達到一定的精度，端側算力也要具備一定的推理能力。

　　之所以目前只有消費互聯網公司在大規模應用AI技術，主要是在這三方面消費互聯網公司都更具優勢。

　　前些年短視頻並沒有現在這麼火爆，例如發展初期的淘寶，也並沒有很強的用戶黏性。而隨着推送越來越精準，用戶的體驗感也得到了極大的提升，最終呈現井噴式的用戶增長。

　　“精準推送主要依賴於算法精度的提升，而算法精度的提升又離不開海量的數據作爲基礎。”朱鵬飛解釋，在這個單一的場景中，算法模型需要不斷進化，終身學習。由於不是封閉數據環境，總有新的數據加入，算法模型需要不斷通過學習進行調整、迭代升級，使其精度越來越高，形成一個良性循環。

　　“與此同時，雖然目前消費互聯網行業在算法精度上已經上升到一定的高度，但相比一些傳統行業的應用場景，消費互聯網行業對於AI算法精度接受的閾值都比較低。比如短視頻、淘寶偏好推薦、百度熱搜關鍵詞，只需要達到用戶產生黏性的目的，只要有一定準確性，用戶都可以接受。”朱鵬飛表示，相比之下，在很多傳統行業，對於技術精度的要求就高得多。比如基於視覺的AI技術在人臉識別方面的應用，在高鐵站、飛機場覈實身份，1∶1的比對準確度要高達99.99%甚至更高才可以進行應用。

　　在算力方面，目前雲端算力已經可以支持大規模模型訓練和推理，比如短視頻、淘寶推薦等。但在大量傳統行業應用場景中，智能終端上的端側算力還無法滿足推理的實時性和準確性要求。

　　“相比於社交網絡和電商系統，傳統行業應用場景的封閉生態系統使得雲端算力無法得到有效應用。”朱鵬飛舉例說，以智能無人系統巡檢爲例，電力巡檢、管道巡檢、交通巡檢、河道巡檢以及光伏巡檢等要求搭載在無人機和機器人上的算力滿足實時巡檢要求，由於視頻分析的模型複雜度較高，端側往往無法實現精準高效的實時推理，輕量級網絡在滿足實時性的同時損失了識別精度。由於算法精度達不到使用要求，使得在很多場景中無法實現AI技術的應用。

　　傳統行業應用AI面臨三大挑戰

　　吳恩達認爲，在AI應用方面，消費互聯網行業之外的其他行業都面臨着三大挑戰：數據集很小;定製化成本很高;從驗證想法到部署生產的過程很長。

　　對此，朱鵬飛也深有感觸，他以傳統制造業爲例進行了分析。

　　“傳統制造企業在製造向智造轉型的過程中，數據是一個很突出的問題。”朱鵬飛介紹，首先在數據的獲取方面存在一定難度。傳統制造企業的數據是封閉的，因爲很多傳統企業並不是新型信息化設備，沒有傳感器收集實時數據，也沒有數據中心，因此數據零散，缺失嚴重，很難獲取像消費互聯網企業裏那種海量、高質量的數據。

　　其次，行業內部各個工廠的數據很多具有商業價值，因此工廠都嚴格保密，這導致數據不流通，沒有辦法進行共享，進而形成了數據孤島效應，影響了AI算法模型的優化。

　　“我們在開發一個AI算法模型的時候，因爲數據的保密性，往往得到的數據都是經過‘脫敏’的，這也嚴重地影響了我們的判斷。而傳統行業的企業中，又缺乏具有AI算法模型開發能力的技術人員，因此雙方在合作研發過程中也存在着很高的壁壘。”朱鵬飛說。

　　此外，傳統行業中的數據來源並不像消費互聯網領域那樣來自單一場景，複雜的業務場景導致數據往往很“髒”，必須進行“清洗”，去掉大量無效信息，AI算法模型才能高效率的學習以提高精度。“這就像我們教小朋友知識，只講知識點，小朋友們才能學得快，如果在知識點中夾雜着大量無用的信息，小朋友無從分辨，學習效率肯定降低。”朱鵬飛介紹，而給數據標註“知識點”的工作是巨大而繁瑣的，需要企業有專人去做，要花費很多時間精力。

　　“傳統制造業要想獲得高質量的數據，就必須對生產設備進行信息化、智能化的改造。”朱鵬飛表示，這種改造需要企業投入大量的時間和精力，還會增加生產成本，這也成爲AI在傳統制造業中應用的壁壘。

　　高質量數據是應用前提

　　過去這10年，大部分AI的研發和應用是“以軟件爲中心”驅動的。在海量數據的支撐下，不斷優化軟件和算法，來獲得更高的算法精度。在傳統行業無法提高數據質量和數量的情況下，吳恩達認爲，傳統行業應該採用“以數據爲中心”的模式，把重點放在獲得質量更好、匹配度更高的數據上。

　　“在這種思路下，傳統行業也湧現了一些不錯的應用案例。比如醫學領域的影像識別AI系統，可以幫醫生‘看’CT影像片子，對腫瘤等病變加以識別，輔助醫生做出判斷。”朱鵬飛介紹，由於很多數據都由專業的放射科醫生在影像片子上進行了標註，因此數據比較準確，AI算法模型在學習的過程中進步很快。目前很多影像識別系統的準確率都能達到90%以上，由於是輔助醫生，最後還需醫生做醫療決策，但這個水平的準確率在很大程度上降低了醫生的工作強度。

　　“儘管傳統行業有了一些應用AI技術的成功案例，但是要想更好地和AI結合，還得在提高數據質量方面下功夫。”朱鵬飛建議，首先對於已經積累了海量數據的傳統行業，在保證數據安全的前提下，主動開放數據。挖掘數據中蘊藏的價值，和需求關聯起來，會有很大的發展空間。其次，對於新興行業，比如新能源汽車等，在構建智能工廠規劃的時候，就把獲取數據、智能化的因素考慮進去。

　　不過朱鵬飛強調，在傳統行業用好AI技術的同時，也不要濫用AI技術，在應用前做好評估，如果不能提高生產效率，對行業整體有所提升，那麼盲目強行使用AI技術，就是對資源的浪費。“比如一些應用場景需要AI算法達到99%以上的精度纔可以使用，通過評估，現有模型算法只能達到90%的精度，那麼這個場景就沒必要強行上馬AI技術了。”

　　“總而言之，對於AI技術的應用要數據先行，有高質量的數據再談應用，沒有好的數據很難有好的應用。”朱鵬飛說。

原標題：傳統行業應用AI面臨三大挑戰高質量數據是應用前提

值班主任：顏甲

傳統行業應用AI面臨三大挑戰高質量數據是應用前提

熱門新聞

週熱門

傳統行業應用AI面臨三大挑戰 高質量數據是應用前提

對話騰訊文檔鄢賢卿：用六年時間自研專業能力，只是用戶思維的底座

扎克伯格最新採訪：Meta最強開源模型Llama 3憑什麼值百億美金

宜家推出“窮鬼套餐”；lululemon將推出史上最多男裝；珀萊雅營收破70億｜品牌日報

阿里京東走過最長的彎路：從爭奪商家到迴歸用戶

抖音商城版獨立APP上線，意欲何爲？

汽車街通過港交所聆訊：國內最大二手車交易服務商，騰訊、京東均爲股東

ChatGPT火了以後，一個值錢的運營，需要具備的6個能力

公司如何藉助GenAI推動創新

美團開啓年內第四次架構調整

“All in短劇”背後：上線一個月就能覆蓋成本？

華爲Pura 70系列來了

10000家芯片公司“死於”2023

AI遙感日漸升溫，商湯、珈和坐上加速器

醫療大模型，巨頭們的新賽場

競逐智能家居大模型：美的“蓄力”，海爾“疾行”

熱門新聞

週熱門

傳統行業應用AI面臨三大挑戰高質量數據是應用前提