數字經濟時代,每個個體和組織機構都已經成爲海量數據的生產者和消費者,基於數據智能的產品優化與迭代也已經成爲智能化進程中企業創新、發展的關鍵能力。3月20日,百度技術沙龍第90期於線上召開,沙龍圍繞“數讀城市:百度時空大數據分析與預測技術”爲主題,邀請了來自百度研究院的多位資深研發工程師,就異地POI推薦、機器學習在時空大數據上的應用、羣體感知、百度數據聯邦平臺等話題爲觀衆分享了數據智能方向的技術應用經驗,同時也爲企業數據智能化的發展及應用提供參考、指引方向。

百度技術沙龍自舉辦以來,在9年內面向超過9100名與會受衆舉辦了共90期活動,邀請了159位行業技術大牛、206位百度技術專家,內容覆蓋軟件開發、大數據、深度學習等當下熱門的技術話題,旨在爲開發者、技術人員提供一個自由的技術交流和分享平臺。本期沙龍是百度技術沙龍升級2.0後的首期活動,內容除了兼顧分享的前沿性,更全面考慮瞭如何讓受衆更精準,傳播更有溫度,並通過與技術社區的共同行動、定向邀約,希望讓對技術感興趣、有需求的人能夠收穫一場“知趣合一”的技術宴會。

沙龍活動中,百度資深研發工程師首先圍繞着“異地場景POI推薦”和背後的“冷啓動問題”出發,爲大家帶來了推薦系統中新的解決方案。相較於傳統的推薦模式,這個方案利用圖神經網絡挖掘歷史用戶的本地行爲偏好和異地簽到行爲,從而表徵用戶的本地偏好以及異地的空間地理信息約束,在聚合通用出行意圖與用戶個體偏好後,通過多層感知機對本地偏好與異地偏好的遷移進行刻畫。該方法的有效性,也通過真實物理世界的跨城出行記錄數據實驗進行了驗證。

另一位百度高工從機器學習技術在時空大數據以及新冠疫情防控中的應用方向,介紹了新冠肺炎高風險小區預警框架C-Watcher。C-Watcher能夠通過其具有創新性的對抗編碼器框架來提取城市之間的共性特徵,在新冠病毒從疫情重災區傳播到目標城市之前,就預測出目標城市中每個小區的疫情感染風險,以做到在疫情早期,從大量居民小區中有效地篩查出高風險小區。

此外,在智慧出行方面百度也擁有豐富的經驗。針對不同人羣差異化的出行需求,百度提出了改善方案——自適應互監督多任務圖神經網絡(Ada-MSTNet)。該方案不僅可以在不同羣體和區域對應的任務間共享信息,還可以有效防止不相關任務之間的噪音傳播,帶領開發者瞭解圖神經網絡、多任務學習和自監督學習等前沿技術在城市交通預測方面的應用。

(細粒度區域流量分析&人羣需求分析)

最後,百度資深研發工程師深度講解了百度數據聯邦平臺及其應用和前沿研究。百度數據聯邦平臺是基於領先的雲上可信計算和可信數據存儲容器,實現跨信任實體的雲上大規模數據聯邦計算和分析平臺,提供基於“雲智一體”的百度智能雲的大數據處理服務。百度不止對數據聯邦平臺的存儲進行了優化,提升了數據存儲的效率,還基於數據聯邦平臺,與合作單位提出了第一款基於百度圖神經網絡的疫情預測模型。此外,工程師們基於疫情的空間大數據,總結了疫情與搜索、居民外出及當地經濟情況的關係。在線上沙龍中,百度工程師也分享了在數邦平臺的安全數據處理的幫助下對分佈式的車輛共享進行的研究,提出了合理的車輛調度方法,從而降低了成本。另外,基於數據聯邦平臺的聯邦學習與可解釋性的研究與進展也是本次分享中的一大亮點。

(基於飛槳的疫情預測深度學習模型結果)

“數據是21世紀的石油”,數據的重要性已然成爲行業共識。站在“十四五”開局之年,以雲計算、人工智能等爲代表的新興技術,正在推進數據智能的發展,不斷推動技術創新和落地應用。未來,百度技術沙龍2.0還將不斷凝聚前期活動的經驗,通過“有趣,有料,有溫度“的方式將最實用的專業知識傳遞到有需求的人手中,進而從人才角度助力產業智能化轉型,讓所有人都有望分享到數字經濟帶來的紅利。

— 完 —

相關文章