6月27日,蜜度發佈了人工智能前沿應用成果——跨模態檢索引擎MiduCMR,在多模態信息檢索領域取得重大突破。基於MiduCMR,蜜度索驥推出跨模態檢索功能,實現視頻、音頻、圖片、文本等不同模態信息在統一語義空間中的跨模態檢索;蜜度版權通推出文本、圖片、視頻的版權保護與監測功能,實現多模態信息融合的一站式知識產權保護。目前,蜜度索驥、蜜度版權通產品可在蜜度官網中進行體驗。

數字時代,數據智能已成爲輔助決策的重要手段之一,社交媒體內容數據在社會治理、企業營銷、媒體變革中發揮着重要作用。隨着視頻技術、網絡技術、5G的發展,互聯網信息正在從文字、圖像向圖片、音頻、視頻相互融合的多模態內容轉變。但視頻、音頻、圖片、文本信息搜索之間存在一定的壁壘,這些形態豐富、來源多樣、數量巨大的多模態內容數據難以得到有效的分析和應用。例如視頻、短視頻通常是文字、圖像、音頻等多種形態的組合,而常用的內容提取和分析方法主要針對文字、圖像的單個模態進行,難以在多類模態之間實現“跨越”。同時音視頻在傳播過程中容易產生裁剪、編輯等二次創作的情況,內容較爲複雜,基於文本關鍵詞的檢索方法也存在信息發現不全面、侵權線索不容易發現、信息難以合併、追溯難度大等問題。

面對數字時代的新需求,上海蜜度信息技術有限公司自主研發推出跨模態檢索引擎MiduCMR,爲視頻、音頻、圖片、文本等多模態內容的檢索、分析、應用提供解決方案,幫助政企、媒體及創作者更好地面對全媒體多模態信息傳播的新挑戰。

跨越語義鴻溝 多模態信息一鍵檢索

MiduCMR突破傳統的單一模態的信息檢索方式,實現了跨模態信息的一鍵檢索。引擎從微博、論壇、App、短視頻等來源的多模態信息中,提取視頻、音頻、圖片、文本內容並對其進行單模態理解和多模態融合,將海量全媒體信息映射到統一語義空間,跨越不同模態內容間的語義鴻溝,自動理解、關聯多模態間的關鍵要素。

基於強大的跨模態檢索能力,MiduCMR實現了以文本搜圖片,以文本搜音視頻,以圖片搜文本,以圖片搜圖片,以圖片搜視頻,以音頻搜文本,以音頻搜視頻等跨模態信息檢索功能,快速呈現所需的多模態信息;並能夠智能識別圖片中的文字內容,準確解析視頻中的字幕、背景、封面等特徵元素,爲深度數據分析提供基礎。

多樣化識別分析 應用場景豐富

在跨模態檢索的應用方向上,MiduCMR能爲政企、媒體提供多樣化的支持。目前,MiduCMR利用跨模態對比學習、語義融合、語義表徵、語義檢索等技術,實現了跨模態視頻打標籤、相似視頻檢索、場景識別等一系列解決方案。

針對政務應用場景,基於MiduCMR的蜜度索驥已支持約300個特殊場景的識別分析,有效提高政企、媒體等單位對視頻等多模態內容發現、分析的準確度及應急反應速度,幫助用戶及時發現公衆需求、瞭解情緒變化、聆聽建議心聲、關注輿論動向、捕捉判別謠言,保護知識產權、打擊假冒僞劣,爲政府宣傳、公安網安、社會治理、互聯網內容安全的數字化升級工作提供支持。

針對知識產權應用場景,基於MiduCMR的蜜度版權通已經支持全網多場景中的版權保護,幫助企業、媒體、個人、律所、MCN機構、影視創作機構進行文本版權、圖片版權、視頻版權的監測、預警、追蹤與智能取證。同時,蜜度版權通能夠對商標侵權、產品設計與包裝侵權、外觀設計專利侵權等行爲進行監測、預警、追蹤與智能取證。

據悉,蜜度將基於MiduCMR推出更多的跨模態檢索產品,以人工智能技術的應用突破,在公安、消防、教育、醫療、民生以及內容監管、品牌洞察、知識產權保護等領域提供豐富的數據智能應用與解決方案,爲數字政府、數字營銷、數字媒體、數字城市等場景助力賦能。

舉報/反饋
相關文章