隨着雲計算以及互聯網技術的快速發展,數據智能掀起了新一輪發展浪潮,與新零售、製造業等行業開始深度融合,全面推動了工業4. 0 時代和“智慧中國”的到來。高質量的標註數據決定了一家人工智能公司競爭力,隨着大數據市場的快速發展,大數據的商業價值僅僅體現在數據的收集和統計上已經不能滿足應用行業的需求,各行業更致力於對數據深入挖掘,讓數據產生更大的價值。而龍貓數據作爲國內AI領先的數據智能踐行者,“讓數據產生價值”正是其始終堅持的核心理念,它通過數據智能解決方案賦能企業,挖掘數據的價值,讓數據去改變、去創造、去創新,“讓未來變成現在”。本期《企業名人坊》帶您走進AI數據行業的黑馬 龍貓數據CEO昝智。

企業背景:

龍貓數據是一家專業的人工智能數據服務提供商,隸屬於北京安捷智合科技有限公司。公司2014年成立之初曾專注於移動支付技術研發,主營產品爲閃電刷app,

2016年2月,公司正式向AI數據服務方向轉型,推出軟件龍貓衆包app和線上標註平臺龍貓數據。截至目前已經達到百萬用戶數量級,用戶分佈全國各地。

2017年9月,公司獲得中關村高新技術企業認證。2017年10月,公司獲得金沙江創投領投,九合創投、不惑創投(原真順基金)跟投3370萬人民幣A 輪融資。

人物:昝智 龍貓數據CEO,畢業於中國人民大學,擁有 7 年互聯網產品經驗。創業前曾先後就職於百度、豌豆莢,在百度擔任百度網盟商業產品經理;在豌豆莢擔任商業產品經理,負責豌豆莢應用推廣、遊戲聯運業務線。從0開始做到月收入數千萬。

記者:作爲AI數據行業的佼佼者,龍貓數據近年的發展是怎麼樣的? 龍貓數據有怎樣的願景?未來幾年會進行怎樣的佈局?

昝智 龍貓數據CEO:龍貓數據是一家基於人工智能數據採集和數據標註服務的科技平臺。公司於2014年成立於北京,專注爲人工智能企業提供數據綜合服務解決方案。其核心業務是爲 AI 及大數據領域公司提供數據採集、標註等定製化數據解決方案,服務領域涵蓋圖像、語音、文本、視頻四個方面。目前,“龍貓數據”旗下擁有衆包平臺“龍貓衆包”,包括移動端APP、PC端標註網站等。

目前用戶量達到百萬級,可承擔千萬人以上樣本量。公司爲客戶節約至少 50% 數據成本,是國內可調動數據處理人員最多、結果最精準的 AI 數據服務平臺。目前,龍貓數據長期合作伙伴包括:百度、騰訊、小米、今日頭條、蔚來汽車、升哲、出門問問、獵戶星空、Advance、圖森、下廚房、深鑑、Remo、YI+、西井、博雲、雲從、Video++ 等一系列國內領先科技公司。

具體業務方面,圖像採集、標註是“龍貓數據”的第一大業務。“龍貓數據”提供的解決方案可廣泛應用於計算機視覺、智能駕駛、智能安防、電商/新聞平臺等多個領域,包括但不限於人臉圖片、手勢識別、各類車牌、商超 SKU 分類,以及車道線、車輛行駛區域標註、車輛行人 2D/3D 拉框、3D 點雲等。龍貓數據公司曾爲多家無人車研發公司提供標註服務,積累了一批優秀標註員,每天可對數十萬張圖片進行標註。

語音/語義識別也是公司重要的業務之一。這方面,以語音交互智能硬件爲例,“龍貓數據”已爲多家相關公司提供語音錄製服務,短時間內交付數十萬人聲樣本,並且 100% 審覈,大幅提高了客戶研發進展。除此之外,龍貓數據還可提供語音轉寫 ASR,語義標註 NLP 等定製化服務。

記者:企業數據的安全是企業的重要的“鑰匙”,目前,行業內數據保護情況如何?龍貓爲保護數據安全都有哪些措施?

昝智 龍貓數據CEO:首先,大部分AI領域的創業者,更希望在算法與技術上取得突破,願意從互聯網產品上出發去提供服務的人很少。並且,對於這樣勞動密集型的產業,投資人也更爲謹慎,因此入局人較少。

第二,做數據服務,要同時保證質量和效率,其內部多種機制的建立並非一朝一夕就可以完成。昝智介紹,龍貓衆包平臺上的用戶,都是需要經過線上培訓和考試纔有資格接受任務的,並且,用戶標記後的數據會經過百分之百的審覈,審覈後還會進行抽審。例如對於圖片標點,會有不同用戶對同一張圖片進行標註,並對有差異的位置進行交叉驗證。

在提效方面,龍貓數據選擇與客戶聯手解決。例如,人臉識別領域的用戶本身就會有一定的算法基礎,這時龍貓數據會引用部分客戶的能力對數據進行判斷和檢查,同時客戶還可以幫助龍貓進行初步檢測以及標記的預處理,這樣做既可以提高龍貓數據的效率,還可以降低客戶成本,是一種雙方都樂於接受的方式。

第三,數據獲取較難。通常的數據服務公司會通過渠道或者地推的方式購買數據,然而當數據樣本增加(超過10萬),時間成本就會變得相當大。另一種獲取數據的方法,就是龍貓數據所使用的“衆包”,然而這種方法會引出另外一個難點,既互聯網產品思維。

互聯網產品思維。衆包平臺通常是以APP的方式連接用戶,然而單純的APP並不能構成轉化壁壘,這時就需要足夠的運營技巧,吸引用戶接受任務,以及邀請好友成爲新用戶。昝智表示,創始人的工作背景會影響該公司的做事風格,龍貓數據的CEO和CTO都曾就職於流量入口公司,有良好的互聯網產品思維和粉絲運營技巧。

目前公司的優勢在於依靠千萬級數據採集處理能力,構建了一整套高效健全的系統,從精度、速度、安全性三方面確保了數據結果。

精度上,龍貓數據平臺目前擁有多重審覈機制,包括標註、審覈、抽檢,多人交叉驗證,專業考覈及線下培訓等,並仍在不斷完善。

速度上,龍貓數據依託龍貓自有 APP 平臺數百萬 C 端標籤用戶,可實現根據需求實時調配人員,任務反應迅速。

安全性方面,龍貓數據支持將標註系統直接部署在客戶服務器上,不在自身服務器留存,解除了客戶對數據安全的顧慮。

記者:龍貓數據有怎樣的願景?未來幾年會進行怎樣的佈局?

昝智 龍貓數據CEO:龍貓數據自成立以來,團隊彙集一類高校和BAT行業頂尖人才,開源研發團隊近百人,努力搭建開發數據共享服務生態。目前龍貓數據團隊龍貓數據的企業文化中很重要的一點是:企業發展“以人爲本”。回顧這幾年來,我們爲取得的成績感到自豪;展望未來,我們更加感到任重而道遠。過去4年的成績代表了龍貓數據創業的汗水和足跡,未來的40年我們要更加努力發奮圖強,研發前沿的技術,提供優質的服務。繼往開來,迎接挑戰,不斷開拓前進。

這四年裏,龍貓數據遇過困難、犯過錯誤、受過挫折,但是通過龍貓數據團隊的兢兢業業、共同努力得到的認可和回報更爲重要。不斷地優化服務和提高數據質量與效率,合作客戶近百家以上是最好的證明。

龍貓數據通過不懈的努力得到業界的廣泛認可,隨着公司業務的蓬勃發展,員工隊伍也不斷壯大,在公司戰略目標的指引下,大家精誠團結,求實奮進,加強團隊學習,注重項目錘鍊,提高數據服務質量,優化產品應用內容。

接下來,龍貓數據將繼續廣納智賢、培養人才,爲年輕人創造更多的學習就業機會。在人工智能的領域不斷創新技術、尋求突破,爲行業內與行業外提供更多維度的服務和幫助。

在未來的日子裏,我們依然會更堅定的行走在路上,我們依然會懷抱我們的夢想披荊斬棘,不論前方有多少坎坷和艱辛,我們始終有理由相信更美好的風景一定在前方!

查看原文 >>
相關文章