原標題:[大聲]科技公司免費向你提供服務?不,他們應該向你支付產生數據的酬勞

我們都是數據奴隸。

——

Jennifer Lyn Morone,藝術家

《科技公司免費向你提供服務?不,他們應該向你支付產生數據的酬勞》:

“數據奴隸”,美國藝術家 Jennifer Lyn Morone 認爲這是大部分現代人所處的狀態。爲了“換取”免費服務,我們將自己的信息和數據拱手送到科技公司手中,“個人數據其實比你想象中更值錢。”

她曾創作了一件作品:註冊了一個公司,將自己各方面的個人信息分類,標價,發售,總定價爲 7000 英鎊。

▲ Jennifer Lyn Morone 的個人信息,圖片來自《衛報》

雖然這看起來,就和她自己說的一樣——“荒謬極了”。但如果你退一步看,會發現這個藝術行爲和 Cambridge Analytica 購買 Facebook 用戶信息的性質是一樣的。

▲ 圖片來自《經濟學人》

在當今社會中,信息的確有價值,但用戶並沒有控制自己數據的權力。而且,就和人類勞動力一樣,數據的價值也很難被“定價”。在西方歷史中,部分人類勞動在很長時間裏都被迫“無償化”,直到各種各樣的工會形成,工人的薪資才提高至能過日子的程度。

這也是爲什麼,耶魯大學經濟學家 Glen Weyl 認爲,隨着勢態發展,類似“數據勞動工會(data-labour unions)”的組織將應運而生。這些組織將成爲特定羣體數據的守門人,併爲其爭取權利。

▲ 圖片來自 Business Insider

這聽起挺遙遠的,但《經濟學人》認爲這並非不可能,因爲對於人工智能的發展而言,人類的數據投入是必要的。

Weyl 將“人工智能”稱爲“集體智慧(collective intelligence)”,因爲現時大部分人工智能算法都是走深度學習模式,這也意味着,研究人員必須通過輸入大量由人類產生的“正確答案”,人工智能纔有可能“學會”識別圖像、語音等內容。隨着功能發展越高級,數據需求量就越大。

此前,《紐約時報》曾撰文對極度依賴輸入數據量的深度學習模式提出質疑。算法對數據的此般依賴,不僅限制了算法可應用的領域,同時,在本質上也註定了訓練出來的算法必然刻板,很容易受到劣質數據源影響。這也是爲什麼,不少研究人員已經開始嘗試不同類型的人工智能訓練分支,探索更靈活的方式。

但在另一種算法“引領新時尚”前,大部分公司估計仍將採用基於大量數據的算法模式,它們對數據的渴望也將繼續下去。事實上,現在已經有科技公司爲數據聘請人類員工的模式雛形。

正如愛範兒在《那些假裝成 AI 的人類》一文中報道,部分公司的算法因爲不夠成熟,需要聘請人類員工來進行內容糾正(對外還是稱“這是人工智能的成果”),而亞馬遜 AWS 的衆包平臺 Amazon Mechanical Turk 上就發佈了不少這類工作機會。

▲ 圖片來自 Medium

《經濟學人》指出,即便如此,在邁向“付費數據勞動”的路上,我們需要準備的還有很多,相對應法規就是其中一部分。從某個層面來看,早前歐盟提出的 GDPR 是第一步,要求科技公司賦予消費者查看、下載甚至刪除個人信息的權利。

其次,我們還需優化數據計量的工具,制定衡量數據對人工智能發展價值的體系,甚至爲日後可能產生的數據價值不均等可能帶來的社會問題做準備……

但在那之前,大家還是得有相關意識。不能一邊說覺得自己的數據很重要,另一邊就把自己的信息隨便拋給網絡上的服務。

相關文章