同一個軟件,展示給一箇中年男人的內容,和一個年輕姑娘的內容,有多大區別?


最近,陸玖財經身邊很多男性朋友發現了一件非常有意思的事情,他們被算法集體判定爲了“有特殊需求”的用戶,比如他們用手機打開大衆點評搜索周邊SPA(水療),系統就會給他們匹配很多一看就很“激情燃燒”的店鋪,而在同位置的一名年輕女性用戶查看周邊SPA,結果就完全不同,一切都很正常;小紅書的同城展示結果也一樣,展示給中年男性的都是很露骨的年輕美女,她們的動態大多以交友爲目的;甚至抖音也能不斷的刷到各種交友用戶,引流到QQ之後,發現竟然是招嫖的賬戶。


陸玖財經不禁發出了一個疑問,爲什麼算法會判定男性用戶一定會有這種特殊需求呢?這到底是算法在作惡,還是算法背後的規則制定者在利用人性的弱點呢?

算法,你憑什麼就判定成年男人全是色狼呢?

點評小紅書等是重災區


年底了,陸玖財經編輯部想集體去按個摩放鬆一下身體,沒想到,按摩沒按成,還發現了一些問題。


當同事們同時拿起手機,打開大衆點評的按摩頁面,定位在附近,想看看都有什麼好去處時,發現每個人的推薦服務店鋪都不太一致,這究竟是爲什麼?


對於上述情況,陸玖財經專門拿了五部手機做起了一項實驗,想看看不同用戶的手機,究竟會有什麼差異。

先從大衆點評開始,這五部手機的相關信息分別爲中年男性、年輕女性和未註冊的新用戶。在大衆點評中點擊按摩/足療頁面,定位爲附近,兩個中年男性的手機顯示的爲:



內容非常露骨,店鋪名稱帶有深深的暗示意味,欲境、柔湄私夜養生……店鋪的宣傳圖片也是配以昏暗的燈光,有的直接露出了技師曼妙的身材。



打開店鋪,發現裏面還有女技師的自拍照片。但如果選擇那些看起來比較正常的按摩店,要麼展示技師穿着職業裝的正裝照,要麼就是不顯示技師的照片,所以這些店鋪的意圖何在?陸玖財經,不做評判,諸位讀者請自行體會。


而打開註冊信息爲年輕女性的手機,採用同樣的操作後,結果呈現出截然不同的頁面:



起碼看上去都是比較正規的按摩店,往下滑了半天才翻到一個與前一部手機重合的一些店鋪。不同的性別還能產生如此大之差異?


再看未註冊新用戶這邊,就更有意思了。



可能是因爲沒有獲取精準的用戶畫像,店鋪推薦比較均勻,一半是正常形態的店鋪,另一半則是疑似提供涉黃服務的店鋪。


很顯然,這些中年男性被算法貼上了可能存在特殊需求的標籤,被判斷爲“色狼”了。


陸玖財經走訪了部分有嫌疑的店名露骨的按摩SPA店鋪,大多開在不起眼的小區附近,甚至是小區內部。客人前往之後,往往就是不停暗示客人辦卡,並表示辦卡後會有其他超值服務。


無獨有偶,陸玖財經又針對小紅書平臺展開了同樣的試驗,收穫了同樣的結果。


打開中年男性的手機,小紅書首頁的推薦如下:



裏面有許多性感美女的自拍,她們的標題內容也比較直白,多是一些以交友爲目的的文案。


點進幾個女孩的筆記後,發現其發佈的內容非常露骨,包含大量敏感字眼,難道小紅書現在已經成了一個公開交友、拉客的平臺了嗎?



而年輕女性的小紅書首頁多是時尚美妝、美食等等,很少能看到這種暗示性或是交友的筆記內容。


算法似乎又把中年男人的喜好給定性了。


不只是大衆點評和小紅書,那天陸玖財經的同事在刷抖音的時候,刷到一個美女搔首弄姿的視頻,她的首頁個人資料介紹非常簡單,附上了自己的聯繫方式,只發布了唯一一條抖音。



陸玖財經覺得奇怪,因爲抖音裏的正常賬號,很少會有類似這樣的個人介紹,就打開QQ輸入了這串數字,想要一探究竟。加上她的QQ交流以後發現,此人完全就是一個招嫖賬號,內容十分直白,各項服務明碼標價。



不禁想問,現在的互聯網平臺,都如此評判人的喜好,明目張膽地推送涉黃信息嗎?

算法如何判定用戶是不是好色之徒


一位在曾在華爲工作過的資深算法軟件工程師趙學洪告訴陸玖財經,算法其實是通過對自然語言進行處理,以文檔的形式形成一個關係數據庫,基於用戶行爲和相關信息給用戶加上算法標籤,形成一個個的數據實體,數據實體在這一過程中將會被抽象出來,進行對應關係的匹配。平臺會根據自身設定的數學模型(算法模型)把這些對應關係放入數據庫中,得到一個自身想要的結果集。


算法模型在各個平臺之間是通用的,但是每個平臺之間採取的模型會有差異,這就直接導致了平臺獲得了不一樣的結果及方向。用戶畫像分析是算法數據蒐集的一個過程,數學公式會根據每個平臺的特性對用戶畫像進行對應的處理。


用戶畫像的生成與用戶過往的瀏覽行爲、人口統計學相關信息(如年齡、性別、地域、興趣等)以及相似用戶信息等密不可分,然後基於用戶畫像對用戶打上個人標籤,通過對標籤的分析和判斷幫助用戶進行信息過濾,形成用戶的個性化推薦,也就是各大平臺的推薦頁。


也就是說,算法先對“我”的信息展開分析和處理,然後將“我”和“我”相似年齡段的用戶信息放入模型中,推算“我”是一名喜歡瀏覽美女圖片、出入不明場所的色狼。


趙學洪還介紹說,早期的算法比較死板,需要讓用戶自行選擇喜歡的興趣內容,爲自己勾選標籤,然後進行信息過濾和推薦。而現在,以字節係爲代表的算法技術已經可以脫離這一階段,直接可以根據用戶習慣推理這些標籤,從而形成個性化內容。


算法技術發展到今天,已經越來越趨向於智能化,但像上述事件那樣智能,對人們而言究竟是福還是禍?


算法背後的價值觀是誰賦予的?

算法也有價值觀,你相信嗎?


趙學洪在採訪中告訴陸玖財經,控制算法的背後的人,存在價值觀。與其說是價值觀,不如說是價格觀,商業化纔是算法背後的核心。


平臺通過用戶行爲生成算法標籤,然後通過一系列大數據分析和推算,將用戶信息和市場信息相結合,同時考慮平臺自身信息的變化從而形成內容推薦,每天推薦的內容會根據當天形勢形成較大差異和變化,甚至是精確到每個時間點都會有差別。


算法作爲平臺吸引流量和完成商業化的工具,自然也就受到自身歸屬平臺的影響,形成了價值觀。


他舉了這樣一個例子,新浪微博的熱搜和****的熱搜往往會有較大的差異,但按理說在一個時間點,人們關注的事件會有很大的關聯性和交叉性,但是因爲平臺本身受衆和平臺關注的熱點存在差異,導致熱搜內容存在較大出入。很多時候可能不是我們想要關注這些熱點,而是這個平臺想讓你覺得它是熱點,就讓它出現在了熱搜推薦欄。


這些互聯網平臺裏的內容和服務,通過競價排名,出價高者可得優先推流權,平臺在這一過程中收取內容或是服務提供者的推流費和服務費,通過一些技術性手段,將這些內容提供給用戶,並且讓這些內容表面看上去沒有什麼破綻。


所以,那些中年男性被判定爲色狼也就不難理解了。算法通過猜測用戶喜好生成推薦,平臺爲了吸引流量,往往會利用人們的好奇心和興趣,在提供內容時加入刺激性的信息。

某內容平臺高管向陸玖財經爆料:之前,我們平臺要是出現流量數據下滑的情況,往往會在晚上發佈一些美女圖片,第二天一般流量就會回到正常水平甚至出現小幅提升。

這些平臺提供給你的刺激性信息,在達成KPI方面,事實證明是有效的。

一位前互聯網公司高管告訴陸玖財經:只要平臺是以KPI(績效考覈)爲導向,就會有打擦邊球的現象出現。的確,互聯網公司往往以PV、UV、停留時長等作爲一款產品或應用的KPI考覈點,而這些數字背後,都代表用戶的上網行爲。用刺激性信息引導用戶駐留,就成爲很多算法工程師工作的重要內容。


算法背後的規則制定者利用人性的弱點在作惡,算法本身或許並不具有價值觀,但因爲它依附於平臺,存在一定目標導向,它就有了價值觀。



算法其實是一把雙刃劍


某互聯網公司對於平臺提供涉黃信息向陸玖財經做出回應,目前平臺上提供的內容和服務,先由機器根據文字的關鍵字、圖片的圖形分析等進行過濾和篩選,一般能甄別出90%的不良信息,那剩下的10%交給人工。雖然這個比例看上去比較小,但實際操作起來,信息量依然很大,其中難免會存在疏漏,導致一些敏感信息未被及時處理,提供給了用戶。


上述這樣的平臺,並未對用戶盡到其應承擔的責任。互聯網並非法外之地,它存在着邊界。可以看到,《網絡安全法》、《民法典》中均規定了平臺運營者有保護用戶的法定義務。平臺在日後若繼續鋌而走險,監管不嚴,縱容用戶進行違規操作,發佈違規內容,隱蔽提供違規服務,破壞網絡環境,必將受到法律的制裁。


工信部、國家違法和不良信息舉報中心、掃黃打非辦等國家有關部門,對於APP涉黃曾經三令五申,屢次打擊,但爲何這類涉黃信息,一直屢禁不止?一切源於算法。一些APP的產品經理,似乎在利用算法打擦邊球,甚至利用算法逃避監管。


算法作爲一種技術,本是爲了給用戶提供更好的體驗而存在,如今卻逐漸淪爲了商業化的工具和手段。可謂是平臺把這一手好牌,打了個稀爛!


既然算法可以攪局,它也可破局。


部分資深的算法工程師曾經在一些公開論壇上表示,在未來,可以通過算法自身優化,解決平臺提供隱形涉黃內容的問題。算法可以通過對神經網絡的深度學習,達到更深層的階段,完全可以模仿人的行爲。只是目前技術和模型不夠成熟,實現不了太高的信息識別精度。當制約算法技術進步的壁壘突破後,完全有望實現99.9%的精度,到那時,機器可以完全取代人工,實現對涉黃內容的高精度篩查判斷,很難會有像平臺回應時所說的那樣漏網之魚的出現。


快手CEO宿華曾公開表示,算法其實和木匠的錘子、斧子類似,本質上是一個工具,主要是看用工具的人怎麼去用它,要用正確的價值觀指導算法。


相關文章