算法，憑什麼判定成年男人全是色狼？

同一個軟件，展示給一箇中年男人的內容，和一個年輕姑娘的內容，有多大區別？

最近，陸玖財經身邊很多男性朋友發現了一件非常有意思的事情，他們被算法集體判定爲了“有特殊需求”的用戶，比如他們用手機打開大衆點評搜索周邊SPA（水療），系統就會給他們匹配很多一看就很“激情燃燒”的店鋪，而在同位置的一名年輕女性用戶查看周邊SPA，結果就完全不同，一切都很正常；小紅書的同城展示結果也一樣，展示給中年男性的都是很露骨的年輕美女，她們的動態大多以交友爲目的；甚至抖音也能不斷的刷到各種交友用戶，引流到QQ之後，發現竟然是招嫖的賬戶。

陸玖財經不禁發出了一個疑問，爲什麼算法會判定男性用戶一定會有這種特殊需求呢？這到底是算法在作惡，還是算法背後的規則制定者在利用人性的弱點呢？

算法，你憑什麼就判定成年男人全是色狼呢？

點評小紅書等是重災區

年底了，陸玖財經編輯部想集體去按個摩放鬆一下身體，沒想到，按摩沒按成，還發現了一些問題。

當同事們同時拿起手機，打開大衆點評的按摩頁面，定位在附近，想看看都有什麼好去處時，發現每個人的推薦服務店鋪都不太一致，這究竟是爲什麼？

對於上述情況，陸玖財經專門拿了五部手機做起了一項實驗，想看看不同用戶的手機，究竟會有什麼差異。

先從大衆點評開始，這五部手機的相關信息分別爲中年男性、年輕女性和未註冊的新用戶。在大衆點評中點擊按摩/足療頁面，定位爲附近，兩個中年男性的手機顯示的爲:

內容非常露骨，店鋪名稱帶有深深的暗示意味，欲境、柔湄私夜養生……店鋪的宣傳圖片也是配以昏暗的燈光，有的直接露出了技師曼妙的身材。

打開店鋪，發現裏面還有女技師的自拍照片。但如果選擇那些看起來比較正常的按摩店，要麼展示技師穿着職業裝的正裝照，要麼就是不顯示技師的照片，所以這些店鋪的意圖何在？陸玖財經，不做評判，諸位讀者請自行體會。

而打開註冊信息爲年輕女性的手機，採用同樣的操作後，結果呈現出截然不同的頁面：

起碼看上去都是比較正規的按摩店，往下滑了半天才翻到一個與前一部手機重合的一些店鋪。不同的性別還能產生如此大之差異？

再看未註冊新用戶這邊，就更有意思了。

可能是因爲沒有獲取精準的用戶畫像，店鋪推薦比較均勻，一半是正常形態的店鋪，另一半則是疑似提供涉黃服務的店鋪。

很顯然，這些中年男性被算法貼上了可能存在特殊需求的標籤，被判斷爲“色狼”了。

陸玖財經走訪了部分有嫌疑的店名露骨的按摩SPA店鋪，大多開在不起眼的小區附近，甚至是小區內部。客人前往之後，往往就是不停暗示客人辦卡，並表示辦卡後會有其他超值服務。

無獨有偶，陸玖財經又針對小紅書平臺展開了同樣的試驗，收穫了同樣的結果。

打開中年男性的手機，小紅書首頁的推薦如下：

裏面有許多性感美女的自拍，她們的標題內容也比較直白，多是一些以交友爲目的的文案。

點進幾個女孩的筆記後，發現其發佈的內容非常露骨，包含大量敏感字眼，難道小紅書現在已經成了一個公開交友、拉客的平臺了嗎？

而年輕女性的小紅書首頁多是時尚美妝、美食等等，很少能看到這種暗示性或是交友的筆記內容。

算法似乎又把中年男人的喜好給定性了。

不只是大衆點評和小紅書，那天陸玖財經的同事在刷抖音的時候，刷到一個美女搔首弄姿的視頻，她的首頁個人資料介紹非常簡單，附上了自己的聯繫方式，只發布了唯一一條抖音。

陸玖財經覺得奇怪，因爲抖音裏的正常賬號，很少會有類似這樣的個人介紹，就打開QQ輸入了這串數字，想要一探究竟。加上她的QQ交流以後發現，此人完全就是一個招嫖賬號，內容十分直白，各項服務明碼標價。

不禁想問，現在的互聯網平臺，都如此評判人的喜好，明目張膽地推送涉黃信息嗎？

算法如何判定用戶是不是好色之徒

一位在曾在華爲工作過的資深算法軟件工程師趙學洪告訴陸玖財經，算法其實是通過對自然語言進行處理，以文檔的形式形成一個關係數據庫，基於用戶行爲和相關信息給用戶加上算法標籤，形成一個個的數據實體，數據實體在這一過程中將會被抽象出來，進行對應關係的匹配。平臺會根據自身設定的數學模型（算法模型）把這些對應關係放入數據庫中，得到一個自身想要的結果集。

算法模型在各個平臺之間是通用的，但是每個平臺之間採取的模型會有差異，這就直接導致了平臺獲得了不一樣的結果及方向。用戶畫像分析是算法數據蒐集的一個過程，數學公式會根據每個平臺的特性對用戶畫像進行對應的處理。

用戶畫像的生成與用戶過往的瀏覽行爲、人口統計學相關信息（如年齡、性別、地域、興趣等）以及相似用戶信息等密不可分，然後基於用戶畫像對用戶打上個人標籤，通過對標籤的分析和判斷幫助用戶進行信息過濾，形成用戶的個性化推薦，也就是各大平臺的推薦頁。

也就是說，算法先對“我”的信息展開分析和處理，然後將“我”和“我”相似年齡段的用戶信息放入模型中，推算“我”是一名喜歡瀏覽美女圖片、出入不明場所的色狼。

趙學洪還介紹說，早期的算法比較死板，需要讓用戶自行選擇喜歡的興趣內容，爲自己勾選標籤，然後進行信息過濾和推薦。而現在，以字節係爲代表的算法技術已經可以脫離這一階段，直接可以根據用戶習慣推理這些標籤，從而形成個性化內容。

算法技術發展到今天，已經越來越趨向於智能化，但像上述事件那樣智能，對人們而言究竟是福還是禍？

算法背後的價值觀是誰賦予的？

算法也有價值觀，你相信嗎？

趙學洪在採訪中告訴陸玖財經，控制算法的背後的人，存在價值觀。與其說是價值觀，不如說是價格觀，商業化纔是算法背後的核心。

平臺通過用戶行爲生成算法標籤，然後通過一系列大數據分析和推算，將用戶信息和市場信息相結合，同時考慮平臺自身信息的變化從而形成內容推薦，每天推薦的內容會根據當天形勢形成較大差異和變化，甚至是精確到每個時間點都會有差別。

算法作爲平臺吸引流量和完成商業化的工具，自然也就受到自身歸屬平臺的影響，形成了價值觀。

他舉了這樣一個例子，新浪微博的熱搜和****的熱搜往往會有較大的差異，但按理說在一個時間點，人們關注的事件會有很大的關聯性和交叉性，但是因爲平臺本身受衆和平臺關注的熱點存在差異，導致熱搜內容存在較大出入。很多時候可能不是我們想要關注這些熱點，而是這個平臺想讓你覺得它是熱點，就讓它出現在了熱搜推薦欄。

這些互聯網平臺裏的內容和服務，通過競價排名，出價高者可得優先推流權，平臺在這一過程中收取內容或是服務提供者的推流費和服務費，通過一些技術性手段，將這些內容提供給用戶，並且讓這些內容表面看上去沒有什麼破綻。

所以，那些中年男性被判定爲色狼也就不難理解了。算法通過猜測用戶喜好生成推薦，平臺爲了吸引流量，往往會利用人們的好奇心和興趣，在提供內容時加入刺激性的信息。

某內容平臺高管向陸玖財經爆料：之前，我們平臺要是出現流量數據下滑的情況，往往會在晚上發佈一些美女圖片，第二天一般流量就會回到正常水平甚至出現小幅提升。

這些平臺提供給你的刺激性信息，在達成KPI方面，事實證明是有效的。

一位前互聯網公司高管告訴陸玖財經：只要平臺是以KPI（績效考覈）爲導向，就會有打擦邊球的現象出現。的確，互聯網公司往往以PV、UV、停留時長等作爲一款產品或應用的KPI考覈點，而這些數字背後，都代表用戶的上網行爲。用刺激性信息引導用戶駐留，就成爲很多算法工程師工作的重要內容。

算法背後的規則制定者利用人性的弱點在作惡，算法本身或許並不具有價值觀，但因爲它依附於平臺，存在一定目標導向，它就有了價值觀。

算法其實是一把雙刃劍

某互聯網公司對於平臺提供涉黃信息向陸玖財經做出回應，目前平臺上提供的內容和服務，先由機器根據文字的關鍵字、圖片的圖形分析等進行過濾和篩選，一般能甄別出90%的不良信息，那剩下的10%交給人工。雖然這個比例看上去比較小，但實際操作起來，信息量依然很大，其中難免會存在疏漏，導致一些敏感信息未被及時處理，提供給了用戶。

上述這樣的平臺，並未對用戶盡到其應承擔的責任。互聯網並非法外之地，它存在着邊界。可以看到，《網絡安全法》、《民法典》中均規定了平臺運營者有保護用戶的法定義務。平臺在日後若繼續鋌而走險，監管不嚴，縱容用戶進行違規操作，發佈違規內容，隱蔽提供違規服務，破壞網絡環境，必將受到法律的制裁。

工信部、國家違法和不良信息舉報中心、掃黃打非辦等國家有關部門，對於APP涉黃曾經三令五申，屢次打擊，但爲何這類涉黃信息，一直屢禁不止？一切源於算法。一些APP的產品經理，似乎在利用算法打擦邊球，甚至利用算法逃避監管。

算法作爲一種技術，本是爲了給用戶提供更好的體驗而存在，如今卻逐漸淪爲了商業化的工具和手段。可謂是平臺把這一手好牌，打了個稀爛！

既然算法可以攪局，它也可破局。

部分資深的算法工程師曾經在一些公開論壇上表示，在未來，可以通過算法自身優化，解決平臺提供隱形涉黃內容的問題。算法可以通過對神經網絡的深度學習，達到更深層的階段，完全可以模仿人的行爲。只是目前技術和模型不夠成熟，實現不了太高的信息識別精度。當制約算法技術進步的壁壘突破後，完全有望實現99.9%的精度，到那時，機器可以完全取代人工，實現對涉黃內容的高精度篩查判斷，很難會有像平臺回應時所說的那樣漏網之魚的出現。

快手CEO宿華曾公開表示，算法其實和木匠的錘子、斧子類似，本質上是一個工具，主要是看用工具的人怎麼去用它，要用正確的價值觀指導算法。

算法，憑什麼判定成年男人全是色狼？

熱門新聞

週熱門

算法，憑什麼判定成年男人全是色狼？

公司如何藉助GenAI推動創新

美團開啓年內第四次架構調整

“All in短劇”背後：上線一個月就能覆蓋成本？

華爲Pura 70系列來了

10000家芯片公司“死於”2023

AI遙感日漸升溫，商湯、珈和坐上加速器

醫療大模型，巨頭們的新賽場

競逐智能家居大模型：美的“蓄力”，海爾“疾行”

博弈加速，58同城、同道獵聘、牛客搶灘AI面試

用數字化系統來驅動管理是本末倒置嗎？

歐洲版OpenAI又要融資，估值50億美元，Llama 2“套殼”也能半年估值翻番？

產品賣爆的背後，情緒價值正在成爲主要推力

Sam Altman最新採訪：模型性能不是長期差異化的關鍵

氪星晚報｜馬斯克：特斯拉正精簡銷售和交付體系；Take-Two宣佈裁員約5%；中國首個音樂SOTA模型“天工音樂大模型”開啓公測

AI數據荒下的創業衆生相：盜用GPT-4生成數據訓練模型，引發投資人擔憂

熱門新聞

週熱門