“網絡暴力”與人工智能自然語言處理的碰撞（上）

引

回看2014年6月，當時隨着隨着人民日報一篇題爲《激勵見義勇爲不能靠“鍵盤俠”》的時評發出後，各路媒體紛紛轉載，“鍵盤俠”這個詞在網絡上迅速火爆起來。其中，以“鍵盤俠”爲主人公的漫畫尤爲受人關注，漫畫裏主人公前後的行爲反差，以及在表達效果上對鍵盤俠這種不良網絡風氣所進行的辛辣諷刺，着實攪動着觀衆們的眼球。

一、鍵盤俠的世界你真的懂嗎

讓我們簡單回顧一下故事內容：一個帶着耳機外表很斯文的小夥在街上看到有老人摔倒默默地騎車走了，注意到公交上有扒手也裝作沒看見，看見路邊有小朋友受欺負也沒有上去幫忙。然而回到家後看到網上剛剛發生的新聞，小夥脫去斯文的外衣，露出“KEYBOARD MAN” 字樣的衣服，在電腦前惡評。

鍵盤俠們，平日光鮮亮麗待人友好，可在虛擬的世界中網絡，他們對着狹小的顯示屏露出了邪惡的一面。鍵盤俠們動動手指敲擊幾個字母就可能引起一場“命案”，可想而知鍵盤俠們的力量是多麼強大。他們不甘在雲淡風輕的生活中低調，願在虛擬的網絡世界中做一界妙語連珠、舞刀弄槍的“俠客”。

鍵盤俠們的這種行爲不同於現實生活中拳腳相加血肉相搏的暴力行爲，而是藉助虛擬的網絡空間用語言文字對他人進行傷害和誣衊。衆人拾柴火焰高，在虛擬網絡中，鍵盤俠們將文字、圖片運用的淋漓盡致，在自己看來這種行爲對自己並沒有什麼影響，但對受攻擊的受害者來說卻是一種危害嚴重、影響惡劣的暴力形式，這種暴力形式就是我們常說的網絡暴力。

在泛泛而談的虛擬世界中爲什麼會出現網絡暴力？網絡暴力給我們帶來了什麼影響又給這社會造成了什麼影響？言論自由是延續網絡暴力的罪魁禍首嗎？我們是否又可以通過一些技術手段更深層次去分析、甚至去抑制網絡暴力？而人工智能技術又在其中扮演一個什麼角色呢？以及如果沒有網絡暴力世界會變得更好嗎？

這也就是我們今天所想探討的問題：網絡暴力以及和其相關的人工智能技術。

二、淺談網絡暴力一二

首先我們來說說網絡暴力的形式，隨着互聯網時代的快速發展，即將迎來快速的5G時代，無論是上班族、學生、工人、老人，人手一臺智能手機。就我們最常見的網絡暴力的出現在微博、視頻、新聞資訊、論壇上，而微博作爲一個能與明星接觸的媒體平臺，加上一些其他有影響力的博主，使得整個資訊圈互動性非常強。由於這些平臺都有一個通病就是實時新聞強，內容豐富，刷新頻次快，這個通病不免也帶來了一些缺陷。

匿名性、門檻低和傳播快是網絡暴力的一大缺陷，喜與不斷地接受新事物的網友們，抓住了這個缺陷。由於註冊不受年齡限制，網名隨意起，無上限的網速，便開始網友們通過留言、點贊、轉發等無底線的暢所欲言。

網絡暴力在鍵盤之下沒人可以倖免，明星曬自拍、曬娃遭到無辜的被懟；知名公衆人物在自然災害發生後捐款達不到民衆心理價位遭受網民們的議論被逼捐；體育運動員輸了比賽會被說不敬業；一個沒有讓座位的視頻，網友們並不知道事情真相卻把當事人罵得狗血淋頭。

下面來看看近期發生且熱度較高的事件。

杜嘉班納辱華事件（D&G）

上個月在微博上熱議的杜嘉班納（D&G）辱華事件，因杜嘉班納拍攝了一個把中國傳統文化與意大利飲食相結合的《起筷喫飯》廣告片，視頻傳出後被某社交網站上某亞裔模特怒懟，並通過私信質疑視頻涉嫌性別歧視、對中國傳統文化的歧視嫌疑。

隨後有網友爆出杜嘉班納設計師在ins上的辱華言論，辱華言論截圖迅速在微博上引起熱議。隨後杜嘉班納聯合創始人S.G在社交媒體及微博平臺發表道歉聲明，並聲稱是賬號被盜行爲。當晚21日正是杜嘉班納的上海時裝秀，消息傳出後，衆多要出席當晚活動的明星都拒絕出席此次活動。

作爲大品牌公衆人，物杜嘉班納的辱華行爲因接受譴責，但事後杜嘉班納負責人也通過視頻致歉，視頻中說因爲家庭教育和社會因素導致對文化藝術理解上存在偏差，希望得到大家原諒。

然而視頻裏女模特的公司同樣也發表了道歉聲明，有不少網友對道歉惡評。

說到文化差異，有時誤解往往是因爲我們看待事物的角度不同，對於這件事言辭過激的網友們，我覺得我們對待任何事情都應該保持冷靜，當我們說出那樣的話的時候，我們是不是應該站在道德的最高點審視自己的所作所爲，說出那樣激進的話是不是也有損我們的道德形象。

重慶大巴墜江事件

還記得上個月的重慶大巴墜江事件嗎，公交碰到小轎車墜入江中，一時間熱度在微博熱搜榜上停留了好幾天。在證據爲覈實前由於主流媒體的報道帶偏了輿論的真相，導致網友們盲從評論，小轎車女司機成爲衆矢之的。

轎車女司機被貼上“女司機真可怕”、“轎車女司機逆行”等標籤，有不少網友跟風留言發帖辱罵女司機，就連女司機以前和朋友開的店鋪也被無端砸毀至歇業。然而劇情反轉，經進一步調查找到了公交車上的行車記錄儀內存卡，顯示是因乘客坐過站打司機，司機方向盤失控導致公交墜江。

我們在沒有了解事情真相的時候，我們不應該帶着有色的眼鏡去看待問題，更不應該用歧視的視角看待女性，往往一出什麼事故的時候最先想到的是女性。然而當真相公佈的時候，有個別媒體出來向女司機道歉，但還是有不少曾誣衊女司機的網友們180度反轉去譴責公交車視頻的真相。

對於上述兩個事件，無論是因文化差異引起的噴憤，還是在未了解事情真相的時候對無辜者的責任指定，還是明星們、公衆人物發的生活動態或出席某個活動，無非對錯都能遭到憤青們的肆意評論。噴子們不僅用文字或圖片的方式進行人身攻擊，還通過人肉搜索直接從網絡參透到現實社會，對受害者直面攻擊。

網絡暴力就像一灘渾水，若深陷其中將越陷越深，受害者因網絡暴力受到的道德的譴責和非等量懲罰，你們是否有考慮過受害者的感受，是否會有那麼些許的憐憫？

三、網絡暴力的背後

在快節奏的生活中，瑣碎的生活難免會遇到一些不順心的事情。在公司面對領導的不公對待、同事間的竊竊私語；公交車、地鐵上不小心的碰撞；一些看不慣事情或是突如其來的黴運。在現實社會人與人之間的交往中，我們受到很多制約的因素而無法將這些壓抑的情緒正常的宣泄和釋放。

近年來隨着互聯網的多變形式，暴力形式也變得多種多樣，從最開始的直接人身傷害逐漸演變成了網絡實施暴力。伴隨着互聯網虛擬化、匿名性、零成本、零代價的特點，使得網民可以更自由地表達自己的意見和觀點。

由於網絡暴力往往處於灰色地帶，大部分暴力行爲都尚未構成誹謗和侮辱，因此很難對網絡暴力實施者處以刑罰或者行政處罰。網民的言論只要不超越法律底線，有權自由發表言論。

愛鑽空子的網友們抓住了網絡的漏洞，俗話說的好：“耍猴兒不怕人多，看熱鬧不嫌事大”。既然在現實社會中因諸多因素制約不能宣泄，又何嘗不在虛僞的網絡世界中爲所欲爲呢？

說到網絡暴力帶來的危害，12年由陳凱歌導演的電影《搜索》，女主角在得知自己癌症晚期後坐公交車回公司，因得知病情心情十分低落沒有及時給老人讓座在公交上與老人發生了爭執。這場爭執不料被實習記者拍攝併發到網上，隨之而來的是對女主角的一系列人肉搜索和謾罵，最後導致女主角無奈跳樓。

不僅僅是電影，我們現實生活中有很多這樣的例子，有的時候在我們沒有了解事實真相的時候對無辜者無端的謾罵和指責，這能帶給我什麼好處呢？語言是有形的，最後造成的悲慘就是靠言語一點一點堆積的。

通過這些事件，那麼對於網絡上氾濫成災的言論我們又該應對、至少更深入的瞭解其背後的成因呢？通過當下的科學技術，我們是否能通過大數據分析去總結一下互聯網暴力事件中網民們的核心觀點或思想呢？我們又是否能從中找出一些規律和特徵，幫助我們更好地理解網民行爲，從而有效地應對、遏制這種現象呢？再者，對於提高整體網民的素質和青少年（構成了大部分網民）的道德水平，是否又能起到什麼幫助呢？

爲了更好地解決這些問題、或是尋找到未來的方向，我們將視線對準了當下最新的技術——人工智能，我們嘗試將人工智能自然語言處理技術應用於網絡暴力的分析上，看看是否能爲未來解決互聯網暴力的相關工作拋磚引玉。

四、AI技術與網絡暴力分析

隨着16年圍棋機器人Alpha Go戰勝圍棋世界冠軍，人工智能再一次進入了公衆視野。同時，無人駕駛、語音對話、人臉識別等人工智能技術亦不斷完成了數項突破。不可否認，近些年來人工智能發展迅速，和其相關的產品、服務已經不知不覺進入到我們生活中的方方面面。

人們普遍對人工智能的理解在智能家居、機械工具、圖像識別、軟件操作上，對自然語言處理（NLP）技術瞭解的人並不多。通常來說，電腦易於處理可以統計和計數的結構化數據，而對於文本、圖像等難以處理非結構化數據就要用更復雜的方式進行處理。故嘗試着讓電腦理解人類的語言、並用自然語言和我們進行通訊，這就是自然語言處理技術想要最終解決的問題。

回過頭來我們再來思考，自然語言處理對於我們更深入地分析網絡暴力現象有哪些幫助呢？這裏讓我們先拋磚引玉，從語憶自然語言處理引擎說起。

首先，對於評論、彈幕這樣成千上萬的非結構化語言數據，在自然語言處理技術的幫助有：

情緒解析引擎

情緒極值：以50分爲分界，對整體正負面情感特徵打分；十二種細節情緒：根據Plutchik情感輪理論體系，識別語義中12種不同細節情緒；情緒值/濃度：計算出語句的情緒濃度，即反映了特定情感的激烈程度；情感關鍵詞：從文本中智能識別並提煉對文本整體情緒影響最大的關鍵信息。

基於情緒解析引擎，我們可以針對某條微博內容所表達的情緒極值以及十二種細節情緒進行全量分析，從而詳細瞭解千萬條評論內容中網民們的整體情緒分佈；其次還可根據時間段來看隨着時間的推移網友們對這件事的態度的變化，即是否還是那麼厭惡/喜歡；再者，結合第三方數據——如用戶地域、性別等信息，我們還可以對不同人羣的肖像進行更精細地刻畫。

文本觀點提取

基於知識圖譜以及字詞間的相似度計算，高度精煉、概括每段話的核心表達觀點。

例如一句“喜歡這個妝容，但是口紅顏色太深了”，觀點1：妝好；觀點2：口紅深。對海量評論進行觀點提取，可以精準、高效地總結不同網民對於同一件事件所表達出的不同觀點，並可以對其進行歸類和比較，幫助分析人員在第一時間獲取用戶的關注熱點信息或是用戶最反感的主要問題等關鍵信息。

文本相似度判斷

一對一、一對多或是多對一的文本匹配，從理解不同字詞所表達的含義入手，結合知識圖譜，判斷兩段文本核心觀點的一致程度，

對同一事件或兩個不同事件的評論進行相似度對比，不僅可以根據結果看看用戶在用詞或表達上有什麼共同點；，不同事件間的評論對比，是不是還能幫助我們發現“惡性”事件及其評論內容之間的潛在關係，甚至能洞察出某件事/某個人近期的活動形象會不會影響對其輿論的積極/消極性？

詞法分析

句式分析：對文本內容中字詞的解讀，依照文本核心觀點表達，將字詞拆分成有語法含義的序列；詞法分析：基於知識圖譜以及字詞間的關係分析，可以展示出每個字詞的詞性和語法結構。

針對網民們成千上萬條評論，我們可以通過詞法分析引擎來觀察積極評論或消極評論分別常用的用詞習慣、句式、詞法。從中，我們可以總結出當下網民普遍所使用的的話術/用詞習慣，以及不同人羣在表達自己觀點時所特有的語言特點。而這，是否又能從某一個角度去幫助我們窺探如今這個互聯網時代中，大衆所受到的一些重要文化驅動……

我們相信，基於技術手段對互聯網暴力——新形態的“大衆情緒真實發泄”——進行分析，不僅能幫我們更好地瞭解暴力事件產生成因，亦能將互聯網這一平臺/媒體在信息傳播、文化傳承上所扮演的社會角色更清晰地展現在我們面前。

在《“網絡暴力”與人工智能自然語言處理的碰撞（下）》中，我們將具體結合NLP技術對我們挑選出來的網絡暴力事件進行分析，盡情期待。

—— 專注於大數據與人工智能 yuyidata.com

查看原文 >>