相關新聞:

馬斯克:推特說我泄露機器人樣本量,違反保密協議

馬斯克:目前沒有證據表明推特虛假賬號佔比小於5%,最火的推文也只有2%日活用戶點贊

新浪科技訊 北京時間5月16日早間消息,據報道,特斯拉CEO埃隆·馬斯克收購Twitter推特)的交易節外生枝。馬斯克自己抽樣調查了推特虛假賬號比例,但其方法被專家評價太“愚蠢”。

當地時間上週五,他突然宣佈讓440億美元收購推特的計劃暫停,理由是要親自研究推特平臺上虛假和垃圾信息賬號的比例。這一舉動導致推特股價當天暴跌。

質疑推特數據

稍後,馬斯克予以澄清,表示自己仍致力於收購推特,不過他依然強調了虛假賬號問題帶來的困擾。馬斯克透露,他自己的團隊會進行獨立研究分析。對於推特在最近財報中公佈的虛假賬號數據,馬斯克表示懷疑。

在公佈第一季度財報時,推特管理層表示,在平臺上的確存在一些虛假和垃圾信息賬號,另外還有“合法牟利”的日活躍用戶。

推特表示,公司對一批推特用戶賬號的樣本進行了內部分析,在今年第一季度,公司估計虛假賬號和垃圾信息賬號佔到日活用戶的比例低於5%。

推特還承認,在過去三年時間裏,公司對於平臺活躍用戶的數據高估了140萬人到190萬人。據介紹,2019年3月,推特曾經推出一個功能,可以讓一個用戶把不同的推特賬號鏈接在一起,以便方便切換,但是這個功能犯了一個錯誤,即母賬號進行的一些互動活動,導致所有的關聯賬號都被認定爲日活躍用戶。

有專家表示,馬斯克接下來要採取的一些行動力度可能不夠。

馬斯克的統計方法

在推文中,馬斯克介紹了自己的團隊將如何確定推特上虛假賬號、垃圾信息賬號和重複賬號的情況。

馬斯克團隊將隨機抽樣關注“推特公司官方賬號”的100名粉絲,他邀請其他用戶重複這一方法。馬斯克進一步解釋說,可以隨便找一個擁有很多粉絲的推特賬號,忽略前面的1000名粉絲,然後每隔10個粉絲挑出一個(作爲統計樣本),馬斯克也表示願意聽取其他更好的研究方法。

馬斯克還表示,之所以拿100人作爲粉絲調查樣本,是因爲這是推特在財報中計算用戶數量的單位。

馬斯克表示,任何合理的隨機抽樣過程都是可以的,如果很多獨立賬號得出了有關虛假賬號、垃圾信息賬號和重複賬號的類似比例,那麼這可以反映出一個重要信息。

對於馬斯克是否清楚描述了團隊將要採用的統計方法,推特方面拒絕評論。

並非真正隨機

Facebook平臺的聯合創始人Dustin Moskovitz也發表推文,加入到了這一問題討論中。他表示,馬斯克的統計方法並不是真正隨機,使用的樣本數太少,可能導致巨大偏差。

Moskovitz也表示,如果不相信推特團隊抽取的樣本,這本身也是問題。

美國科技公司“BotSentinel”的創始人兼首席執行官Christopher Bouzy表示,其公司分析,推特不真實的賬號比例高達10%到15%,其中包括虛假賬號、垃圾信息賬號、重複賬號、從事惡意活動的機器人賬號,以及單一目的的仇恨賬號(主要攻擊和騷擾其他人),另外還有大量賬號故意傳播虛假信息。

BotSentinel的研究方法主要採取衆包模式,該公司採用計算機軟件和人工審查員聯合的方式,來研究推特的不真實賬號活動。目前,該公司監控了推特上250萬個賬號,主要是英文用戶。

布奇還表示,根據相關內容話題的不同,推特上不真實賬號的數字也會呈現高低變化。他自己公司的研究發現,在政治、加密貨幣、氣候變化、新冠病毒等爭議性話題上,不真實賬號的數字高於其他非爭議話題,比如養貓、摺紙藝術等。

馬斯克方法太“愚蠢”?

美國華盛頓大學的教授Carl T. Bergstrom表示,對於高達440億美元的大型併購交易來說,拿出一個單一用戶的100名粉絲來進行抽樣調查,這並不是合格的盡職調查。

Bergstrom表示,相比於社交媒體研究人員進行的抽樣數量,100個的樣本小了幾個數量級。馬斯克自己的統計方法可能出現所謂“選擇性偏差”的錯誤。

這位學者表示,沒有任何理由來支持這個想法,即某個推特官方賬號的粉絲,是推特平臺用戶的代表樣本。也許機器人賬號爲了避免被發現,可能不會去關注官方賬號,也許這些機器人賬號會比人類賬號更加熱衷於關注他人,但是馬斯克的抽樣研究方法有些“愚蠢”。

相關文章