21 君:我們每天都在刷頭條、瀏覽彈窗、接觸海量的數據信息,普通人一天大約要接收 30G 的數據,但大部分人不知道如何正確地解讀這些數據。

這些信息背後隱藏着什麼真相?如何在信息龐雜的世界中識別數據謊言、挖掘有用信息?對數據的理解,將有助於你在數字時代做出明智決策。

本文摘編自《數據的真相:如何在數字時代做出明智決策》

編輯丨陳思;實習生 傑怡

約翰和邁克運用淺顯易懂的語言,教我們如何處理每天洪水一般向我們湧來的數據,從而將數據所帶來的可能性展示給更多人。這本書的價值不可估量!

——布拉德利 · 霍洛維茨(谷歌圖片和信息流部門副總裁)

題記

圖片來源 / 圖蟲

美國《人物》雜誌曾有一篇文章標題叫做 " 住在星巴克旁邊能夠讓你的房子升值 "。有很多人看到這則報道,紛紛把看房目標鎖定在了星巴克門店的小區。

星巴克旁邊的房子升值更快?這是真的嗎?它聽上去合乎大部分直覺的判斷。文章數據顯示星巴克附近的房子 5 年間升值幅度超過 20%,而離得稍遠的房子只升值不到 17%。

星巴克全球零售部總裁(前不動產總監)亞瑟 · 魯賓菲爾德,曾經介紹過特許經營人如何在每天的工作中學習星巴克選址的經驗,他的祕訣中有一條便是在停車場尋找油漬(車流量大的標誌)。

也許星巴克坐落的位置旁邊會有人行道,而人們喜歡住在有人行道的地方。也許每次星巴克一開,附近就會出現幾個新的公交站點——這些都是讓房地產價格上升的因素。

所以真實的情況是,星巴克只是和它附近房價的提升有了關聯性,但並非直接的因果關係。

在衆多存在信息誤導的情境中,我們有一個經常會犯的錯誤,那就是把只有偶然關聯性的兩件事,套上一個並不存在的因果聯繫,還誤以爲自己掌握了真理。

爲什麼我們總被忽悠?

這源自人類大腦的工作機制

密歇根大學的法學教授普雷斯科特解釋說,大多數人會犯的一個大錯誤是由於 " 人們的大腦很容易將因果性和關聯性搞混。"人腦的工作模式決定了我們普遍會感覺事物存在關聯性的故事不如事物存在因果性的故事有吸引力。因此,記者甚至學者都會含糊其詞,任由讀者自己解讀。

更進一步講,我們更注重因果關係根源於人類的生物本能。

" 人類大腦是一臺模式識別的機器。在過去,書籍和搜索引擎還沒有發明之前,找出原因和影響對於我們的生存至關重要," 社會心理學家羅恩 · 弗裏德曼指出," 我們的大腦通過進化,變得善於尋找秩序、預測事情發展。我們無法控制這個過程—我們會處處尋找聯繫,即使聯繫並不存在。"

因果關係會讓人安心,所以我們想要找到這類關係。" 我們腦中彷彿有這樣的程序—揭示事件之間的聯繫,解讀偶然事件,將其作爲存在因果關係的證據,當某件事起因不明的時候,我們會自然而然想要填補這個空白,人爲地加上原因。"

如何透過似是而非的信息,

洞察事實的真相?

01

拋棄先入爲主的觀念

我們喫過太多先入爲主的虧,它促使我們做出一些盲目熱捧或者排斥的決策。

曾經有一個兒童注射 MMR(麻疹、腮腺炎、風疹)疫苗與孤獨症關聯的爭論。儘管已經有一項針對超過 95000 名兒童的研究發現 " 接種 MMR 疫苗並沒有增加患孤獨症譜系障礙的危險 "。兩者只是具有時許上的關聯性,而非因果性,但仍有 1/3 的家長認爲接種疫苗會導致孤獨症。

不過換位思考一下,如果你孩子在接種完 MMR 疫苗後,突然變得內向不愛說話,你會怎麼辦?你會不會懷疑兩者之間存在關聯?你會不會想要知道爲什麼你孩子患上了孤獨症譜系障礙?我們可以感受到父母的情緒是如何影響他們解讀數據的。

這種尋找答案的想法和實證性偏見有關,該偏見是一種通過解讀數據來支撐自己先入爲主觀念的傾向。懷着實證性偏見的我們只是在尋找一個答案——尋找一個特定的答案。實證性偏見幾乎影響着我們對待數據的方方面面——從抽樣到觀察到預測,人們憑藉先入爲主的觀念,而非基於真實的證據,把兩件事時間的關聯性當成了因果性。

所以,別輕易被煽動,理智對待利益相關者營造的恐慌焦慮的語境,不然我們的判斷很有可能會被先入爲主的觀念所幹擾。

02

提出質疑的聲音,找到真正構成影響的變量

人們在做判斷時,經常只觀察到兩個事物的表面相關性就匆忙下了定論,而實際上真正主導因果關係的變量被我們遺漏了。

就像開篇我們提到的星巴克影響了周邊房價的案子,星巴克與房屋所處的商業區位、交通節點、配套服務設施都有可能是遺漏變量。遺漏變量是造成關聯性和因果性不同的主要原因。

問題在於很多時候變量不止兩個。我們掌握了兩個變量之間的關係(又稱依存關係),但實際上卻有第三個至關重要的變量被遺漏了。這個變量即遺漏變量。(是的,也可能存在多個遺漏變量。)這種情況下,我們只要問一個簡單的問題—— " 還有什麼因素可以解釋這件事。"

很多經濟學家致力於觀察和實驗,而非僅僅依憑理論,花去職業生涯的全部時間評估、思考遺漏變量導致的偏見,社會科學家花上幾百個小時分析數據來證明幾組變量之間呈現的是關聯性還是因果性(還是與之相反)並不稀奇。

結語

被數據包圍是現代人的生活的常態,研究機構報告稱,正常人每日會接收 30GB 的數據,如果把它們都打印出來,能夠裝滿幾十輛卡車。

在瀏覽了規模如此龐大的信息後,我們並沒有變得更聰明更睿智;反而常常被各種媒體上傳播的信息誤導,掉進錯誤判斷的陷阱,一不小心還會交一波智商稅。

那些每天環繞我們周圍的雜蕪的信息數據,並非是無意義的,盲聽盲信這些小數據,它們也會產生難以置信的破壞力。

但是作爲見多識廣的數據接收者,我們可以通過一些認知技巧來規避被誤導的風險:

警惕許多標題或文章中可能暗示的因果關係,拋開先入爲主的偏見;

如果你看到了兩者之間的關係,問自己:會不會有其他的因素導致了我所觀察到的結論?在理解兩者關係的時候,是不是有其他確實非常重要的遺漏變量。

最後,對於科學家來說,證明因果關係也是一件非常需要技術含量的事,能保持清醒,理智思考就已經勝過絕大部分普通人了。

贈書福利

普通人一天大約要接收 30G 的數據,但大部分人不知道如何正確地解讀這些數據。MIT 數據學專家在本書中講述瞭如何破譯每天接觸到的數據,將複雜的問題變得更簡單和直觀。

本書涉及商業、零售、廣告、育兒等諸多領域的真實案例,以及時常爲人們所誤解的數據概念。在本書中,你不僅能夠找到如何在信息龐雜的世界中識別數據謊言、挖掘有用信息的方法,而且還能找到憑藉該答案迅速做出明智決定的深刻智慧。

相關文章