21 君:我们每天都在刷头条、浏览弹窗、接触海量的数据信息,普通人一天大约要接收 30G 的数据,但大部分人不知道如何正确地解读这些数据。

这些信息背后隐藏着什么真相?如何在信息庞杂的世界中识别数据谎言、挖掘有用信息?对数据的理解,将有助于你在数字时代做出明智决策。

本文摘编自《数据的真相:如何在数字时代做出明智决策》

编辑丨陈思;实习生 杰怡

约翰和迈克运用浅显易懂的语言,教我们如何处理每天洪水一般向我们涌来的数据,从而将数据所带来的可能性展示给更多人。这本书的价值不可估量!

——布拉德利 · 霍洛维茨(谷歌图片和信息流部门副总裁)

题记

图片来源 / 图虫

美国《人物》杂志曾有一篇文章标题叫做 " 住在星巴克旁边能够让你的房子升值 "。有很多人看到这则报道,纷纷把看房目标锁定在了星巴克门店的小区。

星巴克旁边的房子升值更快?这是真的吗?它听上去合乎大部分直觉的判断。文章数据显示星巴克附近的房子 5 年间升值幅度超过 20%,而离得稍远的房子只升值不到 17%。

星巴克全球零售部总裁(前不动产总监)亚瑟 · 鲁宾菲尔德,曾经介绍过特许经营人如何在每天的工作中学习星巴克选址的经验,他的秘诀中有一条便是在停车场寻找油渍(车流量大的标志)。

也许星巴克坐落的位置旁边会有人行道,而人们喜欢住在有人行道的地方。也许每次星巴克一开,附近就会出现几个新的公交站点——这些都是让房地产价格上升的因素。

所以真实的情况是,星巴克只是和它附近房价的提升有了关联性,但并非直接的因果关系。

在众多存在信息误导的情境中,我们有一个经常会犯的错误,那就是把只有偶然关联性的两件事,套上一个并不存在的因果联系,还误以为自己掌握了真理。

为什么我们总被忽悠?

这源自人类大脑的工作机制

密歇根大学的法学教授普雷斯科特解释说,大多数人会犯的一个大错误是由于 " 人们的大脑很容易将因果性和关联性搞混。"人脑的工作模式决定了我们普遍会感觉事物存在关联性的故事不如事物存在因果性的故事有吸引力。因此,记者甚至学者都会含糊其词,任由读者自己解读。

更进一步讲,我们更注重因果关系根源于人类的生物本能。

" 人类大脑是一台模式识别的机器。在过去,书籍和搜索引擎还没有发明之前,找出原因和影响对于我们的生存至关重要," 社会心理学家罗恩 · 弗里德曼指出," 我们的大脑通过进化,变得善于寻找秩序、预测事情发展。我们无法控制这个过程—我们会处处寻找联系,即使联系并不存在。"

因果关系会让人安心,所以我们想要找到这类关系。" 我们脑中仿佛有这样的程序—揭示事件之间的联系,解读偶然事件,将其作为存在因果关系的证据,当某件事起因不明的时候,我们会自然而然想要填补这个空白,人为地加上原因。"

如何透过似是而非的信息,

洞察事实的真相?

01

抛弃先入为主的观念

我们吃过太多先入为主的亏,它促使我们做出一些盲目热捧或者排斥的决策。

曾经有一个儿童注射 MMR(麻疹、腮腺炎、风疹)疫苗与孤独症关联的争论。尽管已经有一项针对超过 95000 名儿童的研究发现 " 接种 MMR 疫苗并没有增加患孤独症谱系障碍的危险 "。两者只是具有时许上的关联性,而非因果性,但仍有 1/3 的家长认为接种疫苗会导致孤独症。

不过换位思考一下,如果你孩子在接种完 MMR 疫苗后,突然变得内向不爱说话,你会怎么办?你会不会怀疑两者之间存在关联?你会不会想要知道为什么你孩子患上了孤独症谱系障碍?我们可以感受到父母的情绪是如何影响他们解读数据的。

这种寻找答案的想法和实证性偏见有关,该偏见是一种通过解读数据来支撑自己先入为主观念的倾向。怀着实证性偏见的我们只是在寻找一个答案——寻找一个特定的答案。实证性偏见几乎影响着我们对待数据的方方面面——从抽样到观察到预测,人们凭借先入为主的观念,而非基于真实的证据,把两件事时间的关联性当成了因果性。

所以,别轻易被煽动,理智对待利益相关者营造的恐慌焦虑的语境,不然我们的判断很有可能会被先入为主的观念所干扰。

02

提出质疑的声音,找到真正构成影响的变量

人们在做判断时,经常只观察到两个事物的表面相关性就匆忙下了定论,而实际上真正主导因果关系的变量被我们遗漏了。

就像开篇我们提到的星巴克影响了周边房价的案子,星巴克与房屋所处的商业区位、交通节点、配套服务设施都有可能是遗漏变量。遗漏变量是造成关联性和因果性不同的主要原因。

问题在于很多时候变量不止两个。我们掌握了两个变量之间的关系(又称依存关系),但实际上却有第三个至关重要的变量被遗漏了。这个变量即遗漏变量。(是的,也可能存在多个遗漏变量。)这种情况下,我们只要问一个简单的问题—— " 还有什么因素可以解释这件事。"

很多经济学家致力于观察和实验,而非仅仅依凭理论,花去职业生涯的全部时间评估、思考遗漏变量导致的偏见,社会科学家花上几百个小时分析数据来证明几组变量之间呈现的是关联性还是因果性(还是与之相反)并不稀奇。

结语

被数据包围是现代人的生活的常态,研究机构报告称,正常人每日会接收 30GB 的数据,如果把它们都打印出来,能够装满几十辆卡车。

在浏览了规模如此庞大的信息后,我们并没有变得更聪明更睿智;反而常常被各种媒体上传播的信息误导,掉进错误判断的陷阱,一不小心还会交一波智商税。

那些每天环绕我们周围的杂芜的信息数据,并非是无意义的,盲听盲信这些小数据,它们也会产生难以置信的破坏力。

但是作为见多识广的数据接收者,我们可以通过一些认知技巧来规避被误导的风险:

警惕许多标题或文章中可能暗示的因果关系,抛开先入为主的偏见;

如果你看到了两者之间的关系,问自己:会不会有其他的因素导致了我所观察到的结论?在理解两者关系的时候,是不是有其他确实非常重要的遗漏变量。

最后,对于科学家来说,证明因果关系也是一件非常需要技术含量的事,能保持清醒,理智思考就已经胜过绝大部分普通人了。

赠书福利

普通人一天大约要接收 30G 的数据,但大部分人不知道如何正确地解读这些数据。MIT 数据学专家在本书中讲述了如何破译每天接触到的数据,将复杂的问题变得更简单和直观。

本书涉及商业、零售、广告、育儿等诸多领域的真实案例,以及时常为人们所误解的数据概念。在本书中,你不仅能够找到如何在信息庞杂的世界中识别数据谎言、挖掘有用信息的方法,而且还能找到凭借该答案迅速做出明智决定的深刻智慧。

相关文章