人生就是概率和机遇。——刘慈欣坤鹏论:上市公司造假 统计学告诉你怎么破!

昨天,坤鹏论谈到了上市公司造假的问题,难道就没有办法识破吗?

正是这样的疑问使我想起了概率论中一些辨伪招数,今天就来聊聊它们。

当然,即使掌握了这些方法,也不能让你轻松破解财务造假,毕竟道高一尺,魔高一丈,这样的博弈一直在不断升级。

一、统计学教授用概率破解造假

大多数人都不了解概率在日常生活中的重要性,美国有位教授曾用下面的方式,向他的学生证实这一点。

他每年教统计学时,都会要求班上的每个学生假装随便扔20次硬币,并把想象的结果写在一张纸上,并用X和O分别代表硬币的正面和反面。

但是,他会指定一名学生必须真的扔硬币,而且照实记下结果。

学生在做这项功课时,教授会暂时离开教室,等到学生们都完成后,他再回来。

他面对的挑战是,从许多记录纸张中挑出真正扔硬币的结果。

令学生们总是不可思议的是,他每次都指认无误,从来没有一次失手。

他是怎么做到的呢?

这是因为真正扔硬币的结果,几乎都会包含有最长的连续正面或反面组合,比如:OXXXXXOXOOXOOXOOXOOX,而想像的结果通常是这个样子的:XXOXOOOXOOXOXXOOXXOO。

这是因为我们普通人都会低估连续丢出好几个正面或反面的可能,所以才不会写出一长串相同的组合。

尽管根据概率的特点,如果长时间的话,出现正面和反面的次数会相同,但也有老是丢出正面或反面的时候。

根据专家的不懈实验,丢硬币有如下学问:

1.任何一次丢硬币,出现正面或反面的几率都是50%,也就是1/2。

2.但是如果连续丢20次硬币,在这个过程的任何时候,连续出现3次正面或反面的可能性,高达80%,连续出现4次正面或反面的可能性为50%,连续出现5次正面或反面的可能性是25%。

3.在这个过程的任何时候,不论已经连续出现几次正面,下一次再丢出正面的可能性还是50%。

短期来说,股市也是一种概率,假设一只股票,第一天跌了,第二天跌了,第三天跌了,第四天跌了,越往后,其跌的概率越低,那就意味着,概率本身就和企业的价值无关。

用概率去炒股,它是非常准确的,如果你能建立一个数学模型,用概率去计算,那个股价应该是最标准的,只是找到合理的模型很难很难。

坤鹏论:上市公司造假 统计学告诉你怎么破!

二、没有可疑才是大大的可疑

某餐馆老板做了假账,编篡了每个星期的营业额。

但其账簿在内行人眼里,错得非常明显:n多数据末尾中没有一个以00为结尾。

这是因为伪造数据者往往认为整数不够随机。

但是,在真实的世界中,从00到99,每组两位数的出现概率约为1%。

这同样也是统计学的概率,大多数人不懂,自然也就编不出正常的数据,人们在伪造数据时常会犯的错还包括:

多次使用个人偏爱的数字,因为每个人都有自己偏爱的数字,造假时往往真情流露,经常使用它;

有意识地避免整齐的数字,或者连续的数字,认为它们“不够随机”,不够真实;

当人们要伪造表面合理的数据时,他们一般会用以5或6为第一个数的数据;

如果数据有上限,比如报销金额是500,可能会多次采用478、485这类靠近的数字......

当人们在数据上造假时,必须捏造一系列看似正常,没有可疑之处的随机数字,而偏偏就是这样的“没有可疑”,事实上才是大大的可疑。

三、本福特定律

话说美国有位传奇天文学家叫西蒙·纽康(1835年3月12日~1909年7月11日),被《大英百科全书》誉为“那个时代最显赫的天文学家之一。”

他曾写了一本名为《通俗天文学》的书,从1923年至今,重印上千次,全球销售过亿。

纽康在查阅对数表时发现了一个奇怪的现象,包含以1开头的数的那几页比其他页破烂得多,似乎表明计算所用的数值中,首位数是1的概率更高。

1881年他发表了一篇文章提到并分析了这个现象,但没有引起人们的注意。

直到57年之后的1938年,美国有位电气工程师再次发现了这个现象。

此人叫弗兰克·本福特,也有说他是物理学家,反正和统计学、概率论没有半点关系,但人到中年时却迷上了一个与概率有关的课题,课题得到的结论就是现在要说的“本福特定律”。

这个定律说,在众多真实数据中,以“1”为首位数字的数出现的概率约占总数的三成,也就是30%左右。

比如:随机抽取银行1000多个储蓄账户,存款金额不等,请问,这些存款数额中第一位是1的概率有多少?

我们知道,存款金额随机的话,那么第一位从1到9都有可能,正常人的答案肯定是1/9。

但是,本福特通过不断验证后却告诉我们,数字越大,出现在第一位的概率就越小。

首位数字为1的概率能达到30%,以2开头占18%,以3开头的情况约为12.5%,而数字9出现在第一位的概率只有4.5%左右。

在发现这个规律后,本福特兴奋不已,马不停蹄地收集并研究了20229个统计数据,包括河流面积、人口统计、分子及原子重量、物理常数等多种来源的资料,并分成20组。

虽然数据来源千差万别,却基本符合本福特之前发现的规律。

本福特的发现实至名归地成为了定律。

坤鹏论:上市公司造假 统计学告诉你怎么破!

本福特定律适用范围非常广泛,自然界和日常生活中获得的大多数数据都符合这个规律。

比如:统计一下世界上237个国家的人口数量,以1开头的数惊人地占到了27%,而以9开头的数却只占5%。

不过,这个定律也有以下限制:

数据必须跨度足够大,样本数量足够多,数值大小相差几个数量级;

人为规则的数据不满足本福特定律,例如按照某种人为规则设计选定的电话号码、身份证号码、发票编号等。

为造假而人工修改过的实验数据、彩票上的随机数据也不符合本福特定律。

虽然,纽康和本福特都总结出了首位数字的对数规律,但并未给出证明,直到1996年佐治亚理工学院的数学家泰德·希尔依据本福特定律确定哪种情况产生这种数字,并进行了严谨的数学证明。

他还指出,当我们拥有分布中的分布,也就是对随机抽样的随机采集时,这样的数字集就会出现,庞大、混杂的数字集也遵循本福特定律。

上世纪70年代初,谷歌首席经济学家的哈尔·瓦里安曾表示,如果经济数据在进入一种经济模型时符合本福特定律,但从这种经济模型出来时不符合本福特定律,那就应该再研究一下这个模型。

圣·路易斯华盛顿大学经济学家约翰·奈和查尔斯·莫曾利用本福特定律,考察了一些基本的宏观数据。

他们发现,经合组织(OECD)的数据非常符合本福特法则。

这表明,GDP数据应符合本福特法则,但非洲的GDP数据则与之不符。

当然,我们无法肯定,这些不符缘于弄虚作假或统计部门资金不足,但这提醒我们,某些数据应伴随健康警示。

再后来,美国一个有数学天赋的会计师——马克·尼格里尼,在上世纪90年代名扬天下,原因是他利用本福特定律,发现了会计造假、欺诈和逃税行为,比如:伪造一些小额发票,金额略低于需要管理层批准的门槛。

尼格里尼根据本福特定律发展出一套方法用来检验帐目的真实性,如果有人对帐目做过手脚,利用他的方法可以发现疑点,该方法被成为“尼格里尼求和法”。

后来,“尼格里尼求和法”被执法机构、税务机构和私营部门广泛采纳。

审计人员可以利用这一点来判断数据是真实可信的还是伪造出来的。

1998年,据《纽约时报》报道,包括加利福尼亚州在内,美国好几个州的税务机构都使用以本福特定律为基础的检测软件。

美国华盛顿州曾利用本福特定律侦破了当时最大的投资诈骗案,涉案金额高达1亿美元。

诈骗主谋凯文·劳伦斯和其同伙以创办高科技含量的连锁健身俱乐部为名,向5000多个投资者筹集了大量资金。

但是,所谓的健身俱乐部根本就是子无虚有,资金被他们用来吃喝玩乐。

为了欺骗投资者,他们还把资金在海外公司和银行间频繁转账,并做假账,给人一种生意兴隆的错觉。

后来,有位名为达雷尔·多雷尔的会计师觉得不大对头,于是便将70000多个与支票和汇款有关的数据收集起来,将这些数据首位数字发生的概率与本福特定律相比较,发现根本无法通过本福特定律的检验。

最后经过了3年的司法调查,终于拆穿了这个投资骗局,2002年,劳伦斯被判入狱20年。

坤鹏论:上市公司造假 统计学告诉你怎么破!

当年,美国著名的安然造假案中,其2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证明了安然的高层领导确实有改动过这些数据。

国内有人曾用上证50的公司与5家有舞弊行为的公司的季度财务数据进行了对比,发现上证50的公司符合本福特定律的季度数,不管在最近一年、两年、三年、四年,而那5家造假公司的数据则与本福特定律存在出入。

还有人选取了沪深两市2000年~2010年2087家上市公司的年度、季度财报进行研究。

测试结果显示,总体上,沪深两市的主要财务数据首位数的分布,表现出了本福特定律所描述的规律,但是,其中营业成本和本福特定律的理论值有较好的一致性,资本公积和所有者权益合计与本福特定律的符合度较差。

坤鹏论:上市公司造假 统计学告诉你怎么破!

从资产负债表可以看出:

2000年~2002年的相关系数都比较低,而这三年恰恰是中国上市公司报表披露的混乱时期,大型报表舞弊案在这三年出现多起,例如:银广夏案等。说明这段时间上市公司的报表舞弊情况普遍比较严重。

2003年~2007年相关系统突然回升,兼有逐年降低的趋势。在2003年和2004年,审计署对报表舞弊严重的银广夏、西安达尔曼、天津磁卡、蓝田股份、大庆联谊做出公开处罚,纠正了当时粉饰报表的不正之风。所以,2003年和2004年的相关系统突然升高,与当时审计署的工作分不开。

同时,这段时期实行了新会计准则,很多企业利用会计准则进行舞弊,比如:在效益好的年份将部分利润隐藏在坏账准备里,并在业绩不好的年份将其提出以粉饰利润。

另外,2007年1月1日后,中国再次实行新会计准则,使得很多在之前会计准则中可以使用的舞弊手段不能再用,因此2007年集中了大量非正常与正常调整,造成当年相关系数成为这段时期低谷的情况。

2008年~2010年,这个阶段又表现出一个回升之后逐年降低的趋势。2008年是中国实行新会计准则的第二年,大部分调整已集中体现在了2007年,因此当年相关系数相对2007年来说出现显著回升。

而2008年遭遇全球金融危机,一直波及到了2009年和2010年,造成企业普遍出现效益不好的情况,企业可能会出于对融资、股价等方面的考虑,对财务数据进行了人为操纵,使得相关系数逐年降低。

坤鹏论:上市公司造假 统计学告诉你怎么破!

而利润表的表现和资产负债表不同:

整体财务数据和本福特定律理论值的相关系数普遍很高,绝大部分都在0.999以上,说明公司普遍对利润表(营业收入、营业成本、利润总额、净利润)进行的数据操纵行为较少。

因此,整体上看,从2000年到2010年,中国上市公司的利润表相比较资产负债表,的确受相关公司人为操纵的因素较少。

请您关注本头条号,坤鹏论自2016年初成立至今,创始人为封立鹏、滕大鹏、江礼坤,是包括今日头条、雪球、搜狐、网易、新浪等多家著名网站或自媒体平台的特约专家或特约专栏作者,目前已累计发表原创文章与问答6000余篇,文章传播被转载量超过800余万次,文章总阅读量近20亿。

相关文章