让做假账者胆寒的定律(朱帆远)_心境

来源:百度文库 编辑:神马文学网 时间:2024/06/13 13:42:05
让做假账者胆寒的定律(朱帆远)2008-02-17 10:07 从常理上说,世界上千千万万的数据(非零开头)的开头数字是1到9中的任何一个数字,而且每个数字打头的概率应该差不多。现在,请你随便找本书,比如物理课本或者数学课本,统计一下上面的各种数据的开头数字,看看是否符合我们的设想。                                                         如果你统计的数据足够多,你就会惊讶地发现,打头的数字是数据最多,大约占了所有数据的1/3左右,打头是2的数据其次,往后依次减少。难道是人们对1的情由独钟,把他时常写在数据的最前面?                                      肮脏的对数表书页                                                首先要恭喜你,你发现数学上的一个有趣的定律,这就是本福特定律。据说这个定律在1881年首先被一位天文学家在分析数据的时候发现,但是当时的科学家们并没有把这个发现当回事。直到1935年,美国的一位叫本福特的物理学家重新发现了这个定律。当时他在图书馆翻阅对数表时发现,对数表的头几页比后面几页更脏一些,这说明头几页在平时被更多的人翻阅。这并奇怪,因为许多读书的人都先看看书的开头,不喜欢就不再读下去。但是,对数表却是一种数学工具,只有需要查数据的人才会去碰它。因此头几页如果比较脏,这就说明人们查阅的数据大多在头几页里,也反映出人们使用数据并不是散乱的,而是有些数据使用的频率高。                                                                             本福特再进一步研究后发现,只要数据的样本足够多,同时数据没有特定的上限和下限,则数据中以1为开头的数字出现的频率并不是人们想当然认为的1/9,而是0.301,这说明30%的数字都以1开头。而以2为首的数字出现的频率是0.176,3打头的数字出现的频率为0125,往后出现频率依次减少,9打头的数字出现的频率最低,只有0.046。这个规律甚至能用一个数学方程来表示。                                除了对数表,其他类型的数据是否也有这样的现象呢?本福特开始对其他数字进行调查,发现各种完全不相同的数据,比如人口、死亡率、物理和化学常数、棒数统计表、半衰期放射性同位素、物理书中的答案、素数数字以及斐波纳契数列数字中,均有这个定律的身影。
                                  定律成因之谜
    本福特定律在生活中最常见,但是为什么人们使用的数据会有这样的现象呢?几十年来,人们提出了一些猜想来解释这个现象。
    1961年,一位美国科学家提出,本福特定律其实是数字累加造成的现象。比如,人们用千米作为河流的长度单位时,显然长度在1000千米到2000千米之间的河流(长度数据开头是1)要多于2000千米到3000千米的河流(长度数据开头是数字2),小河流很多,而大河流很少,因此河流的数据满足本福特定律。同样,以英里、光年、微米、尺等作为长度单位的数据也都满足这一定律。
    即使没有单位的数字,只要有累进递加,本福特定律就会出现。比如,假设股票市场上的指数一开始是1000点,并以每年10%的速度上升,那么要用7年多时间,这个指数才能从1000点上升到2000点的水平;而由2000点上升到3000点只需4年多时间,由9000点上升到10000点所需的时间更短,只要一年多就可以了。但是,如果要让指数从10000点上升到20000点,还需要等7年多的时间。因此我们看到,以1开头的指数数据,出现的频率比以其他数字打头的指数数据要高很多。
    这个解释似乎很合理,但是却不能解释对数表,因为对数表中的数据既没有单位,也不存在什么累加的现象,只是对所有的数字取对数得到的大量数值,里面却出现了规律性的东西。看来,本福特定律产生的真正的原因并没有得到揭示。
    此外,还有一些生活中的数据并不符合本福特定律。比如,人们研究了彩票的中奖号码,发现里面并没有这样的规律,否则数学家就可以利用该规律增加自己的中奖概率了。到底什么样的数据会出现本福特定律,什么样的数据中没有本福特定律?这个问题同样让数学家难以解决。
                                 抓住做假账者的手
    虽然本福特定律不能让买彩票的人发财,但是在生活中却可以发挥作用,让做假帐的人现出原形。
    数学家发现,账本上的数据的开头数字出现的频率符合本福特定律,如果做假帐的人更改了真实的数据,就会让账本上打头数字出现的频率发生变化,偏离本福特定律中的频率。
    非常有趣的是,数学家们发现,在那些假帐中,数字5和6居然是最常见的打头数字,而不是符合定律的数字1,如果审核账本的人员掌握了本福特定律,伪造者就很难制造出虚假的数字了。2001年,美国最大的能源交易商安然公司宣布破产,当时传出了该公司高层管理人员涉嫌做假帐的丑闻。事后人们发现,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证明了安然的高层领导确实改动过这些数据。
    最近数学家还把本福特定律用于选举投票中。票数的数据也符合这个定律,如果有些人修改选票数量,就会露出蛛丝马迹来。数学家依据这一定律发现,在2004年美国总统选举中,佛罗里达州的选票存在欺诈行为;在2004年委内瑞拉和2006年墨西哥的总统选举中也有篡改选票数量的现象。
    虽然本福特定律的形成原因还没有最终解释,但这并不妨碍人们把它应用到越来越多的生活领域中,帮助人们伸张正义,去伪存真。