2009年7月29日湖北省老河口市第二期经济适用房公开摇号,从1138名具有资格的申请人中摇出了514名,其中有14名编号相连。专家核算,这个“14连号”的概率为1.4%。
——摘自某公开报道
从理论上说,统计属于应用数学的一个分支,应用数学是以概率理论为基础的。而概率这东西,说穿了就是某种结果出现的可能性。
换句话说,统计就是研究随机现象中能够确定的某种统计规律的学科,这种统计概率能够在一定范围内表现出来,最常见的是正态分布。比较完整地说是,统计就是采用某种统计方法,搜集、整理、分析、解释统计数据,并对统计数据反映出来的问题的性质、程度、原因得出一定的结论。
明白了这个道理就知道,运用统计方法时要遵循大数定律,也就是说,只有对大量数据进行研究,这时候得到的统计数据才具有稳定性和代表性,这样的统计结论才比较准确和完整。
概率事件在现实生活中随时随地发生着,只要你注意观察,几乎所有事件都与概率有关。
例如,你和朋友在饭店里吃饭、喝啤酒,这种品牌的啤酒正在进行促销,这时候你打开瓶盖后看到最多的一定会是“谢谢您”、“笑一笑”,表示你买了这瓶啤酒后没有任何奖励;而喝到“再来一瓶”则很少。
在这里,厂家玩弄的就是一种小概率事件。虽然这种啤酒促销奖品很多,奖项大小不一,但显而易见,在设置奖品总数时就已经充分考虑到概率因素,厂家决不会做亏本买卖。如果你想一瓶接一瓶地喝到“再来一瓶”,理论上虽然有可能,但可能性很小。
不过话说回来,哪怕最小的概率都是可能发生的,它可以无限接近于零,但却不等于零。也就是说,虽然小概率事件发生的可能性很小,可是它依然可能随时随地会发生,不是发生在你身上,就是发生在别人身上;不是发生在现在,就是发生在将来或过去。
以彩票中奖为例,每1注彩票(2元1个彩票号码)中得特等奖的概率只有1000万分之一甚至2000多万分之一,比飞机失事的概率还小,但我们依然能看到经常传出某某彩民中了特等奖的消息,甚至还有一次中几亿元的奇迹发生,就是这个道理。因为全国买彩票的人太多,总会有极个别的人运气特别好,以致于在他们身上发生小概率事件。
概率事件适合于正常情况下,如果受到人为干扰就另当别论了。
2009年6月12日,武汉市有5141名市民参加购买经济适用房公开摇号,在电脑摇号摇中的124名市民中居然出现6个人的购房编号相连,消息传出后引起社会广泛质疑。因为根据概率理论,出现这种情形的概率只有千万亿分之一,是绝对小概率事件。
这究竟怎么回事呢?在媒体推动和当地政府彻查下,14天后真相大白。原来,这是一起申购经济适用房的造假窝案,在众人眼里原本有多道程序把关的经济适用房申购流程不堪一击。
不用说,在人为干预下,什么样的概率都会被改写——原来的小概率事件会变成大概率事件;原来的不可能会变成现实。
但毋庸置疑,这种人为干预概率的经济犯罪案件必然会受到应有惩处。在这起“6连号”事件中,共查处“好处费”近百万元,5名涉案人员抓获归案,这也可以说是统计概率理论帮忙破的案。
这一事件发生后,加上原本各地频频出现的经济适用房私下买卖、开着私家车购买经济适用房、购买经济适用房后对外出租等情形,公众对经济适用房申购过程中屡屡出现小概率事件抱有一份特别戒心,以致于假作真时真亦假了。
例如,就在上述“6连号”事件发生一个多月后的2009年7月29日,湖北省老河口市第二期经济适用房申请资格公开摇号中,在1138名有资格申请的人中一共产生514名购买者。大家惊奇地发现,其中居然出现14个连续中签号码,而这14个连号中居然有13个人是来自同一所乡镇中学,另外1人也来自这所乡镇中学的下属学校。
这种情形正常吗?从社会学角度看当然要进行调查,看其中有没有腐败、舞弊行为;但从统计学角度看,则完全有可能。
具体到这个案例来说,在1138个名单中开出14个连号的概率有多大呢?某大学统计概率系教授计算的结果是1.499%。而在统计学中,当概率出现小于0.5%时,称之为非常规性;而现在1.4%显然大于0.5%,所以这种情形从统计学上看完全有可能发生。
需要指出的是,即使是同一个事件的概率计算,每个人的计算方法不同,得到的结果也会不一样。
例如就这14个连号的概率计算看,由于这14个人来自同一单位,所以可以把它当做“一个号码”来看待;而如果把这14个人分列开来单独看,那么出现这种14个连号的概率就骤然下降到0.248294%、0.0078218%的水平 1。
之所以会出现多种计算结果,是由其具体摇号过程决定的。该市首先经过审核,对1138个住户发放经济适用房申请资格证书,由于第二期经济适用只有514套房源,所以再打乱这1138个申请住户顺序,然后由电脑按键,按一次键跳出一个号来,514个人就按514次键,14个连续号码是在按了14次不同的键后跳出来的。
而从读者容易理解的角度看,要求在1138个人中摇出514个号码,无论采取什么方法产生这些号码,平均2.2个号码中就会出现1个中签号,产生号码紧挨在一起的可能性非常大。
应当注意的是,统计概率有一定道理,但我们不能框死在这里面不能自拔。也就是说,在看待小概率事件时,只要这个结果来历是清楚、科学的,哪怕是小概率事件也不能否定。
例如,一个星期三的深夜,在德国法兰克福美茵河畔,一位44岁的统计学家酒后驾车,被警察拦了下来,按规定他这时候不能自己开车回家了,所以他立刻锁上汽车,打电话给妻子,要妻子开车过来接他。然后他信誓旦旦地向警察保证,自己一定会在这里等妻子过来,请他们放心,说完就独自离开那里,警察随后也就离开了。
过了一会儿,警察巡逻队又杀了回来,不出所料正好看到这位统计学家发动汽车准备回家,于是被逮了个正着。这下二话不说,先检查血液中的酒精含量,然后没收驾驶执照。
统计学家一边道歉,一边抱怨说这真是个小概率事件。因为按照概率计算,当天晚上他被查到的概率只有0.5%,而在同一个晚上连续二次查到的概率更是只有(0.5%)2=0.0025%。而他此前刚刚被警察查过一次,照这个概率计算,他第二次被查到应该在100年后,现在居然“提前出现”了 2。
回到我们的例子上来。如果在1000人中要摇出999个经济适用房购买者名单,则无论如何有1个人摇不中。而从这1个人看,虽然他没摇中的概率只有千分之一,也算是个小概率事件,但他就不能去击鼓喊冤,更不能因此认定别人都是“连号的” 3。
有意思的是,自从经济适用房摇号在武汉出现“6连号”、在老河口出现“14连号”后,全国各地出现了一股“概率热”,说明读者并没有弱智到就概率论概率的地步。与其说他们对这种小概率事件表现出极大的怀疑,不如说是质疑摇号者的公信力及摇号程序的可信度。反之,假如大家百分之百地信任摇号者,哪怕最终摇出只有亿万分之一的超小概率,也会欣然接受这个结果,不会发出一丝质疑的。
这样也就提出一个新话题:谁来摇号?如何摇号?怎样才能让所有人心服口服?其中“谁来摇号”属于最核心问题。
从公信力角度看,摇号者应该来自官方,但必须是一位“利益无涉者”。而从上述“6连号”、“14连号”事件看,尽管摇号者都具有官方背景,都属于当地房地产管理局,但究竟具体到某个具体操作的摇号人就很难符合“利益无涉”要求。只要这个问题不解决,无论出现怎样的摇号结果,即使有公证处公证,依然会受到人们质疑。
由此可见,统计数据的概率事件必须纯洁无瑕,不能受到任何玷污,否则其结果也就不可信了。
【解读点睛】
概率本身只是一个数学或统计学名词,但显而易见的是它不应该受到人为干扰,否则就必然会影响到统计结果的正确性和代表性。
1 李国惠:《“14连号”是不是标题党》,北方网,2009年8月1日。
2 瓦尔特·克莱默著、隋学礼译:《统计数据的真相》,北京,机械工业出版社,2008年,第160页。
3 举个极端的例子,如果这时候他的编号是1,那么其他999个人都是连号的。