这位家有女儿的妈妈真是着急。女儿年方20,做妈的已经数次去过人民公园,就是传说中上海最牛的“相亲大市场”。那里人山人海,到处挂满制作精良的儿女广告,而且一眼望去女性的广告要远远多于男性,据非官方统计约为七八比一,更有危言耸听的说是十比一。她们的父母躲在树阴下,只要见有人对他们的广告感兴趣便羞答答地前来搭话。看得这位没经验的妈妈心里一抽一紧的,那些挂出来的女儿们都有好学历、好工作、好收入,不晓得为什么还要逼得父母出如此下策。
——摘自某公开报道
从新闻学角度看,这是一篇典型的新闻调查;可是从统计学角度看,这就是一篇典型的抽样调查了。相信读者经常读到这类报道,并且读得津津有味,可是殊不知,从统计学角度看,这类报道难免以偏概全。
这篇报道的本意是,在上海,有女儿的家庭向来非常骄傲,这不但因为上海地区没有重男轻女习惯;而且将来嫁女儿要比娶媳妇开销少很多,父母在经济上没有后顾之忧;更不用说,女儿出嫁后依然可以名正言顺地做父母的“贴身小棉袄”,还会捎带着女婿一起做,十分“实惠”。可是现在形势不同了,越是好学历、好收入、好工作的女儿就越难找对象,以致于出现许多30多岁依然未婚的“剩女”,让她们的父母急白了头,不得不亲自出马到上海人民公园去“越位”相亲。
事情果然如此吗?你可以相信,因为这种情形确实存在;但也可以不信,因为这种情形并不普遍,与其说是普例不如说是个例。更何况这种情形并不是上海特有,全国大中城市大同小异。
在上海人民广场,一则父母代女征婚启事是这样写的:“女儿197×年生,浦东一外企技术人员,月薪4000元以上……要求男方年薪10万以上,自备无房贷婚房。女儿不会做家务,热爱旅游,男方应当承担家务或另请保姆。”
可以说,无论这位女儿是否属于“好学历、好收入、好工作”之列,从恋爱、婚姻角度看,她其实并不适合结婚,也难怪剩到现在。
回到我们抽样调查的话题上来。所谓抽样调查,是指从研究对象总体(也叫母体)中抽取一部分个体(也叫元素)做样本进行调查,从中推断有关总体的数字特征。通俗地说就是,在全部研究对象中抽取一部分具有代表性的个体对象进行研究,然后反推总体数据是多少。
容易看出,抽样调查是一种非全面调查,为此,为了保证抽样调查结果能代表总体、能推断总体,必须首先确保这部分被调查个体的代表性。如果能很好地做到这一点,那么尽管抽样调查得到的结果与真实情况之间存在误差,这种误差也是可以允许的,并且能够控制在合理范围内。因为既然是对一部分个体进行调查,就不可避免地会出现误差,问题是这种误差应当合理。
以上面这则报道为例,记者当然可以把大龄未婚青年作为一个群体,然后在恋爱、婚姻方面进行抽样调查,但应当注意这个群体本身也是“个体”,而不是全体未婚女青年的“总体”。虽然这个群体也可以作为“总体”,但如果是这样,在作出调查结论时就必须特别注明是怎样的一个范围,以免读者在潜意识中把全体未婚女青年当做总体来看待。并且在进行这种“抽样”时要根据统计方法进行,避免以偏概全。
实际上,现实生活中类似这样的“抽样调查”非常多。可以说,这种调查一开始就注定它的结果不会十分客观、公正。
多年以前,国内总流传着外国人夸中国人(实际上是中国留学生)如何聪明的说法,这实际上就是一种不合理的抽样调查得到的结果。
例如,一位德国教授在加拿大担任客座教授期间,惊讶地发现外国留学生尤其是来自中国内地、中国香港的留学生要比加拿大学生表现得更聪明、好学,成绩也更优秀。以他的讲座为例,当加拿大学生中有1/3课程不及格时,这些中国留学生没有一个不及格的。
由此他得出一个结论:从统计学角度看,亚洲人或许是“比较聪明”的。然而他很快就推翻了这一结论。因为事实证明,这些中国内地、香港来的留学生,父母之所以把他们送到加拿大来读书,是因为他们在兄弟姐妹中算是“比较聪明”的,否则就不会送来了。现在要把这种优秀学生群体和加拿大普通学生群体对比,本身就没有可比性,他们不能代表全体中国内地、香港学生的平均水平。
那么,上述这种以偏概全为什么在新闻报道中会非常普遍呢?原因有二:一是新闻报道本身追求轰动效应、夸张效果,二是这些记者根本就不懂统计调查究竟应当如何进行。
例如,有媒体报道说,某省消费者委员会的抽样调查显示,“高达84%的超市熟食细菌超标,一些腐烂变质的食品也赫然出现在许多超市货架上,超市食品卫生状况令人担忧。”并由此得出“购买超市食品应注意卫生质量,慎防病从口入”的结论 1。
事实果真如此吗?读者在这里就必须关注这种抽样调查是如何进行的。如果事情果然这样,那就可以断定,超市销售的熟食卫生状况太可怕,这时候应该实行行业停业整顿,而不是仅仅提醒消费者“擦亮眼睛”就行。试想,消费者购买的熟食卫生质量达标率只有1/5了,这时候再“擦亮眼睛”也不可能“慎防病从口入”的。
抽样调查为什么可行?其前提条件是,有些统计调查对象非常广泛而庞大,而且同质性强,实在没必要、更多时候是不可能对所有研究对象进行全面调查,所以只好用抽样调查来替代。
这时候只要抽样调查的方法科学、样本具有很好代表性,这种方法就不但省钱、省时、省力,而且准确性高,同样能达到全面调查的目的。正因如此,有相当多的统计数据是通过抽样调查得到的。
有则经典笑话说,妈妈叫孩子去买一盒火柴,并且嘱咐他一定要试试是不是好用。孩子回家后高兴地对妈妈说,我买的这盒火柴很好用,我都一根根试过了。
这则故事之所以好笑,在于妈妈本来是要孩子划几根火柴试试,看看火柴的质量如何;而孩子由于年龄小,没听懂妈妈的真实意图,便自以为是地每一根都试了试。
在这里,孩子实际上并不知道检查这盒火柴质量好坏不需要进行全面调查、只要用抽样调查进行推断就行了。
再例如,我国有13.4亿人口,要了解全国人口详细数据,当然可以进行一次广泛而深入的人口普查,但这种调查牵涉面广、财力投入大、耗费精力多、时间长,如果不是要求十分精确,就可以通过抽样调查推算出相关数据来。全国1%的人口抽样调查就是其中之一。虽然这种抽样调查得到的结果不是100%精确,但基本上能达到调查目的。
抽样调查与全面调查之间必然存在误差,这种误差主要有两种:
一是工作误差。工作误差也叫登记误差或调查误差。工作误差虽然不可原谅,但却很难避免。与全面调查相比,抽样调查的研究对象少、代表性强、所需调查人员少,所以抽样调查的工作误差比全面调查小。特别是在总体包含调查对象较多的情况下,抽样调查得到的结果其准确性还会高于全面调查。
二是代表性误差。代表性误差也叫抽样误差。由于抽样调查是在总体中抽取一部分样本进行的,所以无论这种样本的代表性有多高,都不可能完全代表总体,两者之间总会有误差。为了尽可能减少误差,一般要求通过科学的调查设计把这种误差控制在允许范围内。
那么,怎样进行这种科学的调查设计呢?这主要包括:
一是抽样调查的样本必须是随机的,这除了能保证被抽取的样本在总体中均匀分布外,还能有效避免倾向性误差。
二是抽样调查的样本不是孤立的,它们作为一个整体就像是从总体中选出来的“代表团”,能够在一定程度上“代表”总体。
三是抽样调查的样本数量要根据调查误差的要求设计,而不是随意确定。换句话说,调查误差的大小要求决定了样本数量多少。很显然,样本数量越多越接近于总体,这时候的调查误差越小;但既然是抽样调查,样本数量就必定会小于总体数量。
四是抽样调查的误差在调查前就可以根据样本数量与总体各因素之间的差异程度计算出来,并且把它控制在允许范围内。所以,这时候抽样调查的准确程度比较高,调查数据是可靠的。
鉴于以上原因,抽样调查并不一定是权宜之计,很多时候是公认的非全面调查方法中用来推算和代表总体的最完善、最有科学依据的调查方法,甚至是唯一可选的统计调查方式。
以道路运输行业统计为例,在过去,交通运输单位以专业公司为主,每家公司都有专门的统计部门、配备专职统计人员,并且建立了一系列统计台账,甚至还有本企业的统计资料汇编。在这种情况下,要获得交通运输行业统计的准确资料很方便。
可是随着市场经济发展,特别是全社会确立了“有货大家运”的观念后,客货运企业作为寻租对象,主要经营手段已经转移到车辆挂靠、车辆承包上来,原来的企业管理逐渐转变为收费管理,企业对车辆运行的许多情况已经“没必要”了解得很清楚,这时候的统计工作对企业而言体现的只是成本支出,无法带来实质性利润。
换句话说,这时候交通运输部门的统计部门和专职统计工作更多地体现为社会服务职能,企业一般会把它当做“负担”来看待。
所以读者能想见,企业对上面的要求是尽量减少报表甚至千方百计拒绝提供报表,统计职能自觉不自觉地被纳入到财会岗位上,由财会人员兼职搞统计。
这时候要解决统计资料搜集难问题,就不可能再在交通运输企业设立专职统计岗位、层层上报报表,唯一的办法,就是由政府交通运输部门通过抽样调查尤其是对外挂车辆进行抽样调查来实现。
例如,首先是建立车辆总体数据库,然后按照一定比例分层 2抽取样本,由调查员对样本车辆进行跟踪调查,再填写、审查调查表,把有关客货运输量、运距、燃油消耗等统计数据资料输入电脑,通过抽样调查软件自动生成运输量报表。
通过这种方式得到的抽样调查数据,必须经过一定推算、论证才能作为决策依据。
以道路运输统计为例,这种推算、论证主要包括三方面:
一是用典型调查进行统计验证
例如在推算出租车运输量时,可以通过询问出租车一个月发生多少运次、运送多少客人、平均运距来测算运输量;在推算货运车运输量时,可以通过一部分比较规范的货运企业的车辆运行情况进行测算,以此来对抽样调查得到的推算资料进行质量认证。
二是用轮胎销售量进行统计验证
运输量的大小与汽车轮胎销售量有关,运输量大必然会加大汽车轮胎损耗,两者之间有某种关联。
三是用高速公路收费和其他收费口流量进行统计验证 3
抽样调查是一种非常有用的统计调查方式,但绝不可以滥用。尤其是当许多问题之间的相互关系越来越复杂、对问题解决的要求越来越高时,简单采用包括抽样调查在内的各种统计方法,很难达到对研究对象的历史信息、反馈信息、输入输出信息、施控信息、受控信息等全方位的信息处理要求。
尤其在我们这样一个大国,如果仅仅满足于过去那种小范围内的抽样调查、问卷调查、函询调查、重点调查、典型调查、民意测验,在深入、快捷解决问题方面的局限性会越来越突出,这是要注意的。
例如,就全国范围来说,即使是万分之一的调查对象都是非常庞大的数目,况且其代表性如何很难确定,这样的抽样调查就难免不会出现以偏概全、盲人摸象的笑话。
最后需注意的是,有些抽样调查方法中存在的弊端,不但普通公众很难识别,就连专业统计人员也会陷入陷阱。也就是说,看上去这种抽样调查方法很科学,可是其最终结果并不能真实反映全貌。
例如,某调查机构在调查我国城市家庭平均人数时采取的方法是,按照随机抽样原则,在不同居民小区、不同街道居委、不同门牌号码中随意选取几千个家庭,然后安排调查员每天上班后到这些家庭中去进行实地调查和记录。如果选取的家庭中没有人,就走访隔壁人家,直到访问到家里有人的家庭时为止 4。
初看起来这种抽样调查方法无懈可击,但在实践中暴露出来的问题是,大量的双职工家庭在这些调查员上门时不在家,家中有人的通常是老人和小孩,这样,无意中就把调查对象指向了这些人数较多的大家庭,直接导致所调查到的家庭平均人口数偏大。
由此可见,即使建立在随机原则基础上的抽样调查,如果受到外界因素干扰,也会大大降低样本代表性,从而差之毫厘、谬之千里的。
【解读点睛】
抽样调查一般来说是能够“以点带面”的,但前提条件是样本选择和数量有极其严格的要求,否则难免会“以偏概全”、“盲人摸象”。
1 《最新抽样调查显示:广州超市熟食逾八成细菌超标》,南方日报,2003年7月11日。
2 根据现行法规,客运经营范围分为旅游客运、包车客运、班线客运,其中班线客运又分为县内、跨县、跨地、跨省;另外,很多地区的出租客运也是由交通部门进行审批和管理的。所谓分层就是依据这个来进行的。
3 马有明、应一江:《我们需要什么样的统计数据》,运输经理世界杂志,2008年第2期。
4 谢益辉:《兼听则明,偏信则暗:客观看待统计数据》,统计之都,2006年10月6日。