统计学是关于数量信息的收集、整理和分析的学科,它在今天极为复杂的世界上变得越来越重要。普通市民在很多方面都会受到数字的困扰,除非具有一定的统计学知识,不然很难作出明智的选择。
part 1 统计关系中的陷阱
统计资料表明,大多数汽车事故发生在中等速度的行驶状态下,极少数事故发生在大于每小时行驶150千米的速度下,这是否就意味着高速行驶会比较安全?
为什么开快车
事实绝不是这样的,统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以自然大多数事故发生在中等速度的行驶中。
如果统计数字表明亚利桑那州死于肺结核的人数比其他州多,这是否意味着亚利桑那州的气候容易使人得肺病?
事实却是,亚利桑那州的气候对生肺病的人极有好处,所以数以千计的肺病患者纷纷前来。自然这个州死于肺结核的平均数就升高了。
有一个调查研究说脚大的孩子比脚小的孩子拼写好,这是否说明一个人的脚的大小能够衡量他的拼写能力?
原来,这个研究对象是一些处于生长发育期的孩子。所有的调查都表明因为年龄较大的孩子脚大些,他们当然要比年幼的孩子拼得好些。
扩展阅读 有欺骗性的“平均值”
为了吸引零售商到一个城镇里经商,商业主席可能会吹嘘道:“这个城市的居民平均收入非常高。”大多数人会因此认为这个城镇的大多数居民都属于高收入阶层,可是实际情况却并不一定如此,如果有一个亿万富翁恰好住在该城,那么即使其他人都是低收入者,“平均”的个人收入却仍然会很高。
part 2 不要轻率下结论
前面的几个例子着重说明在你听到一种统计关系的时候,不要轻率地下因果关系的结论。
有一项研究表明某个国家喝牛奶和死于癌症的人的比例都很高,这是不是说明喝牛奶会引起癌症呢?不!绝不是这样的。我们要看到事件背后的另一个事实:这个国家老年人的比例也很高,年龄大的人通常容易患癌症,正是这个原因才提高了这个国家癌症死亡者的比例。
一项研究表明在某个城市因心力衰竭而死亡的人数和啤酒的消耗量都急剧上升,这是否表示喝啤酒会增加心脏病发作的概率?不!绝不是这样的。两种情况的增加都是人口迅速增加的结果。如果非要认定喝啤酒会增加心脏病发作的概率,那么心脏病的发作还可以归咎于其他更多的因素,如咖啡消耗量增加、嚼口香糖的人增多、玩桥牌更加盛行、看电视的人增多,等等。
本文也许可以启发你找出其他一些在因果关系方面容易引起误解的统计说法的实例。现代的广告,尤其是电视中的商业广告,常常是这种统计误导的一个源头。
知识链接 统计学的三个重要的基础度量指标
统计学的三个重要的基础度量指标是平均数、中位数和众数。
平均数是指在一组数据中所有数据之和再除以数据的个数。平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。
中位数是指将数据排序(从大到小或从小到大)后,位置在最中间的数。
众数是指在一组数据中出现次数最多的数值,有时众数在一组数中有好几个。
怪博士出题
你平时是不是曾经陷入过这样的统计陷阱?回想一下你所看过的电视购物广告,并尝试发现其中的陷阱。