《统计与我们的生活.ppt》由会员分享,可在线阅读,更多相关《统计与我们的生活.ppt(32页珍藏版)》请在金锄头文库上搜索。
1、v统计与我们的生活统计与我们的生活vv当电脑的价格比上一年下降了当电脑的价格比上一年下降了20002000元,而肉价上涨了元,而肉价上涨了3 3元时,你全家的元时,你全家的生活支出减少了还是增加了?生活支出减少了还是增加了?v当你把钱存到银行时,银行利息能当你把钱存到银行时,银行利息能否抵得上物价上涨的因素?否抵得上物价上涨的因素?v“死死”也躲不开的统计也躲不开的统计?v统计就是通过大量的数据在某些看似没统计就是通过大量的数据在某些看似没有规律的事件中找出运行的规律。有规律的事件中找出运行的规律。v准确的统计数据能帮助我们对纷繁复杂准确的统计数据能帮助我们对纷繁复杂的社会现象进行定量分析,从
2、而为我们的社会现象进行定量分析,从而为我们在作预测时提供参考。正因为如此,统在作预测时提供参考。正因为如此,统计已经进入了人类社会生活的方方面面。计已经进入了人类社会生活的方方面面。v比如比如,我国每我国每10年会进行一次全国人口年会进行一次全国人口普查,像男女比例、各年龄段人口比率、普查,像男女比例、各年龄段人口比率、就业率、出生率和和死亡率等,这可都就业率、出生率和和死亡率等,这可都是关系到国计民生的大事。是关系到国计民生的大事。v企业也需要这些信息指导自己的长期经企业也需要这些信息指导自己的长期经营。营。比如,比如,保险公司知道了人口的死亡保险公司知道了人口的死亡率才可以计算出应该收多少
3、保险费。率才可以计算出应该收多少保险费。v企业经营也需要进行统计。企业经营也需要进行统计。没准什么时没准什么时候你在家里会突然接到一个电话,原来候你在家里会突然接到一个电话,原来是电视台打来的,他们在统计节目的收是电视台打来的,他们在统计节目的收视率。收视率超高,他们的广告就卖得视率。收视率超高,他们的广告就卖得越贵。越贵。我们的生活也离我们的生活也离不开统计不开统计每个月家里大概每个月家里大概会花多少钱,妈妈也会花多少钱,妈妈也许并没有认真计算过,许并没有认真计算过,但她心里一定有本帐。但她心里一定有本帐。v学校要统计升学率,班上要统计学校要统计升学率,班上要统计成绩和名次,你自己也要统计自
4、成绩和名次,你自己也要统计自己的总分或平均成绩的升降。己的总分或平均成绩的升降。k k k k i i i i v统计似乎是一种很简单的脑力劳动。你统计似乎是一种很简单的脑力劳动。你如果真这样想可就大错特错了。统计可如果真这样想可就大错特错了。统计可不是这么简单的,其中蕴藏着许多复杂不是这么简单的,其中蕴藏着许多复杂的数学知识,是一门很深的学问呢!的数学知识,是一门很深的学问呢!vv 统计自己的总分,只需要把所有科目的分数加起来统计自己的总分,只需要把所有科目的分数加起来统计自己的总分,只需要把所有科目的分数加起来统计自己的总分,只需要把所有科目的分数加起来就行了;就行了;就行了;就行了;vv
5、妈妈要摸清家里支出的规律,就要在几年的时间里妈妈要摸清家里支出的规律,就要在几年的时间里妈妈要摸清家里支出的规律,就要在几年的时间里妈妈要摸清家里支出的规律,就要在几年的时间里连续统计每个月的支出连续统计每个月的支出连续统计每个月的支出连续统计每个月的支出, ,vv而电视台只有给所有的观众都打电话调查才能得到而电视台只有给所有的观众都打电话调查才能得到而电视台只有给所有的观众都打电话调查才能得到而电视台只有给所有的观众都打电话调查才能得到准确的收视率,可是他们可能会有几十万的观众呀;准确的收视率,可是他们可能会有几十万的观众呀;准确的收视率,可是他们可能会有几十万的观众呀;准确的收视率,可是他
6、们可能会有几十万的观众呀;vv我国有我国有我国有我国有1313亿人口,国家进行人口普查就更难了,难亿人口,国家进行人口普查就更难了,难亿人口,国家进行人口普查就更难了,难亿人口,国家进行人口普查就更难了,难怪要每怪要每怪要每怪要每1010才能进行一次。但是才能进行一次。但是才能进行一次。但是才能进行一次。但是1010年间,某些方面的年间,某些方面的年间,某些方面的年间,某些方面的数据可能会有很大的变化,中间这几年如果需要数数据可能会有很大的变化,中间这几年如果需要数数据可能会有很大的变化,中间这几年如果需要数数据可能会有很大的变化,中间这几年如果需要数据,那该怎么办呢?据,那该怎么办呢?据,那
7、该怎么办呢?据,那该怎么办呢?vv由此可见,社会现象愈复杂,我们的统计工作也由此可见,社会现象愈复杂,我们的统计工作也由此可见,社会现象愈复杂,我们的统计工作也由此可见,社会现象愈复杂,我们的统计工作也就愈困难。就愈困难。就愈困难。就愈困难。“投机取巧投机取巧”的抽样调的抽样调查查v认识到统计的难度,我们就认识到统计的难度,我们就需要掌握一些统计技巧了。需要掌握一些统计技巧了。v抽样调查就是一个常见的统抽样调查就是一个常见的统计调查方法。我们先来看看计调查方法。我们先来看看电视台是如何进行收视率统电视台是如何进行收视率统计的。计的。v假设有一家电视台,总共有假设有一家电视台,总共有7位用户(好
8、可怜的电视位用户(好可怜的电视台,选择比较小的数字是为了方便读者能够自己组台,选择比较小的数字是为了方便读者能够自己组合出正确的答案)。现在他们推出了一台新节目,合出正确的答案)。现在他们推出了一台新节目,想了解收视率是多少。这想了解收视率是多少。这7位用户中有位用户中有2户收看的是户收看的是这台节目,因此节目收视率为这台节目,因此节目收视率为28.57%,可是电视台,可是电视台并不知道,他们需要进行电话调查。假设电话费很并不知道,他们需要进行电话调查。假设电话费很昂贵,一家一户地去调查电视台开支太大,因此他昂贵,一家一户地去调查电视台开支太大,因此他们最多只能选择其中的们最多只能选择其中的4
9、户进行随机抽样调查。户进行随机抽样调查。v可是电视台并不需要很可是电视台并不需要很精确的收视率数据,只精确的收视率数据,只要它在合理的范围内就要它在合理的范围内就行了。行了。v但是但是,如果调查的结果偏偏为如果调查的结果偏偏为0%,那意味着,那意味着什么?这种情况只有什么?这种情况只有1/7的可能会发生,是概的可能会发生,是概率最小的事情。如果最不可能的事情真的发率最小的事情。如果最不可能的事情真的发生了,那电视台也只有相信它是真的,节目生了,那电视台也只有相信它是真的,节目收视率确实为收视率确实为0%,这个节目就该被撤换掉了。,这个节目就该被撤换掉了。v可见,在进行调查的时候,只要把允许的误
10、差可见,在进行调查的时候,只要把允许的误差范围充分放大,就能有足够的把握说,我们的范围充分放大,就能有足够的把握说,我们的调查结果是正确的。前面我们列举的用户和调调查结果是正确的。前面我们列举的用户和调查数字都太小了,所以要把误差范围放大才会查数字都太小了,所以要把误差范围放大才会有足够的把握。在这个例子中,只要把几个数有足够的把握。在这个例子中,只要把几个数字稍微调大一点,误差范围就会大大缩小,而字稍微调大一点,误差范围就会大大缩小,而把握反而会提高。但其真正的电视台用户一般把握反而会提高。但其真正的电视台用户一般都在数十万以上,只要调查都在数十万以上,只要调查30个以上的用户一个以上的用户
11、一般可以有般可以有99%甚至更高的把握把调查误差控制甚至更高的把握把调查误差控制在足够精确的范围内。我们完全可以相信调查在足够精确的范围内。我们完全可以相信调查的结果,而用不着给所有的用户打电话。的结果,而用不着给所有的用户打电话。v这种只对一部分客户进行的调查叫抽样调查。这种只对一部分客户进行的调查叫抽样调查。抽样调查非常有用,要知道大片的森林里有多抽样调查非常有用,要知道大片的森林里有多少棵树,只需选择几个小块的区域进行调查,少棵树,只需选择几个小块的区域进行调查,算出平均密度再乘上总面积,而不用去摸遍每算出平均密度再乘上总面积,而不用去摸遍每一个山头;要知道灯泡的平均使用寿命,只要一个山
12、头;要知道灯泡的平均使用寿命,只要拿少量灯泡进行试验,而不用把所有的灯都用拿少量灯泡进行试验,而不用把所有的灯都用到坏;要知道一个大型养鸡场里明天有多少母到坏;要知道一个大型养鸡场里明天有多少母鸡会下蛋,也只用挑选几十只验一验就够了,鸡会下蛋,也只用挑选几十只验一验就够了,而不用去摸每只鸡的屁股。抽样调查能给我们而不用去摸每只鸡的屁股。抽样调查能给我们的生活带来很大的方便。保险公司也不必去统的生活带来很大的方便。保险公司也不必去统计每个人的真实寿命,它只要抽样调查,一样计每个人的真实寿命,它只要抽样调查,一样可以获得满意的数据。看上去,抽样调查真是可以获得满意的数据。看上去,抽样调查真是个投机
13、取巧的好方法。个投机取巧的好方法。v不过不过,v别高兴得太早。别高兴得太早。导致破产的预言导致破产的预言v抽样调查的结果不是绝对的正确的,即使有抽样调查的结果不是绝对的正确的,即使有99.9%的把握,仍然有的把握,仍然有0.1%的意外会超出误的意外会超出误差允许的范围,那是不可避免的,是可以允差允许的范围,那是不可避免的,是可以允许的正常错误。然而,有些抽样调查却会产许的正常错误。然而,有些抽样调查却会产生非正常的错误。生非正常的错误。v1936年美国总统选举开始了,大部分人年美国总统选举开始了,大部分人认为现任总统罗斯福认为现任总统罗斯福民主党的候选民主党的候选人人将会胜利。但是有个杂志将会
14、胜利。但是有个杂志文学文学文摘文摘却不以为然,因为他们邮寄出却不以为然,因为他们邮寄出1000万份调查问卷,收回了其中的万份调查问卷,收回了其中的240万份,调查结果显示,共和党人兰登将万份,调查结果显示,共和党人兰登将会以绝对优势胜出。会以绝对优势胜出。v1000万的调查样本,这么大规模的问卷万的调查样本,这么大规模的问卷调查足以让人相信罗斯福的总统政治生调查足以让人相信罗斯福的总统政治生涯结束了。但结果却出乎杂志社的预料,涯结束了。但结果却出乎杂志社的预料,罗斯福顺利当选美国总统,后来成为二罗斯福顺利当选美国总统,后来成为二次大战时领导世界人民抗击法西斯的三次大战时领导世界人民抗击法西斯的
15、三巨头之一。由于错误的预测,读者对这巨头之一。由于错误的预测,读者对这本杂志产生了严重的信任危机,大选结本杂志产生了严重的信任危机,大选结束仅仅几个月束仅仅几个月文学文摘文学文摘就破产了。就破产了。v文学文摘文学文摘的问题出在哪里呢?原来,他们的问题出在哪里呢?原来,他们是按电话簿上的地址寄出的调查问卷。虽然今是按电话簿上的地址寄出的调查问卷。虽然今天电话早已经进入了千家万户,但在天电话早已经进入了千家万户,但在20世纪世纪30年代的美国刚刚经历过一场巨大的经济危机,年代的美国刚刚经历过一场巨大的经济危机,失业人数高达失业人数高达900万(而那时美国总人口还不万(而那时美国总人口还不足足1亿)
16、,大部分人的工资只有危机以前的亿),大部分人的工资只有危机以前的1/3的水平,只有一部分相对富裕的家庭用得起电的水平,只有一部分相对富裕的家庭用得起电话这种话这种“高科技产品高科技产品”。电话只有富人才有,。电话只有富人才有,富人大多支持共和党人兰登,这就是富人大多支持共和党人兰登,这就是文学文文学文摘摘调查结果的来历。而当时美国穷人大多支调查结果的来历。而当时美国穷人大多支持罗斯福。在人数上,穷人比富人多得多,由持罗斯福。在人数上,穷人比富人多得多,由于在选举上每个公民都有于在选举上每个公民都有1票,庞大的穷人数票,庞大的穷人数量造成了这次抽样调查结果的巨大偏差。量造成了这次抽样调查结果的巨
17、大偏差。v这是历史上非常有名的抽样统计失败这是历史上非常有名的抽样统计失败的案例。它说明抽样调查的成败有时不的案例。它说明抽样调查的成败有时不在于调查数据量的多少,而在于是否能在于调查数据量的多少,而在于是否能做到完全随机地抽取样本。还是那次总做到完全随机地抽取样本。还是那次总统选举,另外有一个人叫盖洛普,他只统选举,另外有一个人叫盖洛普,他只是在大街上随机找了是在大街上随机找了2万人进行调查就万人进行调查就获得了正确的结果获得了正确的结果罗斯福将获胜。罗斯福将获胜。v所以,即使是抽样检查,也不能抓起电所以,即使是抽样检查,也不能抓起电话就做,还是要首先考虑一下,获取的话就做,还是要首先考虑一
18、下,获取的样本必须是一个样本必须是一个全面全面的群体。的群体。我们还需要统计指数我们还需要统计指数v抽样调查的目的也是为了了解整个群体,实抽样调查的目的也是为了了解整个群体,实际上统计的目的就是为了了解整体的状况,际上统计的目的就是为了了解整体的状况,那我们用什么来衡量这些状况呢?有些用平那我们用什么来衡量这些状况呢?有些用平均数,如平均年龄、平均价格;有的用总数,均数,如平均年龄、平均价格;有的用总数,如人口总数、总价值等。但是这些都是表示如人口总数、总价值等。但是这些都是表示某一时刻的数值,不能反映它们随时间变化某一时刻的数值,不能反映它们随时间变化的情况。为了反映总体状况的变化,我们还的
19、情况。为了反映总体状况的变化,我们还需要需要“指数指数”。v我们经常能听到我们经常能听到“指数指数”这个词:这个词:v股市里有股票指数,像国内的上证综合指数、股市里有股票指数,像国内的上证综合指数、美国的纳斯达克指数。看指数就知道股市的美国的纳斯达克指数。看指数就知道股市的涨落;涨落;v国家和地方政府每年要发布物价指数,代表国家和地方政府每年要发布物价指数,代表那年的物价水平。那年的物价水平。v我们生活用品的价格每天都可能发生变化。我们生活用品的价格每天都可能发生变化。几年前价值几年前价值8000元的电脑配置现在可能只元的电脑配置现在可能只值值3000元;昨天大白菜还是元;昨天大白菜还是5毛钱
20、一斤,毛钱一斤,今天就会听到妈妈在和邻居大妈议论,下今天就会听到妈妈在和邻居大妈议论,下雪了,所有的青菜都涨到了雪了,所有的青菜都涨到了1元以上。不同元以上。不同的东西价格有升有降,但是我们的支出整的东西价格有升有降,但是我们的支出整体上是上升了还是下降了呢?这就需要物体上是上升了还是下降了呢?这就需要物价指数来衡量。价指数来衡量。v电脑好几千元一台,但是我们好几年都不电脑好几千元一台,但是我们好几年都不会更换它。肉呀、菜呀虽然只有几元钱一会更换它。肉呀、菜呀虽然只有几元钱一斤,但是我们哪一天也少不了它们。因此,斤,但是我们哪一天也少不了它们。因此,在编制物价指数时,我们要按物品对我们在编制物
21、价指数时,我们要按物品对我们生活的影响给不同的物品在物价指数中以生活的影响给不同的物品在物价指数中以不同的比率。不同的比率。v真实的物价指数需要了解许许多多物品真实的物价指数需要了解许许多多物品的价格变化,但是现在,让我们先用电的价格变化,但是现在,让我们先用电脑价格和肉价来编一个简单的物价指数。脑价格和肉价来编一个简单的物价指数。v同样的电脑去年同样的电脑去年5000元元/台,今年台,今年3000元元/台,台,按电脑价格对生活的影响,在物价指数中占按电脑价格对生活的影响,在物价指数中占0.1%,而肉去年,而肉去年5元元/斤,今年斤,今年8元元/斤,在物价斤,在物价指数中占了剩下的指数中占了剩
22、下的99.9%,现在让我们看看物,现在让我们看看物价整体是涨了还是降了价整体是涨了还是降了v去年平均物价去年平均物价50000.1%599.9%=9.99元,元,v今年的是今年的是30000.1%899.9%=10.99元,元,v今年平均物价是去年的今年平均物价是去年的110%(10.999.99100%)。)。v如果以去年的物价为基础,今年的物价指数就如果以去年的物价为基础,今年的物价指数就是是110%。v尽管电脑价格下降了尽管电脑价格下降了2000元,而肉元,而肉价只涨了区区价只涨了区区3元钱,可我们总体的元钱,可我们总体的生活支出依然上涨了生活支出依然上涨了10%。v物价指数按用途不同又
23、有商品零售物价物价指数按用途不同又有商品零售物价指数、消费品物价指数,这些与我们的指数、消费品物价指数,这些与我们的日常支出息息相关。日常支出息息相关。v另外的像工业品价格指数、生产资料价另外的像工业品价格指数、生产资料价格指数,会直接影响工业,对我们的生格指数,会直接影响工业,对我们的生活只会有间接影响。活只会有间接影响。v统计数字告诉了我们很多信息,然而如果我统计数字告诉了我们很多信息,然而如果我们对统计数字不加分析,或者错误地分析了们对统计数字不加分析,或者错误地分析了统计数字,我们就会被它误导被它欺骗。的统计数字,我们就会被它误导被它欺骗。的确,统计是淘金的工具。不过,并非每个握确,统计是淘金的工具。不过,并非每个握着淘金筛的人都能淘到金子。要从统计数字着淘金筛的人都能淘到金子。要从统计数字中淘到真金,我们需要一双正确分析统计数中淘到真金,我们需要一双正确分析统计数字的火眼金睛。字的火眼金睛。