从数据到结论引言S

上传人:s9****2 文档编号:570112574 上传时间:2024-08-02 格式:PPT 页数:50 大小:572KB
返回 下载 相关 举报
从数据到结论引言S_第1页
第1页 / 共50页
从数据到结论引言S_第2页
第2页 / 共50页
从数据到结论引言S_第3页
第3页 / 共50页
从数据到结论引言S_第4页
第4页 / 共50页
从数据到结论引言S_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《从数据到结论引言S》由会员分享,可在线阅读,更多相关《从数据到结论引言S(50页珍藏版)》请在金锄头文库上搜索。

1、第一章第一章 引言引言 统计漫漫谈从数据到结论引言S本章内容一、什么是一、什么是统计?二二 中国中国统计的独特的独特历史史环境境三三 统计的内容和需要的知的内容和需要的知识四四 数据和模型的关系数据和模型的关系五五 统计 思思维六六 简单的数理的数理统计例子例子从数据到结论引言S一、什么是一、什么是统计?从数据到结论引言S1 统计的定的定义用以收集用以收集数据数据、分析、分析数据数据和由和由数据数据得出得出结论的一的一组概念、原概念、原则和方法和方法.从数据到结论引言S2 2 什么地方什么地方统计用得上呢?用得上呢?任何任何领域域. .从数据到结论引言S运用运用统计的的领域包括域包括(1)精算

2、精算农业动物学物学人人类学学考古学考古学审计学学晶体学晶体学人口人口统计学学牙医学牙医学生生态学学经济计量学量学教育学教育学选举预测和策划和策划工程工程流行病学流行病学金融金融水水产渔业研究研究遗传学学地理学地理学地地质学学历史研究史研究人人类遗传学学水文学水文学工工业法律法律语言学言学文学文学劳动力力计划划管理科学管理科学市市场营销学学医学医学诊断断气象学气象学军事科学事科学核材料安全管理核材料安全管理眼科学眼科学制制药学学物理学物理学政治学政治学心理学心理学心理物理学心理物理学 质量控制量控制宗教研究宗教研究社会学社会学调查抽抽样分分类学学气象改善气象改善搏采,等等搏采,等等.从数据到结论

3、引言S统计历史人物史人物Edmond Halley (哈雷哈雷) (1656-1742) Leonhard Euler (欧拉欧拉) (1707-1783) Thomas Robert Malthus (马尔萨斯斯) (1766-1834)Ronald Aylmer Fisher (费歇歇) (1890-1962), Moivre (棣美佛棣美佛) (1667-1754) Pierre Simon Laplace (拉普拉斯拉普拉斯) (1749-1827) Jacob Bernoulli (伯努利伯努利)(1654-1705) Thomas Bayes (贝叶斯叶斯) (1702-1761)

4、, Adrien Marie Legendre (勒勒让德德) (1752-1833) Friedrich Gauss (高斯高斯) (1777-1855) Johann Gregor Mendel (孟德孟德尔) (1822-1884)Karl Pearson (皮皮尔森森) (1857-1936)William Feller (费勒勒)(1906-1970). Jerzy Neyman (1894-1981) Egon Sharpe Pearson (1895-1980) 从数据到结论引言S3 3 你想你想过下面的下面的问题吗?当当你你买了了一一台台电视时,被被告告知知三三年年内内可可以以

5、免免费保保修修。你你想想过厂厂家家凭凭什什么么这样说吗?说多多了了,厂厂家家会会损失失;说少少了了,会会失失去去竞争争,也也是是损失。到底失。到底这个保修期是怎个保修期是怎样决定的呢?决定的呢?在在同同一一年年级中中,同同样统计学学的的课程程可可能能由由一一些些不不同同教教师讲授授。教教师讲课方方式式当当然然不不一一样,考考试题目目也也不不一一定定相相同同。那那么么如如何何比比较不不同同班班级的的统计学成学成绩呢?呢?大大学学排排名名是是一一个个非非常常敏敏感感的的问题。不不同同的的机机构构得得出出不不同同的的结果果;各各自自都都说自自己己是是客客观、公公正正和和有有道道理理的的。到到底底如如

6、何何理理解解这些些不不同同的的结果呢?果呢?从数据到结论引言S任任何何公公司司都都有有一一个个信信用用问题。当当然然,在在这些些公公司司试图得得到到贷款款时并并没没有有不不还贷的的不不良良记录。如如何何根根据据它它们的的财务和和商商业资料料来判断一个公司的信用等来判断一个公司的信用等级呢?呢?我我国国东部部和和西西部部的的概概念念是是一一个个比比较笼统的的概概念念。如如何何能能够根根据据需需要要,选择一一些些指指标来把各省,或各市来把各省,或各市县甚至村甚至村进行分行分类呢?呢?疾疾病病传播播时,如如何何能能够通通过感感染染者者入入院院前前后后的的各各种种因因素素得得到到一一个个疾疾病病传染染

7、方方式式的的模模型呢?型呢?从数据到结论引言S如如何何通通过大大众众调查来来得得到到性性别、年年龄、职业、收收入入等等各各种种因因素素与与公公众众对某某项事事物物(比比如如商商品品或或政政策策)的的态度度的的关关系系呢呢?一一个个从从来来没没有有研研究究过红楼楼梦梦的的统计学学家家如如何何根根据据比比较写写作作习惯得得出出红楼楼梦梦从从哪哪一段开始就不是曹雪芹的手笔了呢?一段开始就不是曹雪芹的手笔了呢?如如何何才才能能够客客观地地得得到到某某个个电视节目目的的收收视率率,以以确确定定广广告告的的价价格格是是否否合合理理呢呢?从数据到结论引言S4 你如何理解下面你如何理解下面说法?法?“明天降水

8、概率明天降水概率为4040”“我冬天去新加坡度假的概率我冬天去新加坡度假的概率为1010”“该节目收目收视率是率是30%30%” “调查结果表明果表明20%20%的的观众喜众喜欢某某节目目”“抽抽样调查结果的果的误差差为3%3%” “支持率的支持率的9595置信区置信区间为(25%,30%)(25%,30%)”“某学校排名第一某学校排名第一”“某某县是是贫困困县”从数据到结论引言S5 你如何理解下面你如何理解下面说法?法?“某国的某国的综合合竞争力排名第争力排名第4343位位”“该国家属于国家属于发展中国家展中国家”“该药品品疗效效99%99%”“该国国贫富差距大富差距大”“这个个县收入比那个

9、收入比那个县高高”“该结果果统计显著著”“消消费价格指数价格指数为120%120%”“他的血他的血压已已经正常了正常了”从数据到结论引言S6 你相信你相信统计结果果吗?数据可以有数据可以有误或作假或作假统计方法(有意或无意)使方法(有意或无意)使用不当可以用不当可以误导。有低。有低级误导和高和高级误导。常常识判断和直判断和直觉是重要的是重要的从数据到结论引言S关于美国关于美国选举的两个例子的两个例子(1)谁会在会在1936选举选举中中获胜获胜 ?Alf London还还是是 F.D.R.(罗罗斯福斯福)? Literary Digest (文摘文摘)送出一千万份送出一千万份问卷卷(返回二百四十

10、万份返回二百四十万份)后后,预测London 会会赢赢. 而而Gallop(盖洛普盖洛普)只只问了了5000人人说 Roosevelt (罗罗斯福斯福)会会赢赢. 最后最后罗罗斯福和盖洛普都斯福和盖洛普都赢赢了了.文摘倒文摘倒闭了了.从数据到结论引言S从数据到结论引言S谁会在会在1948选举选举中中获胜获胜 ? Thomas Dewey还还是是Harry Truman(杜杜鲁门鲁门)? Crossley, Gallop(盖洛普盖洛普), Roper所所有都有都预测Dewey 会会赢赢(每个机构用了每个机构用了5000个个问问卷卷). 最后最后(包括盖洛普包括盖洛普)他他们们都都输输了了, 而杜

11、而杜鲁鲁门赢门赢了了.关于美国关于美国选举的两个例子的两个例子(2)从数据到结论引言S从数据到结论引言S7 统计的一些做法的一些做法统计可以指可以指导我我们收集数据收集数据. .当当拥有来自一些有来自一些变量量( (指指标) )的数据或的数据或记录, ,但缺乏模型来描述但缺乏模型来描述这些些变量之量之间关系的情关系的情况下况下, ,可用可用统计方法建立模型方法建立模型. .在有了一定的模型在有了一定的模型时, ,统计可以确定手中数可以确定手中数据是否令人信服地支持某种据是否令人信服地支持某种论点点. .模型也用模型也用来来对未来未来进行行预测. .统计直直观的的图表展示表展示, ,可以使各个可

12、以使各个领域的域的专家容易理解家容易理解从数据到结论引言S二二 中国中国统计的独特的独特历史史环境境中国中国统计过去分去分为“统计学学”( (文科的列宁主文科的列宁主义统计) )和和“数理数理统计”( (数学数学类的国的国际意意义上的上的统计) )从数据到结论引言S国内一些学者把国内一些学者把统计称称为是是经济学科的一部分,学科的一部分,则是中是中国特有的与前国特有的与前苏联关关联的国的国情所造成情所造成这种种经济学中的学中的统计学的数学的数学水平低于小学数学水平。学水平低于小学数学水平。与与现代代经济学所需的大量的学所需的大量的统计和数学形成和数学形成鲜明明对照照. .从数据到结论引言S前前

13、苏联式的式的“统计学学” 目前即使在俄国也无人目前即使在俄国也无人问津津但其八股形式在中国仍但其八股形式在中国仍然流行;而且存在于在然流行;而且存在于在官方的官方的统一考一考试中中从数据到结论引言S2003年版的一本年版的一本统计学原学原理理说:统计学的理学的理论基基础是是马列主列主义、毛、毛泽东思想和思想和邓小平理小平理论( (ISBN7-81029-073-8/C.22003-8-283232622.00)1998年的一本年的一本理理论统计学学还说:统计为无无产阶级政政治服治服务( (ISBN7-5046-2407-1/C.68)从数据到结论引言S三三 统计的内容和需要的知的内容和需要的知

14、识统计可能触及数学的几乎所有内容可能触及数学的几乎所有内容( (你不一定事先知道需要什么你不一定事先知道需要什么) )但每一个但每一个统计问题或者分支可能只或者分支可能只用数学的很小一部分用数学的很小一部分用用计算机做算机做统计计算算其他其他( (对象象) )领域的知域的知识(如生物医(如生物医学、学、经济、行、行为、社会、金融等等)、社会、金融等等)从数据到结论引言S1 数学的重要性数学的重要性真正真正严格的格的逻辑仅存在于数学之中,存在于数学之中,只能只能够从学从学习数学中数学中获得。得。(哲学,(哲学,法律?)法律?)数学的数学的逻辑服服务于于现代理性社会的所代理性社会的所有方面。有方面

15、。(例如法律)(例如法律)在一定的公理系在一定的公理系统下,下,纯粹数学是唯粹数学是唯一可以一可以说得出得出绝对是非的世界。是非的世界。为什么人什么人们对数学家的印象是数学家的印象是“呆呆”?(世界并不是完美的)(世界并不是完美的)从数据到结论引言S2 统计和数学的区和数学的区别数学思数学思维是以演是以演绎为主主统计思思维是以是以归纳为主主, ,兼有兼有演演绎统计各各领域利用几乎所有存域利用几乎所有存在的数学内容在的数学内容. .但但统计本身的数学是本身的数学是为具体具体目目标服服务的的, ,自己一般不形成自己一般不形成数学体系数学体系从数据到结论引言S3 计算机的重要性算机的重要性由于由于统

16、计和数据打交道和数据打交道, ,没有没有计算机的算机的发展展统计就没有前就没有前途途. .计算机和算机和统计的的发展相展相辅相相成成从数据到结论引言S四四 数据和模型的关系数据和模型的关系作作为根据的数据根据的数据(比如各地人均比如各地人均GDP,各各种种资源源,自然条件等和航空旅客人数自然条件等和航空旅客人数)基于数据建立模型基于数据建立模型(回回归模型模型)模型用来指模型用来指导未来未来, 预测未来未来(某城市某城市GDP达到某水平达到某水平,是否需要建立或是否需要建立或扩建建机机场等决策等决策)模型随模型随时要根据新的数据来改要根据新的数据来改进(新的新的飞机机,新的消新的消费理念理念,

17、新的旅游景点等新的旅游景点等)没有完美的模型没有完美的模型没有无没有无误差的数据差的数据从数据到结论引言S五五 统计 思思维类似于物理学,似于物理学,统计在否定中在否定中发展展从数据到结论引言S统计的一个重要但又往的一个重要但又往往不易往不易为人所理解的特点人所理解的特点是是统计从来不从来不绝对地地说“是是”或者或者“不是不是”。统计只能只能够说可能,而可能,而且往往提供某事可能且往往提供某事可能发生生的概率。的概率。从数据到结论引言S是非是人是非是人类社会的社会的产物物大灰狼吃羊犯大灰狼吃羊犯错误了了吗?人人类社会之外的自然界有是非社会之外的自然界有是非吗?人人类社会的社会的“是非是非”是一

18、成不是一成不变的的吗? 从数据到结论引言S统计只只说可能性是可能性是实际世世界的真界的真实体体现。真。真实世界世界充充满了不确定性。了不确定性。从某种意从某种意义来来说,生活中,生活中唯一确定的事情就是其不唯一确定的事情就是其不确定性。确定性。 从数据到结论引言S正是不确定性使得生活充正是不确定性使得生活充满了魅力和迷人的色彩。了魅力和迷人的色彩。有多少人会享受其未来每有多少人会享受其未来每一一时刻全部已刻全部已经确定了的确定了的世界呢?世界呢?从数据到结论引言S统计需要的是科学式的需要的是科学式的怀疑和疑和发展的思展的思维方式方式而不是而不是顺从、盲从和服从从、盲从和服从也不能用固定的眼光来

19、看也不能用固定的眼光来看自己和世界自己和世界从数据到结论引言S六六 简单的的数理数理统计例子例子 从数据到结论引言S1 考考试分数的分数的t-检验之例之例假定有两个班假定有两个班级进行考行考试。从第一个班抽取从第一个班抽取2个个观测值的一个的一个样本,本,分数分数为(数据(数据1 )(n=2):-100, -300分分(样本均本均值-200分分) 从第二个班抽取从第二个班抽取10个个观测值的的样本,本,分数分数为(数据(数据2)(n=10):100, 100, 100, 100, 100, 100, 99, 99, 99, 99(样本本均均值99.6分)分)哪个班平均成哪个班平均成绩更接近更接

20、近100分?分?从数据到结论引言S考考试分数的分数的t-检验之例之例H0: m m=100 对 Ha: m m100 (假定分数可以多于(假定分数可以多于100)数据数据1 (n=2):-100, -300分分(样本均本均值-200分分) t = -3, df = 1, p-value = 0.1024 结论:在水平:在水平a a=0.1下接受下接受这-100分和分和-300分所代分所代表的表的总体的均体的均值为100的零假的零假设(你同意吗?)。数据数据2 (n=10):100,100,100,100,100,100,99,99,99,99(样本均本均值99.6分)分)t = -2.4495

21、, df = 9, p-value = 0.0184 结论:在水平在水平a a=0.05下拒下拒绝由由这六个六个100分四个分四个99分所代表的分所代表的总体均体均值为100的零假的零假设。 从数据到结论引言S假假设检验的企的企图是否定零假是否定零假设(H0).何何时能能说“接受零假接受零假设”?越学越糊涂越学越糊涂吗?下面再看一个例子下面再看一个例子从数据到结论引言S2 利用利用KS检验看数据看数据1、2、3、4、5是否是否为正正态、Poisson、均匀、均匀或指数分布或指数分布(这是四个是四个检验的的零假零假设H0).后面是后面是检验结果(果(SPSS输出出)从数据到结论引言S按照某些按照

22、某些统计教科教科书,看来,看来应该接受接受该数据有正数据有正态总体的零假体的零假设但是但是从数据到结论引言S按照某些按照某些统计教科教科书,看来,看来还应该接受接受该数据有数据有Poisson总体的零假体的零假设。但是。但是从数据到结论引言S按照某些按照某些统计教科教科书,看来,看来还应该接受接受该数据有指数分布数据有指数分布总体的零体的零假假设。但是。但是从数据到结论引言S按照某些按照某些统计教科教科书,看来,看来还应该接受接受该数据有均匀分布数据有均匀分布总体的零体的零假假设。从数据到结论引言S谁的也不听。的也不听。证据不足以拒据不足以拒绝任何一个零任何一个零假假设,但,但绝不意味着接受任

23、不意味着接受任何一个(或所有的?!)。何一个(或所有的?!)。到底听哪一个?到底听哪一个?从数据到结论引言S3 两个两个变量量X和和Y的的相关相关检验(各有各有51个个观测值),看来相看来相关关.从数据到结论引言SX和和Y的回的回归的方差分析和的方差分析和对斜率斜率b b1的的t-检验(还有有R2值等等).看来看来显著著.从数据到结论引言S查看正看正态性性:(PP图与残差与残差图和和Kolmogorov-Smirnov 检验: ks = 0.098, p-value = 0.5), 未未发现问题.从数据到结论引言S但是但是实际数据的数据的X和和Y没有一点关系没有一点关系(一个点除外一个点除外)所有使得回所有使得回归看上去看上去“合理合理”的根源就是的根源就是这一一个点个点从数据到结论引言SH=X(XX)-1X的的对角角线元素元素hi从数据到结论引言S究竟是接受、拒绝、还是怀疑我们被灌输的东西? 从数据到结论引言S我们肩膀上长着自己的脑袋. 从数据到结论引言S

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号