统计学第五章抽样

上传人:油条 文档编号:26823711 上传时间:2018-01-02 格式:PPT 页数:32 大小:201.50KB
返回 下载 相关 举报
统计学第五章抽样_第1页
第1页 / 共32页
统计学第五章抽样_第2页
第2页 / 共32页
统计学第五章抽样_第3页
第3页 / 共32页
统计学第五章抽样_第4页
第4页 / 共32页
统计学第五章抽样_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《统计学第五章抽样》由会员分享,可在线阅读,更多相关《统计学第五章抽样(32页珍藏版)》请在金锄头文库上搜索。

1、游 士 兵 教授 博士生导师 电 话: 13607175789 E-mail: ,统计学Statistics,第五章 抽样推断 sampling and sampling inferences章前导语: 我们必须确信运气的存在,否则对那些我们不喜欢的人的成功,我们又何得以能安然呢? 台湾政治大学:詹世煌教授,一、基本问题 core issues1、什么是抽样推断? sampling inferences 抽样推断是在遵守随机原则的条件下,从总体中抽选样本,并且以样本指标推断总体指标的一种统计分析方法。 这里注意:一是对随机原则的理解 一是抽样推断的目的(平均数和成数),2、抽样推断的适用范围,

2、对大量现象的观察对不可能进行全面调查,而又需要了解全面情况的现象虽然可以进行全面调查,但不必要进行全面调查的现象对普查或全面调查的统计数据的质量进行检查或修正,3、样本单位的抽选方法重复抽样不重复抽样 请注意: A、重复抽样和不重复抽样对抽样结果和误差的差异 B、理论上和实际中的认识和运作的差异,4、抽样推断的组织形式简单随机抽样分层随机抽样等距随机抽样(又称系统或机械随机抽样)整群随机抽样,5、本章的主要内容抽样误差sampling error点估计和区间估计 point estimation and interval estimation抽样数目的确定 determining the sa

3、mple size假设检验hypothesis testing,二、抽样误差sampling error1、抽样误差的含义 抽样误差是指样本指标值与被推断的总体指标值之差。 主要包括: 样本平均数与总体平均数之差 样本成数与总体成数之差,2、抽样误差的来源 一类:登记性误差 二类:代表性误差 A、系统性误差 B、偶然性误差 注意:抽样误差特指偶然性误差,3、影响抽样误差的因素抽样单位数的多少总体中被研究标志的变动程度的大小,4、抽样误差的统计度量方法,(1)理论准备 总体指标在抽样之前,甚至在抽样之后是无法知道的; 请大家回忆一下标准差的含义及计算方法,抽样误差实际上是用抽样平均误差来代替的,

4、因为:,所有可能样本平均数或成数的平均数等于总体平均数或成数抽样平均误差是所有可能样本平均数(或成数)与总体平均数(或成数)的平均误差程度,即所有可能样本平均数或成数的标准差,因此,样本平均数或样本成数的标准差实际上就反映了样本平均数或样本成数与总体平均数或总体成数的平均误差程度,即抽样误差。由于不可能,也没有必要把所有的样本都抽出来,因此,计算方法另求。,(2)公式应用,抽样误差的计算公式可分为两种条件下的两种推断的计算公式: 两种条件:重复抽样和不重复抽样两种推断: 以样本平均数推断总体平均数; 以样本成数推断总体成数 这样,就有四个计算公式。,特别提示:在计算抽样误差时,往往遇到总体方差

5、缺少的情况,通常采取以下方法解决:用估计的资料用过去调查所得到的资料用样本方差代替,特别注意如果同时有几个方差供选择, 则选择其中最大的;如果同时有几个成数供选择, 则选择靠近0.5的那个成数。,(3)计算举例,例1:某企业生产一批产品20000件,今随机抽样100件作耐用时间试验,结果表明:每件样本的平均寿命为3600小时,所抽样本的标准差为150小时,求抽样误差。,例2:随机抽取500名某国私人对外投资者,发现对外投资额在5000万元以上的人数有80人,求抽样误差。例3:一批食品随机抽查50箱,发现一箱不合格,求合格率的抽样误差。,三、点估计和区间估计 point estimation a

6、nd interval estimation,1、点估计 点估计是直接用样本指标推断总体指标的一种方法。 点估计的特点是只考虑了样本指标,而没有考虑抽样误差。,2、区间估计,(1)理论准备 所谓区间估计就是在一定概率保证下,确定总体参数值的可能范围。 所谓概率就是指在随机事件进行大量实验中,某种事件出现的可能性的大小。 抽样估计的概率保证程度就是指抽样误差不超过一定范围的概率大小。,(2)几个概念,允许误差(又称极限误差):是指扩大或缩小以后的抽样误差。概率度t:是指扩大或缩小抽样误差的倍数。置信度1-(俗称可靠度)是指由样本指标估计的总体区间中有100(1- )%的估计区间包括了总体的实际值

7、。,四、抽样数目的确定 determining the sample size,由于有两种条件和两个推断,所以,抽样数目确定的公式也有四个公式。但其基本来源公式为: =t,五、假设检验hypothesis testing,(一)什么是假设检验? 1、假设检验的应用背景 2、假设检验是在两种互相对立的行动之间,通过对样本的试验,在一定的保证条件下进行决策的统计分析方法。,(二)假设检验的一些理论准备,1、抽样误差判断风险 统计学上的风险概率通常用 表示,又称显著性水平。如: =0.1 =0.05 =0.01 即:分别的含义是指所作的决策有10%、5%和1%的风险。或者说:所作的决策有90%的把握

8、,10%的风险 95%的把握,5%的风险 99%的把握,1%的风险,2、在区间估计里,关于 t称为检验统计量的问题,3、双侧检验和单侧检验 通常在判断是否“多于”、“少于”、“好于”、“差于”、“大于”、“小于”、“至少”等时,采用单侧检验是比较合适的,这种检验所关心的是估计值是否偏高(或者偏低),是单向的。 但在判断“不同于”、“不相等”以及某些现象“太好了也不行,太坏了也不行”、“太多了也不行,太少了也不行”、“太薄了也不行,太厚了也不行”、太重了也不行、太轻了也不行“等时,往往需要进行双侧检验。4、假设检验的基本思路: (1)反证法:先假定原假设为真,如果检验中出现了不合理的现象,则表明

9、原假设是错误的,应该拒绝原假设,接受备用假设。反之,亦反。 (2)小概率原理:小概率原理认为:小概率事件在一次试验中几乎不可能发生,如果小概率事件在一次试验中居然发生了,则有理由怀疑原假设的真实性,从而拒绝原假设。,(三)假设检验的程序,1、根据抽样目的决定假设形式 A、双侧检验的假设 B、单侧检验的假设 2、选择显著性水平 3、计算检验统计量 A、大样本检验(Z检验法) B、小样本检验(t检验法) 4、查表,决策。,(四)应用举例,例1、某茶叶厂产生袋装茶叶,正常情况下每袋茶叶净重平均为500克,标准差为13克。最近,厂质检部门接到消费者投诉,认为该厂新投放市场的一批茶叶似乎普遍分量不足。为

10、此,从生产线是随机抽取了40袋茶叶,测得其平均重量为495克,能否认为该厂最近生产的茶叶包装分量确实不足?(显著性水平=1%),例2 根据经验,某高校历年入学新生的平均数为167厘米,标准差为10厘米。现从今年入学新生中随机抽查了30名学生,测得其平均身高为169厘米,如果标准差与往年一样,能否在=0.05的水平上认定今年入学新生的平均身高与往年有显著变化?,例3、某公司引进一自动包装线包装大米,合同规定设计规格为每袋大米10公斤,标准差为0.6公斤,生产调试后随机抽取100袋大米平均重量为9.8公斤。问可靠程度为95%下,该生产线的设计规格是否符合要求?,例4、取8台新型发动机进行测试,其结

11、果是使用柴油每公升的运转时间分别为28、27、31、29、30、27、30、27分钟。根据设计要求,平均每公升运转应在30分钟以上。问根据实验结果,在显著性水平为5%和总体标准差不明确的条件下,能否说明这种发动机符合设计要求?,例5、某产品的耐用时间为1000小时,现随机抽取10件新工艺条件下的产品作测试,测得平均耐用时间为1077小时,标准差为51.97小时,能否认为新工艺条件下产生的产品明显不同于老产品?,例6、我国出口的特产参茸药酒畅销某国市场,据以往的调查,购买此药酒的有50%为40岁以上的男子。经营该要酒的进口公司关心这个百分比是否发生了变化,委托国外一个调查公司随机抽选了400名调查,结果有210名为40岁以上的男子,按显著性水平5%计算,能否根据调查结果认为原百分比已经改变?,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 电子/通信 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号