《抽样推断》ppt课件

上传人:tia****nde 文档编号:69551943 上传时间:2019-01-14 格式:PPT 页数:39 大小:818.82KB
返回 下载 相关 举报
《抽样推断》ppt课件_第1页
第1页 / 共39页
《抽样推断》ppt课件_第2页
第2页 / 共39页
《抽样推断》ppt课件_第3页
第3页 / 共39页
《抽样推断》ppt课件_第4页
第4页 / 共39页
《抽样推断》ppt课件_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《《抽样推断》ppt课件》由会员分享,可在线阅读,更多相关《《抽样推断》ppt课件(39页珍藏版)》请在金锄头文库上搜索。

1、,5.1 抽样推断的一般问题 5.2 抽样误差 5.3 抽样估计的方法 5.4 抽样组织设计,主要内容,第5章 抽样估计,随机原则,总体,样本,总体参数,统计量,推断估计,参数估计,检验,假设检验,抽样分布,5.1 抽样推断的一般问题,抽样推断是按照随机原则,从全部研究总体中抽取一部分单位进行调查,并依据所获得的数据对总体的某一数量特征做出具有一定可靠程度的估计与推断的一种统计方法。抽样推断的全过程,就是抽样调查。,与全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活。 在某种情况下,抽样调查的结果比全面调查要准确。 抽选部分单位时要遵循随机原则。 抽样调查会产生抽样误差,抽样误差可

2、以计算,并且可以加以控制。,抽样推断的意义:,抽样调查的基本特点:,抽样调查的作用: 有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的方法。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,也要采用抽样调查。 抽样调查的结果可以对全面调查的结果进行检查和修正。 抽样调查可以用于工业生产过程的质量控制。 利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,以决定行动的取舍。,1. 总体和样本 2. 总体参数和样本统计量 3. 样本个数和样本容量 4. 重复抽样和不重复抽样,抽样推断的基本概念,总体也称全及总体,指所要认识的研究对象全体,

3、总体单位总数用“N”表示。,样 本又称子样,是从全及总体中随机抽取出来,作 为代表这一总体的那部分单位组成的集合体, 样本单位总数用“n”表示,N大于30为大样本.,总体和样本,例如:从10000个商业网点中随机抽取50个进行观察, 样本容量即为50。样本容量是决定样本数目和抽样误 差的主要因素之一。,总体和样本指标及符号对照表,参数:,指反映总体数量特征的综合指标。,研究总体中 的数量标志,总体平均数,总体标准差,研究总体中 的品质标志,总体成数,成数标准差,参数和统计量,将总体N个单位分成性质相反的两组,其中具有某特征的组的单位数为N1,成数为P,,将总体N个单位分成性质相反的两组,不具有

4、该特征的组的单数为N0,N0 =N-N1,成数为Q,总体中具有某种标志值的单位数在全及总体单位总数 中所占的比重,称为全及成数或总体成数 ,用P表示。,统计量:,根据样本数据计算的综合指标。,研究数 量标志,样本平均数,样本标准差,研究品 质标质,样本成数,成数标准差,样本容量和样本个数,样本容量:,一个样本包含的单位数。用 “n” 表示。一般要求 n 30,样本个数:,从一个全及总体中可能抽取的 样本数目。用M 表示,重复抽样和不重复抽样,重复抽样:,又称回置抽样。,不重复抽样:,可能组成的样本数目M:,可能组成的样本数目M:,又称不回置抽样。,5.2 抽样误差的研究,概念:由于随机抽样的偶

5、然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。,抽样误差的来源:在抽样中误差的来源有许多方面,一类是登记性误差,另一类是代表性误差。,影响抽样误差的主要因素:,1、总体各单位标志值的差异程度。在其他条件不变的情况下,总体各单位标志值的变异程度愈大,抽样误差也愈大,反之则愈小。,2、样本的单位数。在其他条件不变的情况下,样本单位数愈多,抽样误差就愈小,反之则愈大。,3、抽样方法。抽样方法不同,抽样误差也不同。一般说来,重复抽样的误差比不重复抽样的误差要大。,4、抽样调查的组织形式。选择不同的抽样组织形式,也会有不同的抽样误差。,抽样平均误差,抽样平均

6、误差是抽样平均数或抽样成数的标准差。反映了抽样平均数与总体平均数抽样,成数与总体成数的平均误差程度。,重复抽样,不重复抽样,抽样平均数的平均误差,抽样成数的 平均误差,例 题一:,随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?,解:,即: 当根据样本学生的平均体重估计全部 学生的平均体重时,抽样平均误差为1公斤。,已知,则,例 题二:,某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?,解:,计算结果表明:根据部分产品推断全部

7、产品的 平均使用寿命时,采用不重复抽样比重复抽样 的平均误差要小。,已知,则:,例 题三:,某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?,解:,已知,则:样本成数,即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。,例 题四:,一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?,解:,已知:,则:样本合格率,结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。,抽样极限误差,样本指标与总体指标之间可允

8、许的最大误差范围。,计算方法:,它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。,抽样平均数极限误差:,抽样成数极限误差:,置信区间,置信区间,抽样误差的概率度,抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“ z ”表示。,公式表示:,(z是极限误差与抽样平均误差的比值),(极限误差是 z倍的抽样平均误差),上式可变形为:,概率度和概率(置信度、置信概率)成正比, 在概率表中可以查表,z1时, F(z)68.27 z2时, F(z)95.45 z3时, F(z)99.73,就是以样本指标直接代替总体指标的估计值,不考虑误差及可靠程度,对总体指标准确要求也不高。这种估计方

9、法简单,只要样本代表性大,则点估计的准确性也较高。,5.3 抽样估计的方法,点估计:,1、无偏性 :要求所有的可能样本指标的平均值(样本指标的期望值)与被估计的总体的参数之间没有偏差,2、一致性 :随着样本单位数的无限增加,统计量和未知的总体参数之差的绝对数小于任意小的数,3、有效性:以统计量估计总体参数时,优良估计量的方差应该比其他估计量的方差小。,优良点估计的标准,就是根据概率保证程度的要求,选定概率度z ,以及极限抽样误差,再利用抽样指标或p ,定出估计上限和估计下限,即指出总体指标可能存在的区间范围。,区间估计:,区间估计三要素,抽样误差范围,概率保证程度,估计值,总体参数区间估计的方

10、法(类型),(一)根据给定的抽样误差范围,求概率保证程度,分析步骤:,1、抽取样本,计算抽样指标。,2、根据给定的极限误差范围估计总体 参数的上限和下限。,3、计算概率度。,4、查表求出概率F(t),并对总体参数作出区间估计。,(二)根据给定的概率F(t),推算 抽样极限误差的可能范围,分析步骤:,1、抽取样本,计算样本指标。,2、根据给定的F(t)查表求得概率度 t 。,3、根据概率度和抽样平均误差计算极限误差。,4、计算被估计值的上、下限,对总体参数作 出区间估计。,(三)样本容量的确定,某农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用不重复简单随机抽样,从中抽选了100亩作为样本

11、进行实割实测,测得样本平均亩产400斤,方差144。,(1)以95.45%的可靠性推断该农场小麦平均亩产可能在多少斤之间?,例 题 一:,(2)若概率保证程度不变,要求抽样允许误差不超过1斤,问至少应抽多少亩作为样本?,已知:N=10000 n=100,问题一解:,1、计算抽样平均误差,2、计算抽样极限误差,3、计算总体平均数的置信区间,上限:,下限:,即:以95.45%的可靠性估计该农场小麦平均亩产量在 397.62斤至402.38斤之间.,问题二解:,已知:,则样本单位数:,即:当,至少应抽544.6亩作为样本。,(2)若概率保证程度不变,要求抽样允许误差不超过1斤,问至少应抽多少亩作为样

12、本?,例题二:,某纱厂某时期内生产了10万个单位的纱,按纯随机抽样方式抽取2000个单位检验,检验结果合格率为95%,废品率为5%,试以95%的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?,已知:,区间下限:,区间上限:,例题三:,为调查农民生活状况,在某地区5000户农民中,按不重复简单随机抽样法,抽取400户进行调查,得知这400户中拥有彩色电视机的农户为87户。,1、以95%的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间?,2、若要求抽样允许误差不超过0.02,其它条件不变,问应抽多少户作为样本?,问 题 一 解:,已知:N=5000,n=400,1、

13、计算样本成数:,2、计算抽样平均误差:,3、抽样极限误差:,4、总体P的置信区间:,下限:,上限:,以95%的把握程度估计该地区农户中拥有彩电的农户在17.87%至25.63%之间。,问 题 二 解:,当,其他条件不变时:,=1635(户),2、若要求抽样允许误差不超过0.02,其它条件不变,问应抽多少户作为样本?,样本数的确定,待估计参数,已知条件,样本数的确定,重复抽样,总体均 值(),例:误差范围,简 单 随 机 抽 样,不重复抽样,总体成数 (P),重复抽样,不重复抽样,5.4 抽样方案的设计,抽样调查的组织方式:,1. 简单随机抽样(纯随机抽样),方法:将总体单位编成抽样框,而后用抽

14、签或随机数表抽取样本单位。,适用:总体规模不大;总体内部差异小。,2. 类型抽样(分层抽样),方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。,总体 N,样本 n,等额,等比例,最优,3. 等距抽样(机械抽样),方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。,排序依据的标志:(1)无关标志;(2)有关标志。,(总体单位按某一标志排序),4. 整群抽样,方法: 将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查。,单选题,1、反映样本指标与总体指标之间的平均误差程度的指标是( )2007.7 A、平均

15、数离差 B、概率度 C、抽样平均误差 D、抽样极限误差,C,2、在一定的抽样平均误差条件下( )。2007.1 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度,A,多选题,1、影响抽样误差大小的因素有( ) 2007.7 2009.1 2010、1 A、抽样调查的组织形式 B、抽取样本单位的方法 C、总体被研究标志的变异程度 D、抽取样本单位数的多少 E、总体被研究标志的属性,ABCD,计算题,1、采用简单重复抽样的方法从一批零件中抽取200件进行检测,其中合格品188件。 要求:(1)计算该批零件合格率的抽样平均误差; 2007.7 (2)按95.45%的可靠程度(z=2)对该批零件的合格率作出区间估计。,解:(1),(2),90.64%=94%-3.36%=,=94%+3.36%=97.36%,2、某工厂有2000个工人,用简单随机重复方法抽出100个工人作为样本,计算出平均产量560件,标准差32.45件。 2007.1 要求:(1)计算抽样平均误差;(2)以95.45%(z=2)的可靠 性估计该厂工人的月平均产量。,解:,(1),=,=3.245,(2),工人月平均产量的区间范围是:,553.5

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号