统计学 第四章_抽样估计2

上传人:M****1 文档编号:568772141 上传时间:2024-07-26 格式:PPT 页数:59 大小:719KB
返回 下载 相关 举报
统计学 第四章_抽样估计2_第1页
第1页 / 共59页
统计学 第四章_抽样估计2_第2页
第2页 / 共59页
统计学 第四章_抽样估计2_第3页
第3页 / 共59页
统计学 第四章_抽样估计2_第4页
第4页 / 共59页
统计学 第四章_抽样估计2_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《统计学 第四章_抽样估计2》由会员分享,可在线阅读,更多相关《统计学 第四章_抽样估计2(59页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章 抽样估计抽样估计抽样分布定理抽样分布定理待估参数待估参数均值均值比例比例方差方差大样本大样本小样本小样本正态分布正态分布正态总体方差已知正态总体方差已知正态总体方差未知正态总体方差未知正态分布正态分布t分布分布大样本大样本正态分布正态分布卡方分布卡方分布第四章第四章 抽样估计抽样估计第四章第四章 抽样估计抽样估计第一节 抽样分布及中心极限定理抽样分布及中心极限定理第二节 抽样误差抽样误差第三节 参数估计方法参数估计方法第四节 样本容量的确定样本容量的确定第四章第四章 抽样估计抽样估计第三节 参数估计方法一、估计量的评价标准一、估计量的评价标准二、参数估计方法二、参数估计方法第四章

2、第四章 抽样估计抽样估计估计量的评价标准估计量的评价标准设为待估计的总体参数,设为待估计的总体参数, 为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计量估计量指指样本指标的均值应等于被估样本指标的均值应等于被估计的总体参数计的总体参数无偏性无偏性第四章第四章 抽样估计抽样估计P P( ( X X ) )X XC CA A 无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏估计量的评价标准估计量的评价标准指指样本指标的均值应等于被估样本指标的均值应等于被估计的总体参数计的总体参数无偏性无偏性第四章第四章 抽样估计抽样估计若,则称为比更有效的估计量若,

3、则称为比更有效的估计量作为优良的估计量,除了满足无偏作为优良的估计量,除了满足无偏性的要求外,其方差应比较小,第性的要求外,其方差应比较小,第一原则。一原则。有效性有效性估计量的评价标准估计量的评价标准AB 中位数的抽样分布中位数的抽样分布中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P( (X X ) )如,与其他估如,与其他估计量相比,计量相比,样本均值是样本均值是总体均值的总体均值的有效估计量有效估计量第四章第四章 抽样估计抽样估计若越大越小,则称为的一致估计量若越大越小,则称为的一致估计量指指随着样本单位数随着样本单位数 的增大,样本

4、的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致性估计量的评价标准估计量的评价标准AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量 P P( (X X ) )X X第四章第四章 抽样估计抽样估计q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:估计量的评价标准估计量的评价标准第四章第四章 抽样估计抽样估计第三节 参

5、数估计方法一、估计量的评价标准一、估计量的评价标准二、参数估计方法二、参数估计方法第四章第四章 抽样估计抽样估计点估计点估计指指直接以样本指标来估计总直接以样本指标来估计总体指标,也叫体指标,也叫定值估计定值估计简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况第四章第四章 抽样估计抽样估计区间估计区间估计指指根据样本指标和抽样极限误差以一根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限围;其中,被推

6、断的总体指标的下限与上限所包括的区间称为与上限所包括的区间称为置信区间置信区间,估计的可靠程度也称为估计的可靠程度也称为置信度。置信度。(这里只讨论常用的大样本的情况)(这里只讨论常用的大样本的情况)第四章第四章 抽样估计抽样估计区间估计原理区间估计原理0.6827落在落在范围内的概率范围内的概率为为68.27%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线第四章第四章 抽样估计抽样估计区间估计原理区间估计原理0.9545落在落在范围内的概率范围内的概率为为95.45%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线第四章第四章 抽样估计抽样估计区间估计原理区间估计原

7、理 0.9973落在落在范围内的概率范围内的概率为为99.73%样本抽样分布曲线样本抽样分布曲线样本抽样分布曲线样本抽样分布曲线总体分布曲线总体分布曲线总体分布曲线总体分布曲线第四章第四章 抽样估计抽样估计区间估计原理区间估计原理根据中心极限定理,大样本下,样本统计量根据中心极限定理,大样本下,样本统计量(均值、成数)服从正态分布,数学期望(均值、成数)服从正态分布,数学期望是总体均值是总体均值 或总体成数或总体成数 ,只是方差不,只是方差不同;同;重复抽样方差重复抽样方差非重复抽样方差非重复抽样方差68.27%95.45%99.73%区间估计原理区间估计原理区间估计原理区间估计原理标准正态转

8、换标准正态转换区间估计原理区间估计原理标准正态转换标准正态转换区间估计原理区间估计原理置信水平置信水平区间估计原理区间估计原理标准正态转换标准正态转换第四章第四章 抽样估计抽样估计区间估计原理区间估计原理标准正态转换标准正态转换理论确定理论确定样本计算样本计算理论确定理论确定计算或者样计算或者样本替代本替代总体参数总体参数区间估计原理区间估计原理理论确定理论确定样本计算样本计算理论确定理论确定计算或者样计算或者样本替代本替代总体参数总体参数标准误是根据抽样信息计算出来。标准误是根据抽样信息计算出来。当给出极限误差,我们可以确定临界值,进而确当给出极限误差,我们可以确定临界值,进而确定置信水平;

9、或者给出置信水平,可以计算极定置信水平;或者给出置信水平,可以计算极限误差。调剂二者矛盾的办法是减少标准误。限误差。调剂二者矛盾的办法是减少标准误。区间估计原理区间估计原理理论确定理论确定样本计算样本计算理论确定理论确定计算或者样计算或者样本替代本替代总体参数总体参数在置信水平在置信水平1-下,总体指标(均值、成数)下,总体指标(均值、成数)的点估计为的点估计为 ,区间估计为,区间估计为 。步骤步骤 计算样本平均数计算样本平均数 ; 搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本方差算样本方差 ,即,即总体平均数的区间估计总体平均数的区间估计步步骤骤 计算抽样标准误:计算抽样

10、标准误:重复抽样时:重复抽样时: 不重复抽样时:不重复抽样时:总体平均数的区间估计总体平均数的区间估计步步骤骤 计算抽样极限误差:计算抽样极限误差: 确定总体平均数的置信区间:确定总体平均数的置信区间:总体平均数的区间估计总体平均数的区间估计【例例】某企业生产某种产品的工人某企业生产某种产品的工人有有10001000人,某日采用不重复抽样从人,某日采用不重复抽样从中随机抽取中随机抽取100100人调查他们的当日人调查他们的当日产量,要求在产量,要求在9595的概率保证程度的概率保证程度下,下,估计该厂全部工人的日平均产估计该厂全部工人的日平均产量和日总产量量和日总产量。总体平均数的区间估计总体

11、平均数的区间估计按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计100126004144100100名工人的日产量分组资料名工人的日产量分组资料解:解:用样本方差代用样本方差代替总体方差替总体方差则则该企业工人人均产量该企业工人人均产量 及日总产及日总产量量 的置信区间为:的置信区间为

12、:即该企业工人人均产量在即该企业工人人均产量在124.80124.80至至127.20127.20件之间,其日总产量在件之间,其日总产量在124797124797至至127303127303件件之间,估计的可靠程度为之间,估计的可靠程度为9595。()()203. 11261000203. 11261000203. 1126203. 1126+-+-XNX第四章第四章 抽样估计抽样估计【例例】某调查表明,员工每周工作某调查表明,员工每周工作时间时间5252小时,随机抽取小时,随机抽取650650名员工,名员工,样本标准差为样本标准差为8.28.2小时,员工平均小时,员工平均每周工作时间的每周工

13、作时间的95%95%的置信区间?的置信区间?总体平均数的区间估计总体平均数的区间估计第四章第四章 抽样估计抽样估计【例例】随机抽取随机抽取650650名员工,大样名员工,大样本,根据中心极限定理,样本均值本,根据中心极限定理,样本均值服从正态分布。服从正态分布。总体平均数的区间估计总体平均数的区间估计指标指标数值数值s s8.28.2x x均值均值5252n n65065095%95%置信置信1.961.96抽样标准误抽样标准误0.32 0.32 下限下限51.37 51.37 上限上限52.63 52.63 不重复抽样时:不重复抽样时:不重复抽样时:不重复抽样时:步步骤骤 计算样本成数计算样

14、本成数 ; 搜集总体方差的经验数据搜集总体方差的经验数据 ; 计算抽样平均误差:计算抽样平均误差:重复抽样条重复抽样条件下件下不重复抽不重复抽样条件下样条件下总体成数的区间估计总体成数的区间估计步步骤骤 计算抽样极限误差:计算抽样极限误差: 确定总体成数的置信区间:确定总体成数的置信区间:总体成数的区间估计总体成数的区间估计【例例】若前例中工人日产量在若前例中工人日产量在118118件以上者为完成生产定额任务,要件以上者为完成生产定额任务,要求在求在9595的概率保证程度下,估计的概率保证程度下,估计该厂全部工人中完成定额的工人比该厂全部工人中完成定额的工人比重及完成定额的工人总数。重及完成定

15、额的工人总数。总体成数的区间估计总体成数的区间估计按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)110114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100100名工人的日产量分组资料名工人的日产量分组资料完成定额完成定额的人数的人数解:解:, 9 . 010090,96. 1,10,90,100,1000101=nnpZnnnN则己知则则该企业全部工人中完成定额的工人比该企业全部工人中完成定额的工人比重重 及完成定额的工人总数及完成

16、定额的工人总数 的置信的置信区间为:区间为:即该企业工人中完成定额的工人比重在即该企业工人中完成定额的工人比重在84.39%84.39%至至95.61%95.61%之间,完成定额的工人之间,完成定额的工人总数在总数在844844至至957957人之间,估计的可靠程人之间,估计的可靠程度为度为9595。第四章第四章 抽样估计抽样估计【例例】某调查获得某调查获得400400人的一个样人的一个样本,发现本,发现26%26%的上网者为女性,女的上网者为女性,女性上网比例的性上网比例的95%95%的置信区间?的置信区间?总体成数的区间估计总体成数的区间估计【分析分析】随机抽取随机抽取400400人,大样

17、本,人,大样本,根据中心极限定理,样本成数服从根据中心极限定理,样本成数服从正态分布。正态分布。第四章第四章 抽样估计抽样估计总体成数的区间估计总体成数的区间估计指标指标数值数值p p0.260.26n n40040095%95%置信置信1.961.96样本方差样本方差0.19 0.19 抽样标准误抽样标准误0.02 0.02 下限下限0.217 0.217 上限上限0.303 0.303 第四章第四章 抽样估计抽样估计总体平均数、成数的区间估计总体平均数、成数的区间估计6、结论、结论1、计算样本估计量的值及样本方差、计算样本估计量的值及样本方差2、抽样分布定理的适用性、抽样分布定理的适用性3

18、、if ok,计算抽样标准误,计算抽样标准误4、根据置信水平,计算抽样极限误差、根据置信水平,计算抽样极限误差5、计算总体参数的区间估计、计算总体参数的区间估计已知总体方差已知总体方差未知总体方差未知总体方差重重/不重如果不不重如果不知道总体单知道总体单位总数位总数正态分布正态分布t分布分布第四章第四章 抽样估计抽样估计第四章 抽样估计第一节 抽样分布抽样分布第二节 抽样误差抽样误差第三节 参数估计方法参数估计方法第四节 样本容量的确定样本容量的确定第四章第四章 抽样估计抽样估计四、样本容量的确定四、样本容量的确定 确定样本容量的意义确定样本容量的意义 推断总体平均数所需的样本容量推断总体平均

19、数所需的样本容量 推断总体成数所需的样本容量推断总体成数所需的样本容量 必要样本容量的影响因素必要样本容量的影响因素样本容量样本容量调查误差调查误差调查费用调查费用小样本容量小样本容量节省费用但节省费用但调查误差大调查误差大大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大找出在规定误差找出在规定误差范围内的最小样范围内的最小样本容量本容量确定样本容量的意义确定样本容量的意义找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量第四章第四章 抽样估计抽样估计确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量 重复抽样条件下:重复抽样条件下:第四章第

20、四章 抽样估计抽样估计确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。 或或 S S通常未知。一般通常未知。一般按以下方法确定其估计按以下方法确定其估计值:值:过去的经验数据过去的经验数据;样本的样本的s s。计算结果通常向上进位计算结果通常向上进位第四章第四章 抽样估计抽样估计 不重复抽样条件下:不重复抽样条件下:不管重复不重复抽样,是不能影响极限不管重复不重复抽样,是不能影响极限误差和误差和Z值的,或者说是不能影响抽样标值的,或者说是不能

21、影响抽样标准误。准误。确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量【例例】某食品厂要检验本月生产的某食品厂要检验本月生产的1000010000袋某产品的重量,根据上月袋某产品的重量,根据上月资料,这种产品每袋重量的标准差资料,这种产品每袋重量的标准差为为2525克。要求在克。要求在95.4595.45的概率保的概率保证程度下,平均每袋重量的误差范证程度下,平均每袋重量的误差范围不超过围不超过5 5克,应抽查多少袋产品克,应抽查多少袋产品?解:解:用前期样本方差用前期样本方差替代替代确确定定方方法法推断总体成数所需的样本容量推断总体成数所需的样本容量 重复抽样条件下:

22、重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下通常未知。一般按以下方法确定其估计值:方法确定其估计值:过过去的经验数据去的经验数据;试验调试验调查样本的查样本的 ;取方差取方差的最大值的最大值0.250.25。如果不知道如果不知道P,如何?,如何? 不重复抽样条件下:不重复抽样条件下:确确定定方方法法推断总体成数所需的样本容量推断总体成数所需的样本容量【例例】某某企业对一批总数为企业对一批总数为5000件的产件的产品进行质量检查,过去几次同类调查所品进行质量检查,过去

23、几次同类调查所得的产品合格率为得的产品合格率为93、95、96,为了使合格率的允许误差不超过为了使合格率的允许误差不超过3,在在99.73的概率保证程度下,应抽查多的概率保证程度下,应抽查多少件产品?少件产品?【分析分析】因为共有三个过去的合格率的因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即P=93。解:解:【例例例例】总体单位总数很大的情况下,在总体单位总数很大的情况下,在总体单位总数很大的情况下,在总体单位总数很大的情况下,在0.050.05的显著的显著的显著的显著性水平下,以性水平下,以性水平下,以性水平下

24、,以0.030.03的极限误差构造总体比例的置信的极限误差构造总体比例的置信的极限误差构造总体比例的置信的极限误差构造总体比例的置信区间,至少应该抽取多少样本?区间,至少应该抽取多少样本?区间,至少应该抽取多少样本?区间,至少应该抽取多少样本?【例例例例】某奶茶企业宣称一年卖出某奶茶企业宣称一年卖出某奶茶企业宣称一年卖出某奶茶企业宣称一年卖出1010亿杯,主要客户亿杯,主要客户亿杯,主要客户亿杯,主要客户群体是群体是群体是群体是15-3015-30岁女性,岁女性,岁女性,岁女性,1010年人口普查数据递推到年人口普查数据递推到年人口普查数据递推到年人口普查数据递推到1414年这部分人数是年这部

25、分人数是年这部分人数是年这部分人数是1.661.66亿。亿。亿。亿。经过市场调查发现购买周期的数列如下,假如是每经过市场调查发现购买周期的数列如下,假如是每经过市场调查发现购买周期的数列如下,假如是每经过市场调查发现购买周期的数列如下,假如是每次购买次购买次购买次购买1 1杯。我们需杯。我们需杯。我们需杯。我们需要抽取多少的样本要抽取多少的样本要抽取多少的样本要抽取多少的样本? ?在在在在0.950.95的置信的置信的置信的置信水平下,极限误差水平下,极限误差水平下,极限误差水平下,极限误差控制在控制在控制在控制在5%5%。购买周期购买周期人数人数f f1-31-333334-74-72222

26、8-158-15222216-3016-301515更久更久3737必要样本容量的影响因素必要样本容量的影响因素q总体方差的大小;总体方差的大小;q允许误差范围的大小;允许误差范围的大小;q概率保证程度;概率保证程度;q抽样方法;抽样方法;q抽样的组织方式。抽样的组织方式。重复抽样条件下:重复抽样条件下:不重复抽样条件下:不重复抽样条件下:第四章第四章 抽样估计抽样估计课堂练习课堂练习某乡共有外出务工人员4000人。按不重复抽样方法随机抽取其中200人进行调查, 得知他们的人均年收入为5800元, 标准差为850元. 试以95的把握程度估计该乡全体外出务工人员的年收入总额的区间。某校在新学期的

27、第一周对全校学生进行了一次抽样调查。随机抽取了64人,发现他们中只有16人每晚用于学习的时间超过1小时。试以99的概率保证度下,全校5000名学生中第一周内每晚学习时间超过1小时的学生所占比例及总人数有多少?第四章第四章 抽样估计抽样估计课堂练习课堂练习假设总体为5000个单位,被研究标志的方差不小于400,抽样允许误差不超过3,当概率保证程度为95%(t=1.96)时,问:1) 采用重复抽样,需要抽多少单位?2) 若要求抽样允许误差减少50%,又需抽多少单位?Results are based on a random sample of 1,063 adults, one can say with 95% confidence that the maximum margin of sampling error is 4 percentage points.第四章第四章 抽样估计抽样估计homeworkP118四、计算题345

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号