应用抽样技术课件PPT第三章

上传人:y****8 文档编号:139805496 上传时间:2020-07-24 格式:PPT 页数:66 大小:1.44MB
返回 下载 相关 举报
应用抽样技术课件PPT第三章_第1页
第1页 / 共66页
应用抽样技术课件PPT第三章_第2页
第2页 / 共66页
应用抽样技术课件PPT第三章_第3页
第3页 / 共66页
应用抽样技术课件PPT第三章_第4页
第4页 / 共66页
应用抽样技术课件PPT第三章_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《应用抽样技术课件PPT第三章》由会员分享,可在线阅读,更多相关《应用抽样技术课件PPT第三章(66页珍藏版)》请在金锄头文库上搜索。

1、第三章 简单随机抽样,2,本章要点,简单随机抽样是抽样中最基本、最成熟、也 是最简单的抽样设计方式,是所有概率抽样方法 发展、比较的基础。 要求熟练掌握简单随机抽样的抽样方式和样本抽选方法; 熟知总体均值、总体总值和总体比例的简 单估计; 掌握样本量的确定。,3,从三皇五帝时的黄帝算起,直到1911年清王朝灭亡,中国经历了数千年的漫长历史时期,在这漫长的历史长河之中,先后经历了83个王朝,出现了559位帝王。在封建皇朝,臣下叩见皇帝时,先要三呼万岁,这万岁二字,等于是皇帝的尊称,其实真是莫大的讽刺。有史以来,皇帝总是要比普通人短命得多,而且大都是开国的皇帝比较长寿,越到后来,就越是短命。 研究

2、目的:为了估计我国历史上的这559位 帝王的平均寿命,拟采用简单随机抽样方式 从历代帝王中抽选三十位作为样本。 问题1:如何实现简单随机抽样? 问题2:如何做出具有一定可靠程度的区间估计?,帝王寿命的抽样估计,4,第一节 抽样方式,5,简单随机抽样也称纯随机抽样。 (Simple Random Sampling) 对于容量为N的总体,抽取样本量为n的样本,若全部可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样。,一、什么是简单随机抽样,例:从全班100名学生中选出10人作为代表参加座谈会, 将每个学生的姓名写在同样质地、同样大小的纸条上,投入一个纸箱中充分混合均匀。然后从纸箱中一张接

3、一张共抽出10张纸条。这10张纸条和其他任何10张纸条,被抽中的机会都一样。,6,根据抽样单位是否放回可分为 放回简单随机抽样(重复抽样) 不放回简单随机抽样(不重复抽样),7,(一)放回简单随机抽样(重复抽样),重复抽样一般是考虑样本单位的顺序的, 可能的样本为 个,每个样本被抽中的概率 为,随机抽取 样本单位,调查 观测,放回 总体,继续随 机抽取,特点:每次抽取都是从N个总体单位中抽取, 同一个单位有可能在同一个样本中重复出现,8,例:用重复抽样方法(考虑顺序) 从5个人(年龄为34,38,42,46,50岁)中随机抽取2人构成样本, 样本个数为 个,如下: (34,34) (34,38

4、) (34,42) (34,46) (34,50) (38,34) (38,38) (38,42) (38,46) (38,50) (42,34) (42,38) (42,42) (42,46) (42,50) (46,34) (46,38) (46,42) (46,46) (46,50) (50,34) (50,38) (50,42) (50,46) (50,50) 每个样本被抽中的概率都是1/25,52=25,9,(二)不放回简单随机抽样(不重复抽样),不重复抽样一般是不考虑样本单位顺序的。 样本个数: 每个样本被抽中的概率为 。,随机抽取 样本单位,调查 观测,继续抽 取下一个,特点:即

5、同一个单位不能在样本中重复出现。,10,例:用不重复抽样方法(不考虑顺序) 从5个人(年龄为34,38,42,46,50岁)中随机抽取2人构成样本共 个样本。所有可能样本为:,每个样本被抽中的概率都是1/10,(34,38) (34,42) (34,46) (34,50) (38,42) (38,46) (38,50) (42,46) (42,50) (46,50),11,实践中一般多采用不放回简单随机抽样(不考虑顺序),以下讨论如无特别说明,都指这一类简单随机抽样。,由于在重复抽样中一个单位有可能在一套样本中重复多次出现,造成信息的重复,因此, 在样本量一定的条件下,不放回抽样提供的信息量大

6、于放回抽样,其抽样效率更高。,12,二、简单随机样本的抽选方法,首先要将总体 N 个单位从1到 N 编号,每个单位对应一个号; 然后从所编的号中随机抽号,如果抽到某个号,则对应的那个单位入样,直到抽够 n 个单位为止。 具体方法: (一)抽签法 (二)随机数法,13,(一)抽签法,当总体不大时采用。用同质均匀的材料制作N个签,并充分混合。,按这两种方法抽到的n个单位的样本是等价的, 每个样本被抽到的概率都等于,全样本抽选法,逐个抽选法,一次抽取一个签但不放回,接着抽下一个签,直到抽够n个签为止,签上号码所对应的单位入样,从N个签中一次抽取n个,这n个签上的号码即为入样的单位号码,方法,14,随

7、机数法,利用随机数表进行抽选,利用随机数骰子进行抽选,利用摇奖机进行抽选,利用计算机产生的伪随机数进行抽选,(二)随机数法,当总体较大时采用。,15,1、利用随机数表进行抽选。 随机数表是一张由0,1,2,9这十个数字组成的表,一般常用的是五位数的随机数字表。 10个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。 抽选时,可根据总体容量N的位数决定在表中随机抽取相邻的几列数字。,随机数表,若N=99,n=10,哪些单位入样?,若N=830,n=8,哪些单位入样?,若N=327,n=8,哪些单位入样?,17,N m 1N10 1 11N100 2 101N1000 3,随机数骰子是

8、均匀材料制成的正20面体,09共10个数字随机出现在20个面上,每个数字出现2次。根据需要选取一定骰子数m,规定每种颜色的骰子所代表的位数。 例如,选用红、黄、蓝3种颜色的骰子,规定红色骰子出现的数字表示百位数,黄色骰子出现的数字表示十位数,蓝色骰子出现的数字表示个位数。所有m个骰子的数字均为0时,表示10m。,2、利用随机数骰子抽选,18,3、利用摇奖机进行抽选,各类彩票的抽奖活动通常是利用摇奖机来完成的,我们也可以借助这一方法完成简单随机样本的抽取,19,4、利用计算机产生的伪随机数进行抽选,大多数统计软件都有现成的产生随机数的程序,利用计算机产生的随机数具有快捷、方便的特点。 但是利用计

9、算机产生的随机数是伪随机数,并不能 保证其随机性,通常产生的伪随机数有循环周期。,一般不建 议使用此种方法!,20,第二节 总体均值与总体总值 的简单估计,21,春秋晋文公29岁、战国秦孝公56岁、秦朝秦始皇49岁、新朝王莽68岁、东汉光武帝刘秀63岁、东汉顺帝刘保30岁、西汉哀帝刘欣25岁、魏文帝曹丕39岁、昭烈帝刘备61岁、吴大帝孙权71岁、西晋武帝司马炎55岁、东晋成帝司马衍22岁、南朝顺帝李淮12岁、金章宗完颜达葛40岁、元世祖忽必烈79岁、北朝孝庄帝元子攸24岁、隋炀帝杨广49岁、唐太宗李世民51岁、唐武宗李炎32岁、南唐后主李煜42岁、北宋赵匡胤49岁、北宋英宗赵曙35岁、南宋宁宗

10、赵扩57岁、辽太祖耶律阿保机55岁、元太祖铁木真65岁、元文宗图帖木尔28岁、明太祖朱元璋70岁、明熹宗朱由校23岁、清圣祖玄烨68岁、清光绪帝载恬37岁。 如何根据以上数据,以95%的概率保证程度,对我国559位帝王的平均寿命作出估计?,从我国历史上的559位帝王中用随机数表选取了以下三十位,他们的寿命如下:,帝王寿命的抽样估计,22,有关指标与符号,23,一、总体均值的简单估计,(一)简单估计量的定义,总体均值 的简单估计量为样本均值:,24,(二)简单估计量 的期望与方差,对于简单随机抽样(不放回), 是 的无偏估计,即有,f= n/N 为抽样比;1-f 为有限总体校正系数。,的方差 :

11、,由于每个单位的入样概率都是n/N,不放回简单随机抽样是等概率抽样。,25,是 的无偏估计 。,样本方差 是总体方差S2的无偏估计量,所以,由于总体方差S2未知,需用样本方差 估计它。,26,(三)放回简单随机抽样的简单估计,对于放回简单随机抽样(考虑顺序), 是 的无 偏估计,由于每次抽取时总体中任一单位都有1/N的概率被抽中,考虑样本单位顺序的放回简单随机抽样也是等概率抽样。,由于N往往很大,N-1N,所以,27,由于样本方差,是总体方差 的无偏估计量,所以,可得到 的无偏估计量,28,这说明除非 n=1,否则在相同的样本量下,放回简单随机抽样的方差总是大于不放回的方差,即它的抽样效率一般

12、比不放回简单随机抽样的低。,根据抽样设计效应定义:,放回简单随机抽样的 为:,29,【例3.1】在某区10000户家庭中,按简单随机抽样抽取400户,调查每个月的人均伙食费(单位:元)。经计算: 若对该地区平均每人每月的伙食费做估计,则抽样标准误是多少?,30,1、计算估计量 和样本方差 2、计算抽样标准误 3、计算置信区间 (1)根据给定的 1- ,找到相应的 t 值 (2)计算抽样极限误差 (3)确定总体均值的估计区间,估计总体均值的步骤,【例3.2】为了估计我国历史上的这559位帝王的平均寿命,随机选取了以下三十位,他们的寿命如下:,春秋晋文公29岁、战国秦孝公56岁、秦朝秦始皇49岁、

13、新朝王莽68岁、东汉光武帝刘秀63岁、东汉顺帝刘保30岁、西汉哀帝刘欣25岁、魏文帝曹丕39岁、昭烈帝刘备61岁、吴大帝孙权71岁、西晋武帝司马炎55岁、东晋成帝司马衍22岁、南朝顺帝李淮12岁、金章宗完颜达葛40岁、元世祖忽必烈79岁、北朝孝庄帝元子攸24岁、隋炀帝杨广49岁、唐太宗李世民51岁、唐武宗李炎32岁、南唐后主李煜42岁、北宋赵匡胤49岁、北宋英宗赵曙35岁、南宋宁宗赵扩57岁、辽太祖耶律阿保机55岁、元太祖铁木真65岁、元文宗图帖木尔28岁、明太祖朱元璋70岁、明熹宗朱由校23岁、清圣祖玄烨68岁、清光绪帝载恬37岁。 如何根据以上数据,以95%的概率保证程度,对我国559位帝

14、王的平均寿命作出估计?,32,【例3.3】 从某区400户个体户饮食店中简单随机抽取10进行月营业额调查,样本资料如下:,要求在95的概率保证下,估计全体饮食店月均营业额.,33,总体总值为总体均值的N倍,即,所以,总体总值的简单估计量就是N倍的样本均值,即,二、总体总值的简单估计,34,的无偏估计为,简单估计量的性质,35,【例3.4】 从某区400户个体户饮食店中简单随机抽取10进行月营业额调查,样本资料如下:,要求在95的概率保证下,估计全体饮食店的月营业总额。,36,第三节 总体比例的简单估计,37,设总体中有N个单位,其中符合规定特征的单位数为 ;不符合规定特征的单位数为 。,具有某

15、种特征的单位比例为:,不具有该种特征的单位的比例为:,对总体比例的估计就是对总体均值估计的特例, 对总体中具有规定特征的单位的总个数 的估计是对总体总值估计的一个特例。,一、问题的提法,38,总体方差为:,39,二、总体比例的简单估计量及其性质,设样本容量为 n,其中具有某种特征的有 个 样本比例 (样本均值) 样本比例 p 是总体比例 P 的简单估计量;,总体中具有某种属性的单位数 的简单估计量是,40,估计量的性质:,1、 p是 P的无偏估计。即有:,2、 p 的方差为:,3、 的无偏估计量是 ,即,41,当 都比较大时,可依正态分布给出 及 的 近似置信区间为:,42,【例3.5】某超市

16、新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该超市与附近几个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个200人的样本,调查发现对该超市购物环境表示满意或基本满意的居民有130位。 现要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%下,给出估计的置信区间。,43,【例3.6】Do you believe first-sight love? 要求在95.45的概率保证程度下,估计大学生中相信一见钟情的人所占比重。,44,【例3.7】某高校一学生调研小组对本专业400名学生的手机消费情况进行了抽样调查,简单随机不重复调查了50名学生,所得资料如下:,要求在95.45的概率保证下,估计该专业学生中月消费额在80元以上的学生人数。,45,第四节 样本量的确定

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号