Session11样本和样本分布

上传人:飞*** 文档编号:57124754 上传时间:2018-10-19 格式:PPT 页数:32 大小:567KB
返回 下载 相关 举报
Session11样本和样本分布_第1页
第1页 / 共32页
Session11样本和样本分布_第2页
第2页 / 共32页
Session11样本和样本分布_第3页
第3页 / 共32页
Session11样本和样本分布_第4页
第4页 / 共32页
Session11样本和样本分布_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《Session11样本和样本分布》由会员分享,可在线阅读,更多相关《Session11样本和样本分布(32页珍藏版)》请在金锄头文库上搜索。

1、Data, Model and Decisions 数据、模型与决策,Session 11 Sampling and Sampling Distribution 样本与样本分布,The Sampling Problem of EAI. 电子联合公司的抽样问题,实际应用,电子联合公司的人力资源部要拟定一份公司2500名经理的简介,需要介绍经理们的平均年薪和已完成公司培训计划的经理的比例,我们所关心的问题是如何从经理 样本中而不是从所有2500名经理 总体中得到我们所需要的信息,Statistical Inference 统计推断,统计推断的目的是要从样本所包含的信息推断出总体的信息 总体(pop

2、ulation)是研究中所有感兴趣个体的集合 样本(sample)是总体的一个子集 样本结果只是提供了总体特征价值的一个估计 参数(parameter)是总体的一个数量特征 应用合理的抽样方法样本结果能够提供总体特征的一个很好的估计,Simple Random Sampling 简单随机抽样,有限总体(Finite Population) 从容量为N的有限总体总进行抽样,如果容量为n的每个可能样本被抽到的可能性相等,称容量为n的样本为简单随机样本. 在抽下一个元素前将抽到的元素放回去,这种形式的抽样称为放回抽样(Sampling with Replacement). 在抽下一个元素前将抽到的元

3、素不放回去抽样称为不放回抽样. 计算机产生的随机数是常用的自动取样过程,无限总体(Infinite Population) 无限总体的简单随机抽样满足条件: 每个个体都来自同一个总体. 每个个体的抽取相互独立. 如果所研究的总体是一正在进行的过程,统计总体的每个个体不可能,则通常认为总体是无限的. 对于无限总体不能进行标号,抽样过程不能用随机数.,Simple Random Sampling 简单随机抽样,Point Estimation 点估计,为了估计总体的某个参数值,计算对应样本的特征来进行估计 我们用 来点估计总体均值 . s 来点估计总体标准差 .来点估计总体比例 p.,Exampl

4、e: Harvard University 哈佛大学,哈佛大学每年收到7,000个优秀学生的入学申请,申请表中包含了大量申请人的信息。包括个人学术能力测试(SAT)成绩和是否是本州居民。 入学主管需要知道下面一些信息: 平均SAT成绩 本州居民比例,实际举例,Alternative #1: 对7000个样本的总体调查 SAT 成绩 总体均值总体标准差本州申请人 总体比例,Example: Harvard University 哈佛大学,实际举例,Alternative #2: 选取50个样本进行统计(随机数)4-Digit ApplicantRandom Number Included in

5、Sample1744 No. 17445436 No. 54363865 No. 38654790 No. 47904835 No. 48359902 Number exceeds 7,0008190 Number exceeds 7,0006836 No. 6836etc. etc.,Example: Harvard University 哈佛大学,实际举例,简单随机抽样的数据No. Applicant SAT Score In-State1 Bonnie Reight 1025 Yes2 Willie Neilson 950 Yes3 Fannie Lennox 1090 No4 Dere

6、k Clapton 1120 Yes5 Winona Driver 1015 Yes. . . . . . .50 Kevin Costmore 965 NoTotal 49,850 34 Yes,Example: Harvard University 哈佛大学,实际举例,点估计: 的点估计 的点估计P 的点估计,Example: Harvard University 哈佛大学,实际举例,Sampling Distribution of 的抽样分布,的抽样分布是样本均值所有可能取值的概率分布,E (x ) = 这里 = 总体均值,总体均值=?,总体中抽取样本,计算样本均值,用样本均值推断 总体

7、均值,的标准差有限总体 无限总体 如果n/N .05 ,有限样本可看做无限总体.是有限总体矫正因子.是指均值标准差,Sampling Distribution of 的抽样分布,Central Limit Theorem中心极限定理,当样本容量很大时,样本均值的抽样分布可以近似看成正态分布,SAT成绩的抽样分布,Example: Harvard University 哈佛大学,实际举例,Sampling Distribution of 的抽样分布,的抽样分布是样本比例所有可能取值的概率分布,这里 p = 总体均值,总体比例P=?,总体中抽取样本,计算样本比例,用样本比例推断 总体比例,比例的标

8、准差有限样本 无限样本,Sampling Distribution of 的抽样分布,本州申请人比例 的样本分布,Example: Harvard University 哈佛大学,实际举例,Properties of Point Estimators 点估计的特征,无偏性(Unbiasedness)如果样本统计值等于总体参数值 有限性(Efficiency)点估计有最小的标准差 一致性(Consistency)当样本增加时,点估计越来越接近总体参数,Unbiasedness 无偏性,P(X),Efficiency有效性,Consistency一致性,Other Sampling Methods

9、 其他抽样方法,Stratified Random Sampling 分层随机抽样 Cluster Sampling 整群抽样 Systematic Sampling 系统抽样 Convenience Sampling 方便抽样 Judgment Sampling 判断抽样,Stratified Random Sampling 分层随机抽样,Cluster Sampling 整群抽样,Systematic Sampling系统抽样,在总体容量较大的情况下,抽取简单随机样本很费时间,因为首先要寻找随机数,代替简单随机抽样的一种方法就是系统抽样 从5000个元素的总体中抽取50个元素作为一个样本,

10、可在总体的每100个元素中抽取一个元素 其他的样本元素确定:从第1个被抽取的元素开始,在总体目录上每隔100个元素抽取一个作为样本元素 由于抽取第1个元素是随机的,所以我们一般假定系统抽样也具有简单随机抽样的特征,Convenience Sampling 方便抽样,便抽样是一种非概率抽样技术 优点是样本的抽取和数据收集相对较容易,方便抽样的效果可能很好,也可能不好。 有时候,研究人员设计出一些适应于方便抽样的统计方法,他们认为可以将方便样本看成随机样本。 在用从方便样本中所得到的结果对总体进行推断时要格外小心,Judgment Sampling 判断抽样,另一种非概率抽样技术 先由对所研究题目

11、较有权威的人员从总体中抽取他或她感到最能代表总体的个体或元素进入样本 例如,某记者可以抽取他认为能够代表所有参议员观点的两名或三名参议员进行调查 样本结果的质量却要依赖于拍取样本人员的判断 在用判断样本所得出的结论对总体进行推断时仍然要小心谨慎。,Session Summary 本讲小结,小结,介绍了简单随机抽样和抽样分布的概念,说明了如何抽取一个简单随机样本,如何根据样本中所收集到的数据建立总体参数的点估计和 估计量都是随机变量,这些随机变量的概率分布称为抽样分布 还描述了样本均值和样本比例的抽样分布 简单介绍了中心极限定理 最后介绍了其他一些抽样方法,Case Study 案例研究,案例,案例10:城市中心医院(A) 作业: Text2第7章奇数习题 道格拉斯公司(See the Course Package) 下一讲:置信区间估计 阅读:Text2,Chapter8和课件及课程网页相关内容,The End of Session 11,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号