教育与心理统计第七章参数估计

上传人:n**** 文档编号:50845433 上传时间:2018-08-11 格式:PPT 页数:30 大小:204KB
返回 下载 相关 举报
教育与心理统计第七章参数估计_第1页
第1页 / 共30页
教育与心理统计第七章参数估计_第2页
第2页 / 共30页
教育与心理统计第七章参数估计_第3页
第3页 / 共30页
教育与心理统计第七章参数估计_第4页
第4页 / 共30页
教育与心理统计第七章参数估计_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《教育与心理统计第七章参数估计》由会员分享,可在线阅读,更多相关《教育与心理统计第七章参数估计(30页珍藏版)》请在金锄头文库上搜索。

1、n导入n1、中心极限定理 概率论中有关论证随机变量 之和的极限分布为正态分布的定理称为中心极 限定理.这组定理是数理统计学和误差分析的 理论基础,指出了大量随机变量近似服从正态 分布的条件。n林德伯格列维定理 林德伯格列维( Lindburg-Levy)定理,即独立同分布随机变 量序列的中心极限定理。它表明,独立同分布 、且数学期望和方差有限的随机变量序列的标 准化和以标准正态分布为极限。n棣莫佛拉普拉斯定理 棣莫佛拉普拉斯( de Movire - Laplace)定理,即服从二项分 布的随机变量序列的中心极限定理。它指出, 参数为n, p的二项分布以np为均值、np(1-p) 为方差的正态

2、分布为极限。n定理的解释:若被研究的随机变量可以表示为大量独立随机变 量之和,且每个随机变量对总和只起微小的作用,则 可以认为此随机变量服从正态分布. 例如,进行某种观 测时,不可避免地有许多客观的和人为的的随机因素影 响着我们的观测结果.这些因素中的每一个都可能使观 测的结果产生很小的误差,然而由于所有这些误差共同 影响着观测结果,于是我们得到的是一个“总的误差”. 所以,实际观测得到的误差可以看作是一个随机变量, 它是很多数值微小的独立随机变量的总和,按林德伯格 列维定理,这个随机变量应该服从正态分布.n2 已知某研究者想知道中国大学生智商的平均 分是多少,怎么办?n当在研究中从样本获得一

3、组数据后,如何通过 这组信息,对总体特征进行估计,也就是如何 从局部结果推论总体的情况,称为总体参数估 计。总体参数估计问题可分为点估计与区间估 计。对参数模型下的估计,称为参数估计;对 非参数模型下的估计,称为非参数估计。第一节 点估计、区间估计与标准误n参数估计分为点估计和区间估计 一、点估计的定义n点估计(point estimation)是用样本统计 量来估计总体参数,因为样本统计量为数 轴上某一点值,估计的结果也以一个点的 数值表示,所以称为点估计。二、良好估计量的标准对于一个未知参数,人们可以构造多个 估计量去估计它。另外,用样本统计量作 为总体参数的估计值,总是有一定的偏差 ,因

4、此就产生了一个评价估计量好坏的问 题。一个好的估计量应具备如下一些特征 。1、无偏性n 用统计量估计总体参数一定会有误差,不 可能恰恰相同。因此,好的估计量应该是一 个无偏估计量(unbiased estimate),即 用多个样本的统计量作为总体参数的估计值 ,其偏差的平均数为0。n 用样本平均数作为总体的估计值,就具 有无偏性。样本方差就不是总体方差的一个 无偏估计值。 总体方差的无偏估计量是 , 用 表示。2、有效性n当总体参数的无偏估计不止一个统计量时。 无偏估计变异小者有效性高,变异大者有效 性低。例如作为 的估计值Mo、Md、 等 都是无偏估计,但是只有 的变异最小,即 方差最小,

5、故平均数这一统计量作为总体参 数的估计值是最有效的。3、一致性n当样本容量无限增大时,估计值应能够越来 越接近它所估计的总体参数,估计值越来越 精确,逐渐趋近于真值。即当N时X , 。4、充分性指一个容量为n的样本统计量,是否充分地反 应了全部n个数据所反映总体的信息。所以点估计以随机变量中的某一个值来作估 计,很显然会产生一定的误差。若误差较小 ,这个点估计值还是一个好的估计值,若误 差较大,这个点估计便失去了意义,而区间 估计在一定意义上弥补了点估计的不足之处 。三、区间估计与标准误 (一)区间估计的定义n区间估计(interval estimation)就是根据 估计量以一定可靠程度推断

6、总体参数所在 的区间范围。它是用数轴上的一段距离表 示未知参数可能落入的范围,它虽不具体 指出总体参数等于什么,但能指出未知总 体参数落入某一区间的概率有多大。n相对优点:给出一个估计的范围,使总 体参数包含在这个范围之内。给出估计 精度并说明估计结果的有把握的程度。(二)置信区间与显著性水平n 置信区间,也称置信间距(confidence interval, CI),是指在某一置信度时,总体参数所在的区域 距离或区域长度。置信区间的上下二端点值称为置 信界限(confidence limits),显著性水平( significance level)是指估计总体参数落在某一区 间时,可能犯错误

7、的概率,用符号表示。1为 置信度或置信水平(confidence level)。n0.95置信区间0.05显著性水平的置信区间。n0.99置信区间0.01显著性水平的置信区间。n心理学中通常使用0.05,0.01,0.001显著性水平(三)区间估计的原理与标准误n区间估计是根据样本分布理论,用样本分布的 标准误(SE)计算区间长度,解释总体参数 落入某置信区间可能的概率。n区间估计的原理是样本分布理论。在计算区间 估计值,解释估计的正确率时,依据的是该样 本统计量的分布规律及样本分布的标准误( SE)。第二节 总体平均数的估计n一.估计总体平均数的步骤 1.根据实得样本的数据,计算样本的平均数

8、与标准 差; 2.计算标准误;n有两种情况:n(1)当总体方差已知时,n(2)当总体方差未知时,用样本的无偏估计量 如果计算的是样本的有偏估计 3.确定置信水平或显著性水平; 4.根据样本平均数的抽样分布,确定查何种统计表 ; 5.计算置信区间; 6.解释总体平均数的置信区间。n二.总体方差已知时,对总体平均数的估计n1.当总体分布为正态时,不论样本n的大小, 其标准误都是 ,这时样本的方差 在计算 中没有用处。依据上面所讲的步骤,查正态表 ,确定 ,一般情况下显著性水平确定为 0.05或0.01,因此其 为1.96或2.58。n2.当总体为非正态分布时,只有当样本容量 n30以上,才能根据样

9、本分布对总体平均数 进行估计,否则不能进行估计。n例71n例72n 因此遇到有多个样本的情况时,一般取样本 大的均值与标准误对总体进行估计。即在条件 允许的情况下,应用大样本进行观测,对总体 参数进行估计更具优越性。n三.总体方差未知,对总体平均数的估计n样本平均数分布为t分布,查t值表n(1)总体分布为正态,不管n的大小;n(2)总体分布为非正态,n30,才能推论, 但这时可以使用 来代替。n即置信区间 n - .S/ , + .S/ n例73n例74n总结:总体平均数的估计,置信区间的大小受 样本容量和置信度1 的影响。(1)置信 区间的大小在样本容量n一定的情况下,与置 信度1 有关;(

10、2)当置信度1 固定,置 信区间的大小与样本容量n有关,随着样本容 量n的增大,置信区间有减小的趋势。第三节. 标准差与方差的区间估计n一.标准差的区间估计n根据抽样分布的理论,当样本容量n30时, 样本标准差的分布为渐近正态分布。n二.方差的区间估计n根据 分布n自正态分布的总体中,随机抽取容量为n的样 本。其样本方差与总体比值的分布为 分布, 这样可直接查 表确定其比值的0.95与0.99 置信区间。再进一步用以下公式确定总体方差 的0.95与0.99置信区间。n例76n例77n三.两总体方差之比的区间估计n如果两总体方差 ,其样本方差之比 多数应在1上下摆动。F分布是一族分布,附录 4表

11、中的概率是指某一F 值以上,F分布右侧一 尾端部分的概率(称单侧概率)。如果需要 的值,即F双侧概率的值可查附表3(双侧概率 )。根据F分布,可估计二总体方差之比的置 信区间。nWARNING:根据样本方差估计两总体方差之 比在1上下一定区间内,可推论两总体方差相 等。n例78n【考研与考试真题】n1、当总体参数不清楚时,常用一个样本统计 量估计相应的总体参数,这类问题称为 _,总体平均数的无偏估计量应为 _,而总体方差的无偏估计量应为 _。n2、为调查市民对一项市政府计划方案的支持 率,随机抽取了120名市民进行调查,结果发 现其中86人对该方案持赞成态度,现希望以 99%的置信概率来估计全体市民的支持率,且 估计误差不能大于正负5%。试问:至少应调 查多少人?n3、用样本统计量估计总体参数时,一般总存 在一定的偏差,一个好的估计量必须具备某些 特性,这包括_、一致性、_ 和充分性。n4、大医院每天约有个婴儿出生,小医院 每天约有个婴儿出生,在一年内生男孩的 比例超过的天数n、大小医院一样多 n、大小医院无规律n、大医院多 n、小医院多

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 电子/通信 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号