教育与心理统计第七章参数估计

资源描述

《教育与心理统计第七章参数估计》由会员分享，可在线阅读，更多相关《教育与心理统计第七章参数估计（30页珍藏版）》请在金锄头文库上搜索。

1、n导入n1、中心极限定理概率论中有关论证随机变量之和的极限分布为正态分布的定理称为中心极限定理.这组定理是数理统计学和误差分析的理论基础，指出了大量随机变量近似服从正态分布的条件。n林德伯格列维定理林德伯格列维（ Lindburg-Levy）定理，即独立同分布随机变量序列的中心极限定理。它表明，独立同分布、且数学期望和方差有限的随机变量序列的标准化和以标准正态分布为极限。n棣莫佛拉普拉斯定理棣莫佛拉普拉斯（ de Movire - Laplace）定理，即服从二项分布的随机变量序列的中心极限定理。它指出，参数为n, p的二项分布以np为均值、np(1-p) 为方差的正态

2、分布为极限。n定理的解释:若被研究的随机变量可以表示为大量独立随机变量之和，且每个随机变量对总和只起微小的作用，则可以认为此随机变量服从正态分布. 例如,进行某种观测时,不可避免地有许多客观的和人为的的随机因素影响着我们的观测结果.这些因素中的每一个都可能使观测的结果产生很小的误差,然而由于所有这些误差共同影响着观测结果,于是我们得到的是一个“总的误差”. 所以,实际观测得到的误差可以看作是一个随机变量, 它是很多数值微小的独立随机变量的总和,按林德伯格列维定理,这个随机变量应该服从正态分布.n2 已知某研究者想知道中国大学生智商的平均分是多少，怎么办？n当在研究中从样本获得一

3、组数据后，如何通过这组信息，对总体特征进行估计，也就是如何从局部结果推论总体的情况，称为总体参数估计。总体参数估计问题可分为点估计与区间估计。对参数模型下的估计，称为参数估计；对非参数模型下的估计，称为非参数估计。第一节点估计、区间估计与标准误n参数估计分为点估计和区间估计一、点估计的定义n点估计（point estimation）是用样本统计量来估计总体参数，因为样本统计量为数轴上某一点值，估计的结果也以一个点的数值表示，所以称为点估计。二、良好估计量的标准对于一个未知参数，人们可以构造多个估计量去估计它。另外，用样本统计量作为总体参数的估计值，总是有一定的偏差，因

4、此就产生了一个评价估计量好坏的问题。一个好的估计量应具备如下一些特征。1、无偏性n 用统计量估计总体参数一定会有误差，不可能恰恰相同。因此，好的估计量应该是一个无偏估计量（unbiased estimate），即用多个样本的统计量作为总体参数的估计值，其偏差的平均数为0。n 用样本平均数作为总体的估计值，就具有无偏性。样本方差就不是总体方差的一个无偏估计值。总体方差的无偏估计量是，用表示。2、有效性n当总体参数的无偏估计不止一个统计量时。无偏估计变异小者有效性高，变异大者有效性低。例如作为的估计值Mo、Md、等都是无偏估计，但是只有的变异最小，即方差最小，

5、故平均数这一统计量作为总体参数的估计值是最有效的。3、一致性n当样本容量无限增大时，估计值应能够越来越接近它所估计的总体参数，估计值越来越精确，逐渐趋近于真值。即当N时X ，。4、充分性指一个容量为n的样本统计量，是否充分地反应了全部n个数据所反映总体的信息。所以点估计以随机变量中的某一个值来作估计，很显然会产生一定的误差。若误差较小，这个点估计值还是一个好的估计值，若误差较大，这个点估计便失去了意义，而区间估计在一定意义上弥补了点估计的不足之处。三、区间估计与标准误（一）区间估计的定义n区间估计（interval estimation）就是根据估计量以一定可靠程度推断

6、总体参数所在的区间范围。它是用数轴上的一段距离表示未知参数可能落入的范围，它虽不具体指出总体参数等于什么，但能指出未知总体参数落入某一区间的概率有多大。n相对优点：给出一个估计的范围，使总体参数包含在这个范围之内。给出估计精度并说明估计结果的有把握的程度。（二）置信区间与显著性水平n 置信区间，也称置信间距（confidence interval， CI），是指在某一置信度时，总体参数所在的区域距离或区域长度。置信区间的上下二端点值称为置信界限（confidence limits），显著性水平（ significance level）是指估计总体参数落在某一区间时，可能犯错误

7、的概率，用符号表示。1为置信度或置信水平（confidence level）。n0.95置信区间0.05显著性水平的置信区间。n0.99置信区间0.01显著性水平的置信区间。n心理学中通常使用0.05,0.01,0.001显著性水平（三）区间估计的原理与标准误n区间估计是根据样本分布理论，用样本分布的标准误（SE）计算区间长度，解释总体参数落入某置信区间可能的概率。n区间估计的原理是样本分布理论。在计算区间估计值，解释估计的正确率时，依据的是该样本统计量的分布规律及样本分布的标准误（ SE）。第二节总体平均数的估计n一.估计总体平均数的步骤 1.根据实得样本的数据，计算样本的平均数

8、与标准差； 2.计算标准误；n有两种情况：n（1）当总体方差已知时，n（2）当总体方差未知时，用样本的无偏估计量如果计算的是样本的有偏估计 3.确定置信水平或显著性水平； 4.根据样本平均数的抽样分布，确定查何种统计表； 5.计算置信区间； 6.解释总体平均数的置信区间。n二.总体方差已知时，对总体平均数的估计n1.当总体分布为正态时，不论样本n的大小，其标准误都是，这时样本的方差在计算中没有用处。依据上面所讲的步骤，查正态表，确定，一般情况下显著性水平确定为 0.05或0.01，因此其为1.96或2.58。n2.当总体为非正态分布时，只有当样本容量 n30以上，才能根据样

9、本分布对总体平均数进行估计，否则不能进行估计。n例71n例72n 因此遇到有多个样本的情况时，一般取样本大的均值与标准误对总体进行估计。即在条件允许的情况下，应用大样本进行观测，对总体参数进行估计更具优越性。n三.总体方差未知，对总体平均数的估计n样本平均数分布为t分布，查t值表n（1）总体分布为正态，不管n的大小；n（2）总体分布为非正态，n30，才能推论，但这时可以使用来代替。n即置信区间 n - .S/ , + .S/ n例73n例74n总结：总体平均数的估计，置信区间的大小受样本容量和置信度1 的影响。（1）置信区间的大小在样本容量n一定的情况下，与置信度1 有关；（

10、2）当置信度1 固定，置信区间的大小与样本容量n有关，随着样本容量n的增大，置信区间有减小的趋势。第三节. 标准差与方差的区间估计n一.标准差的区间估计n根据抽样分布的理论，当样本容量n30时，样本标准差的分布为渐近正态分布。n二.方差的区间估计n根据分布n自正态分布的总体中，随机抽取容量为n的样本。其样本方差与总体比值的分布为分布，这样可直接查表确定其比值的0.95与0.99 置信区间。再进一步用以下公式确定总体方差的0.95与0.99置信区间。n例76n例77n三.两总体方差之比的区间估计n如果两总体方差，其样本方差之比多数应在1上下摆动。F分布是一族分布，附录 4表

11、中的概率是指某一F 值以上，F分布右侧一尾端部分的概率（称单侧概率）。如果需要的值，即F双侧概率的值可查附表3（双侧概率）。根据F分布，可估计二总体方差之比的置信区间。nWARNING:根据样本方差估计两总体方差之比在1上下一定区间内，可推论两总体方差相等。n例78n【考研与考试真题】n1、当总体参数不清楚时，常用一个样本统计量估计相应的总体参数，这类问题称为 _，总体平均数的无偏估计量应为 _，而总体方差的无偏估计量应为 _。n2、为调查市民对一项市政府计划方案的支持率，随机抽取了120名市民进行调查，结果发现其中86人对该方案持赞成态度，现希望以 99%的置信概率来估计全体市民的支持率，且估计误差不能大于正负5%。试问：至少应调查多少人？n3、用样本统计量估计总体参数时，一般总存在一定的偏差，一个好的估计量必须具备某些特性，这包括_、一致性、_ 和充分性。n4、大医院每天约有个婴儿出生，小医院每天约有个婴儿出生，在一年内生男孩的比例超过的天数n、大小医院一样多 n、大小医院无规律n、大医院多 n、小医院多

展开阅读全文

教育与心理统计第七章参数估计

最新文档