心理与教育统计学第7章参数估计剖析

上传人:今*** 文档编号:107899710 上传时间:2019-10-21 格式:PPT 页数:85 大小:2.01MB
返回 下载 相关 举报
心理与教育统计学第7章参数估计剖析_第1页
第1页 / 共85页
心理与教育统计学第7章参数估计剖析_第2页
第2页 / 共85页
心理与教育统计学第7章参数估计剖析_第3页
第3页 / 共85页
心理与教育统计学第7章参数估计剖析_第4页
第4页 / 共85页
心理与教育统计学第7章参数估计剖析_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《心理与教育统计学第7章参数估计剖析》由会员分享,可在线阅读,更多相关《心理与教育统计学第7章参数估计剖析(85页珍藏版)》请在金锄头文库上搜索。

1、第七章 参数估计,章节内容,第一节 点估计、区间估计与标准误 第二节 总体平均数的估计 第三节 标准差与方差的区间估计 第四节 相关系数的区间估计 第五节 比率及比率差异的区间估计,总体参数估计:在研究中从样本获得一组数据后,通过这组信息,对总体特征进行估计,即从局部结果推论总体的情况。 总体参数估计分点估计和区间估计两种。,第一节 点估计、区间估计与标准误,一、点估计的定义 点估计(point estimation):用某一样本统计量的值来估计相应总体参数的值。 点估计的优点在于它能够提供总体参数的估计值。,二、良好估计量的标准,1.无偏性 无偏估计量(unbiased estimate):

2、用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。 样本平均数 是总体平均数的无偏估计值;但样本方差s2不是总体方差2的无偏估计值,2的无偏估计值是 。,2.有效性 当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。 的无偏估计值有 、Md、Mo等,但 的变异最小。故 是最有效的估计值。,3.一致性 当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。 当N时, , 2。,4.充分性 一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息。 比Md、Mo充分性高; 比AD、Q

3、更具有充分性。 点估计总是以误差的存在为前提,也不能提供正确估计的概率。,三、区间估计与标准误,(一)区间估计的定义 区间估计(interval estimate):根据估计量以一定可靠程度推断总体参数所在的区间范围,用数轴上的一段距离表示未知参数可能落入的范围。 区间估计在点估计的基础上,不仅给出一个估计的范围,使总体参数包含在这个范围之内,而且还能给出估计精度并说明估计结果的有把握的程度。,(二)置信区间与显著性水平,置信区间(confidence interval, CI):置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。 置信区间的上下两端点值称为置信界限(confid

4、ence limits)。,显著性水平(significance level):估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。有时也称之为意义阶段、信任系数等。 显著性水平在假设检验中,还指拒绝虚无假设时可能出现的犯错误的概率水平。 1为置信度或置信水平(confidence level)。,(三)区间估计的原理与标准误,区间估计是根据抽样分布理论,用抽样分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。 区间估计存在成功估计的概率大小及估计范围大小两个问题。 统计分析一般采取的办法:在保证置信度的前提下,尽可能提高精确度。,0.05水平和0.01水平是人们习

5、惯上常用的两个显著性水平。 区间估计的原理是抽样分布理论。在计算区间估计值,解释估计的正确概率时,依据的是该样本统计量的分布规律及抽样分布的标准误(SE)。 抽样分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。,平均数的区间估计,第二节 总体平均数的估计,样本平均数的平均数与母总体的平均数相同( ),故对平均数总体的平均数进行估计就是对母总体平均数的估计。,一、估计总体平均数的步骤,1.根据实得样本的数据,计算样本的平均数与标准差。 2.计算标准误 。 (1)当总体方差已知时 (2)当总体方差未知时,3.确定置信水平或显著性水平。 统计学上一般规定

6、显著性水平为0.05或0.01。 4.根据样本平均数的抽样分布,确定查何种统计表。 一般当总体方差已知时,查正态表;当总体方差未知时,查t值表。确定Z/2与t /2。,5.计算置信区间。 (1)如果查正态分布表,置信区间可写作: (2)如果查t值表,置信区间可写作: 6.解释总体平均数的置信区间。,总体方差2已知时,对总体平均数的估计,1.当总体分布为正态时,不论样本n的大小,其标准误均为: 2.当总体为非正态分布时,只有当样本容量n30时,才能根据抽样分布对总体平均数进行估计,否则不能进行估计。,【例7-1】 已知母总体为正态分布,=7.07,从这个总体中随机抽取n1=10和n2=36的两个

7、样本,分别计算出 , ,试问总体参数的0.95和0.99置信区间。,解: 平均数的标准误:,用n1=10的样本估计总体参数: 0.95的置信区间 0.99的置信区间,根据n2=36的样本估计总体参数: 0.95的置信区间 0.99的置信区间,【例7-2】 有一个49名学生的班级,某学科历年考试成绩的 ,又知今年某次考试成绩是85分,试推论该班某学科学习的真实成绩分数。,解: 定置信水平为0.95,查正态表得Z(1)/2=1.96。,总体方差2未知,对总体平均数的估计,总体方差未知,用样本的无偏方差( )作为总体方差的估计值,实现对总体平均数的估计。因为在总体方差未知时,样本平均数的分布为t分布

8、,故应查t值表,确定t/2或t(1)/2。 有两种情况: (1)总体的分布为正态时,可不管n之大小。 (2)总体分布为非正态时,只有n30,才能用概率对其抽样分布进行解释,否则不能推论。,【例7-3】 假设2未知,n1=10, =78,s1=8,n2=36, =79,s2=9,问其总体参数的0.95置信区间是多少?,解:平均数的标准误 0.95的置信区间 当n1=10时,df1=9,t0.05/2=2.262,当n2=36时,df2=35,t0.05/2=2.042,【例7-4】 某班49人期末考试成绩为85分,标准差s=6,假设此项考试能反映学生的学习水平,试推论该班学生学习的真实成绩分数。

9、,解: t0.05/2(40)=2.021 0.95的置信区间,第三节 标准差与方差的区间估计,一、标准差的区间估计 根据抽样分布的理论,当样本容量为n30时,样本标准差的分布为渐近正态分布,标准差的平均数: 标准差分布的标准差: 置信区间可写作:,【例7-5】 有一随机样本n=31,sn-1=5,问该样本之总体标准差的0.95置信区间。,解:此题n30,样本标准差的分布可视为渐近正态分布,即Z0.05/2=1.96。 0.95的置信区间为:,二、方差的区间估计,根据2分布: 自正态分布的总体中,随机抽取容量为n的样本,其样本方差与总体方差比值的分布为2分布,这样可直接查2表确定其比值的0.9

10、5与0.99置信区间。,总体方差的0.95与0.99置信区间: 查df=n1的2表确定 与 。,【例7-6】 已知某测验分数的样本n=10, ,问该测验分数总体方差2的0.95和0.99置信区间是多少?,解:计算0.95的置信区间,此时=0.05 查2 表,df=9时, ,,(2)计算0.99的置信区间,此时=0.01 查2 表,df=9时, ,,【例7-7】 n=31,sn-1=5问的0.95置信区间? 解:先求方差的置信区间,当df=30,查2表, 不等号两边都开平方,取正平方根,结果为,三、二总体方差之比的区间估计,根据F分布的意义,从总体方差为 与 的两总体中,分别随机抽取容量为n1与

11、n2的两样本,计算其样本方差之比 ,服从F分布(df1=n11, df2=n21)。因为样本方差只是 与 的无偏估计,所以其样本方差之比 ,多数围绕总体方 差之比 上下波动,少数有所偏离,形成F分布。,如果两总体方差 ,其样本方差之比多数应在1上下摆动。因此,对二总体方差相等的区间估计用 。,根据F分布,可估计二总体方差之比的置信区间: 若二总体相等,上式可写作:,【例7-8】已知n1=10, ,n2=15, 。问二总体方差之比 在0.99置信区间,能否说二总体方差相等?,解: 单侧概率,F0.01=4.03 (df1=9, df2=14) 0.99的置信区间:,(2)双侧概率,F0.01=4

12、.54,(df1=9,df2=14) 0.99的置信区间:,第四节 相关系数的区间估计,一、积差相关系数的抽样分布 (一)当总体的相关系数为负值时,样本r的分布呈不同程度的正偏态。当为正值时,相关系数r的分布呈不同程度的负偏态。在0的情况下,只有样本容量充分大(即n500)时,才渐近正态分布,而且趋于正态很慢。这时,抽样分布的标准误(SEr)为,偏态分布 两个特点: 一是左右不对称(即所谓偏态); 二是当样本增大时,其均数趋向正态分布。 偏态分布又可分为正偏态分布和负偏态分布两种类型: 如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布; 如果频数分布的高峰向右偏移,长尾

13、向左延伸则成为负偏态分布,也称左偏态分布。,(二)当总体相关系数=0时,样本相关系数的分布,服从自由度df=n2的t分布,标准误为:,(三)当总体相关系数0时,样本相关系数的分布,只有当n充分大时,才渐近正态分布,其分布函数很复杂。 统计学家费舍利用 或 将r值转换成Z值,这些Z值渐近服从正态分布,即费舍Z分布,其标准误为:,二、积差相关系数的区间估计,(一)当总体相关系数为零时 df=n2,(二)当总体相关系数不为零时 1.n500,2.利用费舍Z函数分布计算 利用Z的置信区间,估计相关系数r的置信区间的具体步骤 (1)将样本相关系数转换成Z函数 利用公式计算 查rZr转换表,(2)计算Zr

14、的置信区间 ZrZ/2SEZ,(3)将Zr的置信区间转换成相关系数 利用公式计算r值 查附表rZr转换表,将Zr转换成r值,【例7-9】 某校120名学生通过甲乙两测验,计算相关系数为r=0.24,问该两测验总体相关系数的0.95置信区间。,解:假设其总体相关系数为=0, t0.05/2(118)=1.98(取df=120的近似值) 0.95的置信区间,查附表8,r=0.24时Zr=0.245 Z0.05/2=1.96,因此0.95置信区间:,Zr=0.064,差附表8(Zr-r转换表)得r为0.064 Zr=0.426,查附表8(Zr-r转换表)得r为0.40(近似值) 因此,总体相关系数的

15、置信区间为0.0640.40。,三、等级相关系数的区间估计,斯皮尔曼等级相关系数在9n20时,rR的分布近似为df=n2, 的t分布。,df=n2,若n20,rR的分布近似正态分布,标准误 t/2改为Z/2求置信区间。,【例7-10】 N=15,rR=0.41,问其总体相关系数的0.95置信区间。 解: 查t表, t0.05/2(13)=2.160,0.95置信区间:,第五节 比率及比率差异的区间估计,一、比率的区间估计 (一)比率的抽样分布 比率的分布为二项分布。 当np5(或nq5)时,样本比率 的分布为渐近正态分布。 平均数 标准误,样本比率 ,是总体比率p的点估计值,因此当总体p、q未知时,可用 、 代替, 比率的标准误:,比率的标准误与二项分布的标准差意义相同,只是使用的单位不同。二项分布用成功的次数表示: 若用比率表示,则:,(二)比率的区间估计 1.当 时,比率的置信区间,【例7-11】 从四

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号