李毓秋李毓秋E-mail:心理统计ppt08抽样分布第八讲抽样分布与参数估计心理统计ppt08抽样分布复习:正态分布复习:正态分布在测验记分方面的应用在测验记分方面的应用1.以标准分数表示考试成绩 ¨比较学生的考试成绩时,使用原始分数比较学生的考试成绩时,使用原始分数有其不合理之处:有其不合理之处:心理统计ppt08抽样分布¨⑴⑴.原始分制度没有提示考生成绩在.原始分制度没有提示考生成绩在考生团体成绩中的位置考生团体成绩中的位置¨⑵⑵.由于各科命题难度不同,导致各.由于各科命题难度不同,导致各科原始分之间不能直接比较,造成分数解科原始分之间不能直接比较,造成分数解释上的困难释上的困难¨⑶⑶.各科原始分相加不合理.各科原始分相加不合理 心理统计ppt08抽样分布采用标准分数,有如下特点:⑴⑴.标准分的大小,既表明考生水平的高低,.标准分的大小,既表明考生水平的高低,也表明该生在考生团体中的位置的高低也表明该生在考生团体中的位置的高低⑵⑵.各科标准分都表示考生各科在同一团体.各科标准分都表示考生各科在同一团体中的位置,可根据标准分大小直接比较考生的各中的位置,可根据标准分大小直接比较考生的各科成绩水平。
科成绩水平⑶⑶.各科标准分的参照点(平均分为.各科标准分的参照点(平均分为500500分)分)和单位(和单位(1 1个标准差为个标准差为100100分)都一样,具有可加分)都一样,具有可加性性, ,克服了原始分的缺陷克服了原始分的缺陷心理统计ppt08抽样分布例题:下表是两名高考学生的成绩,试分析哪一位考生的成绩更好?科目科目原始成绩原始成绩全体考生全体考生Z Z分数分数甲甲乙乙平均分平均分标准差标准差甲甲乙乙语文语文858970101.51.9政治政治70626551-0.6外语外语6872698-0.1250.375数学数学53405060.5-1.67理化理化7287758-0.3751.5ΣΣ3483502.51.505心理统计ppt08抽样分布¨目前我国一些省在高考中采用标准分目前我国一些省在高考中采用标准分数表示考生的成绩,为了使分数更适合一数表示考生的成绩,为了使分数更适合一般习惯,对标准分数进一步做转换:般习惯,对标准分数进一步做转换:心理统计ppt08抽样分布2.确定等级评定的人数¨如要将某种能力的分数分成等距的几个如要将某种能力的分数分成等距的几个等级,在确定各等级人数时,可将正态分等级,在确定各等级人数时,可将正态分布基线上布基线上Z Z=-=-3 3至至Z Z=+=+3 3之间之间6 6个标准差的个标准差的距离分成相等的几份,然后查表求出各段距离分成相等的几份,然后查表求出各段Z Z值之间的面积,再乘以总人数,即为各等值之间的面积,再乘以总人数,即为各等级人数。
级人数心理统计ppt08抽样分布¨计算:今有计算:今有10001000人参加一项数学能人参加一项数学能力测验力测验, ,欲将测验结果评为六个等级欲将测验结果评为六个等级问各等级评定的人数应是多少?问各等级评定的人数应是多少?心理统计ppt08抽样分布3.品质评定数量化在心理与教育研究中在心理与教育研究中, ,常常遇到等级评定常常遇到等级评定的结果但是不同评定者的评定结果往往不的结果但是不同评定者的评定结果往往不一致,无法综合他们的评定结果,而且等级一致,无法综合他们的评定结果,而且等级分数不是等距数据,不同事物的评定结果不分数不是等距数据,不同事物的评定结果不能直接比较将品质评定的结果转化为数量能直接比较将品质评定的结果转化为数量结果,就可解决这些问题结果,就可解决这些问题心理统计ppt08抽样分布具体方法¨根据各等级被评者的数目求各等级的人数比率;根据各等级被评者的数目求各等级的人数比率;¨求各等级比率值的中间值;求各等级比率值的中间值;¨求各等级中点以上(或以下)的累积比率;求各等级中点以上(或以下)的累积比率;¨用累积比率查正态分布表;用累积比率查正态分布表;¨求被评者所得评定等级的数量化值的平均值。
求被评者所得评定等级的数量化值的平均值心理统计ppt08抽样分布P169P169例题例题3 3名教师对名教师对100100名学生的评定结果名学生的评定结果等级等级评定结果(人数)评定结果(人数)教师甲教师甲教师乙教师乙教师丙教师丙A A5 510102020B B252520202525C C404040403535D D252520201515E E5 510102 2总数总数1001001001001001001.961.960.940.940 0-0.94-0.94-1.96-1.961.651.650.840.840 0-0.84-0.84-1.65-1.651.281.280.450.45-0.32-0.32-1.15-1.15-1.96-1.96心理统计ppt08抽样分布一、抽样分布区分三种不同性质的分布:¨总体分布:总体内个体数值的频数分布总体分布:总体内个体数值的频数分布¨样本分布:样本内个体数值的频数分布样本分布:样本内个体数值的频数分布¨抽样分布:某一种统计量的概率分布抽样分布:某一种统计量的概率分布心理统计ppt08抽样分布1. 抽样分布的概念抽样分布抽样分布是从同一总体内是从同一总体内抽取的不同抽取的不同样本的统计量样本的统计量的概的概率分布。
率分布抽样分布是一个理论的概抽样分布是一个理论的概率分布,是统计推断的依据率分布,是统计推断的依据心理统计ppt08抽样分布2.平均数抽样分布的几个定理 ⑴⑴.从总体中随机抽出容量为.从总体中随机抽出容量为n n的一切可能的一切可能样本的平均数之平均数等于总体的平均数样本的平均数之平均数等于总体的平均数⑵⑵.容量为.容量为n n的平均数在抽样分布上的标准的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以差(即平均数的标准误),等于总体标准差除以n n的平方根的平方根8.1)(8.2)心理统计ppt08抽样分布¨⑶⑶.从正态总体中,随机抽.从正态总体中,随机抽取的容量为取的容量为n n的一切可能样本平的一切可能样本平均数的分布也呈正态分布均数的分布也呈正态分布¨⑷⑷.虽然总体不呈正态分布,.虽然总体不呈正态分布,如果样本容量较大,反映总体如果样本容量较大,反映总体μμ和和σσ的样本平均数的抽样分布,的样本平均数的抽样分布,也接近于正态分布也接近于正态分布心理统计ppt08抽样分布二.标准误二.标准误¨某种统计量在抽样分布上的标准差,称为某种统计量在抽样分布上的标准差,称为标准误。
标准误标准误标准误用来衡量用来衡量抽样误差抽样误差标准误越小,表明样本统计量与总体参数的值越接越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大因此,标准误推断总体参数的可靠度越大因此,标准误是统计推断是统计推断可靠性可靠性的指标 心理统计ppt08抽样分布平均数标准误的计算1.总体正态,σ已知(不管样本容量大小), 或总体非正态,σ已知,大样本平均数的标准误为:平均数的标准误为:心理统计ppt08抽样分布平均数标准误的计算2 2.总体正态,.总体正态,σσ未知(不管样本容量大小),未知(不管样本容量大小), 或总体非正态, 或总体非正态,σσ未知,大样本未知,大样本平均数标准误的估计值为平均数标准误的估计值为(8.3)心理统计ppt08抽样分布三.平均数离差统计量的分布由样本的平均数对总体由样本的平均数对总体平均数进行估计,首先要了平均数进行估计,首先要了解平均数离差统计量的分布,解平均数离差统计量的分布,才能根据一定的概率,由样才能根据一定的概率,由样本的平均数对总体的平均数本的平均数对总体的平均数做出估计。
做出估计心理统计ppt08抽样分布1 1.总体正态,.总体正态,σσ已知(不管样本容量大小)已知(不管样本容量大小), 或总体非正态,或总体非正态,σσ已知,大样本已知,大样本平均数离差的的抽样分布呈正态分布平均数离差的的抽样分布呈正态分布(8.4)心理统计ppt08抽样分布2 2.总体正态,.总体正态,σσ未知(不管样本容量大小)未知(不管样本容量大小), 或总体非正态,或总体非正态,σσ未知,大样本未知,大样本平均数离差的的抽样分布呈平均数离差的的抽样分布呈t t分布分布(8.5)心理统计ppt08抽样分布t分布的特点⑴⑴.形状与正态分布曲线相似.形状与正态分布曲线相似⑵⑵..t t分布曲线随自由度不同而有一簇曲线分布曲线随自由度不同而有一簇曲线⑶⑶.自由度的计算:.自由度的计算:自由度是指能够独立变化的数据个数自由度是指能够独立变化的数据个数⑷⑷.查.查t t分布表时,需根据自由度及相应的显分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧著性水平,并要注意是单侧数据还是双侧心理统计ppt08抽样分布3 3.总体.总体σσ未知,大样本时的近似处理未知,大样本时的近似处理¨样本容量增大后,平均数的抽样分布接样本容量增大后,平均数的抽样分布接近于正态分布,可用正态分布近似处理:近于正态分布,可用正态分布近似处理:(8.6)心理统计ppt08抽样分布四.总体参数估计的基本原理¨根据样本统计量对相应总体参数所作的估根据样本统计量对相应总体参数所作的估计叫作总体参数估计。
计叫作总体参数估计¨总体参数估计分为点估计和区间估计总体参数估计分为点估计和区间估计¨由样本的标准差估计总体的标准差即为点由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的估计;而由样本的平均数估计总体平均数的取值范围则为区间估计取值范围则为区间估计心理统计ppt08抽样分布1.良好的点估计量应具备的条件¨ ¨无偏性无偏性 如果一切可能个样本统计量的值与总体参数如果一切可能个样本统计量的值与总体参数值偏差的平均值为值偏差的平均值为0 0,这种统计量就是总体参数,这种统计量就是总体参数的无偏估计量的无偏估计量¨ ¨有效性有效性 当总体参数不止有一种无偏估计量时,某一当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低高,方差大者为有效性低 心理统计ppt08抽样分布良好的点估计量应具备的条件¨ ¨一致性一致性当样本容量无限增大时,估计量的值能越来当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。
参数一致性估计量¨ ¨充分性充分性一个容量为一个容量为n n的样本统计量的样本统计量, ,应能充分地反映应能充分地反映全部全部n n个数据所反映的总体的信息个数据所反映的总体的信息心理统计ppt08抽样分布2.区间估计¨以样本统计量的抽样分布(概率分布)为以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总量的值估计总体参数值的所在范围,称为总体参数的体参数的区间估计¨对总体参数值进行区间估计,就是要在一对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的定可靠度上求出总体参数的置信区间的上下的上下限心理统计ppt08抽样分布¨⑴⑴要知道与所要估计的参数相对应的样本要知道与所要估计的参数相对应的样本统统计量计量的值,以及样本统计量的理论分布;的值,以及样本统计量的理论分布; ¨⑵⑵要求出该种统计量的要求出该种统计量的标准误标准误;; ¨⑶⑶要确定在多大的要确定在多大的可靠度可靠度上对总体参数作估上对总体参数作估计,再通过某种理论概率分布表,找出与某种可计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的靠度相对应的该分布横轴上记分的临界值临界值,才能,才能计算出总体参数的计算出总体参数的置信区间置信区间的上下限。
的上下限 心理统计ppt08抽样分布置信区间¨置信度,即置信度,即置信概率,是作出某种推断是作出某种推断时正确的可能性(概率)时正确的可能性(概率)¨置信区间,也称置信间距(也称置信间距(confidence confidence interval,CIinterval,CI)是指在某一置信度时,总体)是指在某一置信度时,总体参数所在的区域距离或区域长度参数所在的区域距离或区域长度置信区间是带有置信概率的取值区间置信区间是带有置信概率的取值区间心理统计ppt08抽样分布显著性水平¨对总体平均数进行区间估计时,置信概率对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是表示做出正确推断的可能性,但这种估计还是会有犯错误的可能显著性水平会有犯错误的可能显著性水平( (significance levelsignificance level) )就是指估计总体参数落就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号在某一区间时,可能犯错误的概率,用符号αα表示 P P=1=1- -αα心理统计ppt08抽样分布3.平均数区间估计的基本原理¨通过样本的平均数估计总体的平均数通过样本的平均数估计总体的平均数, ,首先首先假定该样本是随机取自一个正态分布的母总体假定该样本是随机取自一个正态分布的母总体( (或非正态总体中的或非正态总体中的n n>>3030的样本的样本) ),而计算出来,而计算出来的实际平均数是无数容量为的实际平均数是无数容量为n n的样本平均数中的的样本平均数中的一个。
一个¨根据样本平均数的分布理论,可以对总体平根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性均数进行估计,并以概率说明其正确的可能性心理统计ppt08抽样分布练习与思考¨平均数的抽样分布有哪些规律?平均数的抽样分布有哪些规律?¨什么是点估计?什么是区间估计?什么是点估计?什么是区间估计?¨良好的点估计量应具备什么条件?良好的点估计量应具备什么条件?下次学习内容:总体平均数的区间估计与假设检验的基本原理心理统计ppt08抽样分布20052005年年1010月月再见!再见!心理统计ppt08抽样分布。