心理与教育统计学第6章概率分布课件

上传人:壹****1 文档编号:592100600 上传时间:2024-09-19 格式:PPT 页数:143 大小:2.09MB
返回 下载 相关 举报
心理与教育统计学第6章概率分布课件_第1页
第1页 / 共143页
心理与教育统计学第6章概率分布课件_第2页
第2页 / 共143页
心理与教育统计学第6章概率分布课件_第3页
第3页 / 共143页
心理与教育统计学第6章概率分布课件_第4页
第4页 / 共143页
心理与教育统计学第6章概率分布课件_第5页
第5页 / 共143页
点击查看更多>>
资源描述

《心理与教育统计学第6章概率分布课件》由会员分享,可在线阅读,更多相关《心理与教育统计学第6章概率分布课件(143页珍藏版)》请在金锄头文库上搜索。

1、心理与教育统计学心理与教育统计学第第6章章 概率分布概率分布6.1 概率的基本概念概率的基本概念6.2 二项分布二项分布6.3 正态分布正态分布6.4 样本分布样本分布6.1 概率的基本概念概率的基本概念在个别试验中其结果呈现出不确定性,在在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性大量重复试验中其结果又具有统计规律性的现象,称为随机现象。例如掷硬币、抛的现象,称为随机现象。例如掷硬币、抛骰子等骰子等概率论与数理统计是研究和揭示随机现象概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。统计规律性的一门数学学科。6.1.1 什么是概率什么是概率随机事件的随

2、机事件的频率频率 当当n无限增大时,随机事件无限增大时,随机事件A的频率会的频率会稳定在一个常数稳定在一个常数P,这个常数就是随机事,这个常数就是随机事件件A的的概率概率。(一)后验概率(或统计概率)(一)后验概率(或统计概率)(6.1)(6.2) 观察随机事件观察随机事件A出现的次数的方式来出现的次数的方式来决定决定A的概率,称为后验概率。的概率,称为后验概率。(二)先验概率(古典概率)(二)先验概率(古典概率)古典概率模型要求满足两个条件:古典概率模型要求满足两个条件: 试验的所有可能结果(或基本事件)试验的所有可能结果(或基本事件)是有限的;是有限的; 每一种基本事件出现的可能性相等。每

3、一种基本事件出现的可能性相等。n为基本事件的总数;为基本事件的总数;m为事件为事件A包含的基本事件的数目。包含的基本事件的数目。(6.3) 在事件在事件A发生之前,可以通过计算确发生之前,可以通过计算确定的概率,称为先验概率。定的概率,称为先验概率。Dewey.G统计了约统计了约438023个字母,得个字母,得到的英语中特定字母的频率到的英语中特定字母的频率字母字母频率频率字母字母频率频率字母字母频率频率E E0.12680.1268L L0.03940.0394P P0.01860.0186T T0.09780.0978D D0.03890.0389B B0.01560.0156A A0.0

4、7880.0788U U0.0280.028V V0.01020.0102O O0.07760.0776C C0.02680.0268K K0.0060.006I I0.07070.0707F F0.02560.0256X X0.00160.0016N N0.07060.0706M M0.02440.0244J J0.0010.001S S0.06340.0634W W0.02140.0214Q Q0.00090.0009R R0.05940.0594Y Y0.02020.0202Z Z0.00060.0006H H0.05730.0573G G0.01870.0187历史上的投掷硬币试验历史

5、上的投掷硬币试验 实验者实验者投掷投掷次数次数正面向上正面向上的次数的次数频率频率德摩根德摩根20482048106110610.51810.5181蒲丰蒲丰40404040204820480.50690.5069K.K.皮尔逊皮尔逊1200012000601960190.50160.5016K.K.皮尔逊皮尔逊240002400012012120120.50050.5005 投掷硬币的概率是统计概率与古投掷硬币的概率是统计概率与古典概率?典概率? 6.1.2 概率的基本性质概率的基本性质1任何随机事件任何随机事件的概率都是在的概率都是在0与与1之间的正数,即之间的正数,即: 0 P(A)12

6、不可能事件不可能事件的概率等于零,即的概率等于零,即 : P(A)= 0 3必然事件必然事件的概率等于的概率等于1,即,即: P(A)= 1 (一)概率的公理系统(一)概率的公理系统(二)概率的加法定理(二)概率的加法定理 若事件发生,则事件就一定不若事件发生,则事件就一定不发生,这样的两个事件为发生,这样的两个事件为互不相容事互不相容事件件。 两互不相容事件和的概率,等于这两互不相容事件和的概率,等于这两个事件概率之和,即两个事件概率之和,即(6.4a) (6.4b) (三)概率的乘法定理(三)概率的乘法定理 若事件发生不影响事件是否发生,若事件发生不影响事件是否发生,这样的两个事件为这样的

7、两个事件为互相独立事件互相独立事件。 两个互相独立事件同时出现的概率,两个互相独立事件同时出现的概率,等于这两个事件概率的乘积,即等于这两个事件概率的乘积,即 (6.5a) (6.5b) 例:某一学生从个试题中任意抽取例:某一学生从个试题中任意抽取一题,进行口试。如果抽到每一题的一题,进行口试。如果抽到每一题的概率为概率为15,则抽到试题或试题,则抽到试题或试题的概率是多少?的概率是多少? 如果前一个学生把抽如果前一个学生把抽过的试题还回后,后一个学生再抽,过的试题还回后,后一个学生再抽,则个学生都抽到试题则个学生都抽到试题1的概率是多少的概率是多少? 该学生抽到试题该学生抽到试题1或者试题或

8、者试题2为不相为不相容事件:容事件:四个学生均抽到试题四个学生均抽到试题1为独立事件:为独立事件:例:一个口袋装有例:一个口袋装有6只球,其中只球,其中4只白球、只白球、2只红球,从袋中取球两次。只红球,从袋中取球两次。考虑两次取球方式考虑两次取球方式(a)放回抽样,第一次)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一只球,观察其颜色后放回,搅匀后再取一球。(取一球。(b)不放回抽样,第一次取一球)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一不放回袋中,第二次从剩余的球中再取一球。球。请问这两种情况下取到一只白球和一只红请问这两种情况下取到一只白球和一只红球的概率。

9、球的概率。放回取样放回取样第一次取到白球,第二次取到红球:第一次取到白球,第二次取到红球: 第一次取到红球,第二次取到白球:第一次取到红球,第二次取到白球: 取到一只白球和一只红球的概率:取到一只白球和一只红球的概率: 不放回取样不放回取样 第一次取到白球,第二次取到红球:第一次取到白球,第二次取到红球: 第一次取到红球,第二次取到白球:第一次取到红球,第二次取到白球: 取到一只白球和一只红球的概率:取到一只白球和一只红球的概率: 问题:小明的班上有问题:小明的班上有83名同学,至少有名同学,至少有一位同学与小明的生日相同的概率?一位同学与小明的生日相同的概率?(一年按(一年按365天计算)天

10、计算)82名同学与小明的生日均不相同的概率为:名同学与小明的生日均不相同的概率为:至少一位同学与小明的生日相同的概率为:至少一位同学与小明的生日相同的概率为:n n202023233030404050506464100100p p0.4110.411 0.5070.507 0.7060.706 0.8910.8910.970.970.9970.9971 1问题:问题:83人的班上,至少两人生日相人的班上,至少两人生日相同的概率为多少?同的概率为多少?“与小明生日相同与小明生日相同的概率的概率”与与“班班级人数级人数”的关系的关系“至少两人生日相至少两人生日相同的概率同的概率”与与“班级人数班级

11、人数”的关的关系系人数人数概概率率人数人数概概率率小明的小组有小明的小组有6人,(人,(1)有人与小明出生)有人与小明出生月份相同的概率为多少?(月份相同的概率为多少?(2)至少)至少2人出人出生月份相同的概率为多少?生月份相同的概率为多少?信不信?可以试一试!信不信?可以试一试!(1)(2)6.1.3 概率分布类型概率分布类型概率分布是指对随机变量取不同值时的概概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。率的描述,一般用概率分布函数进行描述。概率分布概率分布是总体的分布,而是总体的分布,而频率分布频率分布是样是样本的分布。本的分布。概率概率给出的是单个结果发生的

12、可能性,给出的是单个结果发生的可能性,概概率分布率分布是对随机变量所有可能结果的可能是对随机变量所有可能结果的可能性分布描述,通常可以写成某个函数式形性分布描述,通常可以写成某个函数式形式。式。分分组区区间组中中值人数人数频率率频率密度率密度18018110.010.003317717830.040.013317417550.060.020017117230.040.013316816950.060.020016516670.080.0267162163150.180.0600159160180.220.0733156157140.170.056715315490.110.0367150151

13、30.040.0133学生身高次数分布表学生身高次数分布表 次数次数 频率频率 频率密度频率密度 150 159 168 177 150 159 168 177 150 159 168 177151 160 169 178 151 160 169 178 151 160 169 178 学生身高次数分布图学生身高次数分布图 全国学生身高概率分布图全国学生身高概率分布图 151 160 169 178 151 160 169 178 概率概率 概率密度概率密度 概率分布中的曲线高度一般为概率密度,概率分布中的曲线高度一般为概率密度,面积表示概率,横坐标为样本值;面积表示概率,横坐标为样本值; 有

14、少数情况下,曲线高度表示概率(如有少数情况下,曲线高度表示概率(如P179二项分布)。二项分布)。(一)离散分布与连续分布(一)离散分布与连续分布依随机变量的类型,可将概率分布分为离依随机变量的类型,可将概率分布分为离散分布与连续分布。散分布与连续分布。当随机变量只取孤立的数值时,这种随机当随机变量只取孤立的数值时,这种随机变量称为离散随机变量,离散随机变量的变量称为离散随机变量,离散随机变量的概率分布称为离散分布。概率分布称为离散分布。连续随机变量的概率分布称为连续分布。连续随机变量的概率分布称为连续分布。心理与教育统计学中最常用的离散型分布心理与教育统计学中最常用的离散型分布是是二项分布二

15、项分布,最常用的连续型分布是,最常用的连续型分布是正态正态分布分布。 (二)经验分布与理论分布(二)经验分布与理论分布依分布函数的来源,可将概率分布分为经依分布函数的来源,可将概率分布分为经验分布与理论分布。验分布与理论分布。经验分布是指根据观察或实验所获得的数经验分布是指根据观察或实验所获得的数据而编制的次数分布或频率分布。经验分据而编制的次数分布或频率分布。经验分布往往是总体的一个样本。布往往是总体的一个样本。理论分布有两个含义,一是随机变量概率理论分布有两个含义,一是随机变量概率分布的函数(如分布的函数(如正态分布正态分布),二是按某种),二是按某种数学模型计算出的总体的次数分布(如数学

16、模型计算出的总体的次数分布(如二二项分布项分布)。)。 (三)基本随机变量分布与抽样分(三)基本随机变量分布与抽样分布布依所描述的数据的样本特性,可将概率分依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。布分为基本随机变量分布与抽样分布。基本随机变量分布是随机变量各种不同取基本随机变量分布是随机变量各种不同取值情况的概率分布,如二项分布与正态分值情况的概率分布,如二项分布与正态分布。布。抽样分布是从同一总体内抽取的不同抽样分布是从同一总体内抽取的不同样本样本的统计量的统计量的概率分布,如平均数分布,方的概率分布,如平均数分布,方差分布,相关系数分布等。差分布,相关系数分布

17、等。谢谢!谢谢!复习复习l古典概率与统计概率古典概率与统计概率加法原理:加法原理:乘法原理:乘法原理:l频率与概率频率与概率l频率分布与概率分布频率分布与概率分布6.2 二项分布二项分布二项分布是一种具有广泛用途的离散二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努型随机变量的概率分布,它是由贝努里创立的,所以又叫贝努里分布。里创立的,所以又叫贝努里分布。二项分布是心理与教育统计中常用的二项分布是心理与教育统计中常用的一种基本随机变量分布。一种基本随机变量分布。6.2.1 二项试验二项试验二项试验又称为贝努里试验,它必须满足二项试验又称为贝努里试验,它必须满足以下几个条件:以下

18、几个条件:1.任何一次试验恰好有两个结果,成功与失任何一次试验恰好有两个结果,成功与失败。败。2.共有共有n次试验,并且次试验,并且n是预先给定的任一正是预先给定的任一正数。数。3.每次试验各自独立,各次试验之间无相互每次试验各自独立,各次试验之间无相互影响。影响。4.某种结果出现的概率在任何一次试验中都某种结果出现的概率在任何一次试验中都是固定的。是固定的。是否为二项试验?是否为二项试验?(1)投掷硬币试验投掷硬币试验(2)一个口袋装有一个口袋装有6只球,其中只球,其中4只白球、只白球、2只只红球,从袋中取球两次。红球,从袋中取球两次。 (a)放回抽样,第一次取一只球,观察其)放回抽样,第一

19、次取一只球,观察其颜色后放回,搅匀后再取一球。颜色后放回,搅匀后再取一球。 (b)不放回抽样,第一次取一球不放回袋)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。中,第二次从剩余的球中再取一球。6.2.2 二项分布函数二项分布函数二项定理:二项定理:项数:二项展开式中共有项数:二项展开式中共有n1项。项。指数:指数:p的指数,从的指数,从n0下降;下降;q指数从指数从0n为上升。每项为上升。每项p与与q指数之和等于指数之和等于n。系数:系数:n个元素中依次取个元素中依次取0n个元素的组个元素的组合数。合数。11 11 2 11 3 3 11 4 6 4 11 5 1 0 10

20、 5 11 6 15 20 15 6 1杨辉三角形杨辉三角形 用用 n 次方的二项展开式来表达次方的二项展开式来表达在在 n 次二项试验中成功事件出现的次二项试验中成功事件出现的不同次数(不同次数(X0,1)的概率分)的概率分布,叫做二项分布函数。布,叫做二项分布函数。 二项分布是一种离散型随机变量二项分布是一种离散型随机变量的概率分布。的概率分布。设有设有n次试验,各次试验彼此独立的,每次次试验,各次试验彼此独立的,每次试验某事件出现的概率都是试验某事件出现的概率都是p,某事件不出,某事件不出现的概率都是现的概率都是q(1-p),则对于某事件出),则对于某事件出现现X次(次(0,1,2,n)

21、的概率分布为:)的概率分布为:式中:式中:(6.6) 例例 10个硬币投掷一次,或个硬币投掷一次,或1个硬币投掷个硬币投掷10次,问次,问5次正面向上的概率是多少?次正面向上的概率是多少?解:根据题意,解:根据题意,n=10,p=q=0.5,X=5例例 已知某长一批产品中一级品率为已知某长一批产品中一级品率为0.2现现在从中随机地抽查在从中随机地抽查20只。问只。问20只元件中恰只元件中恰好有好有6个一级品的概率是多少?个一级品的概率是多少?解:n=20, p=0.2, q=0.8. x=6某人进行射击练习,如果每次射击某人进行射击练习,如果每次射击击中的命中率为击中的命中率为0.02,独立射

22、击,独立射击400次,试求至少击中两次的概率。次,试求至少击中两次的概率。解:击中的次数为解:击中的次数为x,其对应概率为:,其对应概率为:一个口袋装有一个口袋装有6只球,其中只球,其中4只白球、只白球、2只红只红球,从袋中取球两次。球,从袋中取球两次。放回抽样,第一次取一只球,观察其颜色放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。后放回,搅匀后再取一球。求取到一只白球与一只红球的概率。求取到一只白球与一只红球的概率。解:实验次数解:实验次数n=2,取到白球的次数,取到白球的次数x=1,白,白球的概率球的概率p=4/6,红球的概率,红球的概率q=2/6.6.2.3 二项分布的性

23、质二项分布的性质(一)(一) 二项分布是离散型分布,概率直方图二项分布是离散型分布,概率直方图是阶跃式。因为是阶跃式。因为X为不连续变量,用概率条图为不连续变量,用概率条图表示更为合适。表示更为合适。1个硬币投掷个硬币投掷5次,正面向上次,正面向上0,1,2,3,4,5次次的概率分别为:的概率分别为:5次10次20次40次80次160次当当p=q时,图形是对称的。时,图形是对称的。当当n趋近于无穷大时,二项分布趋近于趋近于无穷大时,二项分布趋近于正态分布。正态分布。p=q=0.5p=0.2,q=0.8l当当pq,二项分布为负偏态。二项分布为负偏态。l当当n很大,偏态逐渐降低,最终趋近于正态。很

24、大,偏态逐渐降低,最终趋近于正态。l当当pq时,且时,且nq5.这时二二项分布分布为正正态分布的近似形。分布的近似形。5次10次20次40次80次160次(二)二项分布的平均数和标准差(二)二项分布的平均数和标准差如果二项分布满足如果二项分布满足pq且且 nq5(或者(或者pq且且 np5时,二项分布接近于正态分时,二项分布接近于正态分布。可用下面的方法计算二项分布的平布。可用下面的方法计算二项分布的平均数和标准差。均数和标准差。二项分布的平均数为二项分布的平均数为二项分布的标准差为二项分布的标准差为(67) (68) 求求p=0.2,q=0.8,n=160次的二项分布的平均值次的二项分布的平

25、均值和标准差。和标准差。解:解:np=0.2160=325,该二二项分布接近正分布接近正态分布。分布。6.2.4 二项分布的应用二项分布的应用二项分布函数除了用来求成功事件恰二项分布函数除了用来求成功事件恰好出现好出现X次的概率之外,在教育中主要次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性用来判断试验结果的机遇性与真实性的界限。的界限。 例如,一个学生凭猜测做例如,一个学生凭猜测做10个是非题,平个是非题,平均可以猜对均可以猜对5题。什么情况下可以说他是题。什么情况下可以说他是真会而不是猜测呢?真会而不是猜测呢?做对题数做对题数概率概率累加概率累加概率0 00.0009770.0

26、009770.0009770.0009771 10.0097660.0097660.0107420.0107422 20.0439450.0439450.0546880.0546883 30.117190.117190.171880.171884 40.205080.205080.376950.376955 50.246090.246090.623050.623056 60.205080.205080.828130.828137 70.117190.117190.945310.945318 80.0439450.0439450.989260.989269 90.0097660.0097660.

27、999020.9990210100.0009770.0009771 1做对做对8道题的道题的累加概率达累加概率达到到0.989,8道题以上即道题以上即可认为是真可认为是真会做。会做。例如,一个学生凭猜测做例如,一个学生凭猜测做10个四选一的选个四选一的选择题,什么情况下可以说他是真会而不是择题,什么情况下可以说他是真会而不是猜测呢?猜测呢?做对题数做对题数概率概率累加概率累加概率0 00.0563140.0563140.0563140.0563141 10.187710.187710.244030.244032 20.281570.281570.525590.525593 30.250280.

28、250280.775880.775884 40.1460.1460.921870.921875 50.0583990.0583990.980270.980276 60.0162220.0162220.996490.996497 70.003090.003090.999580.999588 80.0003860.0003860.999970.999979 92.86E-052.86E-051 110109.54E-079.54E-071 1做对做对5道题道题以上即可认以上即可认为是真会做。为是真会做。统计游戏统计游戏小时候经常看到有这样的游戏,在一块倾小时候经常看到有这样的游戏,在一块倾斜的板上

29、有斜的板上有n排钉子,在钉子的下方有排钉子,在钉子的下方有n1个格子,对应的奖励。自侧方弹出一个玻个格子,对应的奖励。自侧方弹出一个玻璃球,任其自由下落,在下落的过程中让璃球,任其自由下落,在下落的过程中让小球碰到钉子时,会改变下落方向。每碰小球碰到钉子时,会改变下落方向。每碰装一次时,玻璃球向两边下落的可能性相装一次时,玻璃球向两边下落的可能性相等。一块钱可以玩等。一块钱可以玩5次,中间对应的奖励很次,中间对应的奖励很小,两侧对应的奖励可能有小,两侧对应的奖励可能有5元、元、10元。元。Galton钉板概率模型钉板概率模型请问每个格子内的概率是多少?请问每个格子内的概率是多少?0.50.51

30、0.250.50.2510.5 0.50.25 0.5 0.250.125 0.375 0.375 0.1250.0625 0.25 0.375 0.25 0.0625实践作业:实践作业:每人投掷硬币每人投掷硬币10次,记录次,记录数字向上数字向上的次数。的次数。小组收集数据后发给班长,请班长在小组收集数据后发给班长,请班长在周六周六前发给我。前发给我。谢谢!谢谢!复习复习式中:式中:(6.6) 二项分布函数:二项分布函数:p=q=0.580次 160次 20次 6.3 正态分布正态分布正态分布正态分布也称为常态分布,是连续型随机也称为常态分布,是连续型随机变量概率分布的一种,是在数理统计的理

31、变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论与实际应用中占有最重要地位的一种理论分布。论分布。心理与教育中大量的现象均按正态形式分心理与教育中大量的现象均按正态形式分布,如智力高低、成绩好坏、社会态度等。布,如智力高低、成绩好坏、社会态度等。 正态分布由正态分布由棣莫弗棣莫弗于于1733年发现的。拉年发现的。拉普拉斯、高斯对正态分布的研究也做出了普拉斯、高斯对正态分布的研究也做出了贡献,故有时称正态分布为贡献,故有时称正态分布为高斯分布高斯分布。 是是圆周率周率 3.14159e是自然是自然对数的底数的底 2.71828X为随机随机变量取量取值为理论平均数;为理论

32、平均数; 为理理论标准差;准差;y为概率密度,即正概率密度,即正态分布的分布的纵坐坐标。(6.7) 6.3.1 正态分布的特征正态分布的特征1.正态分布的形式是对称的,它的对称轴正态分布的形式是对称的,它的对称轴是经过平均数的垂线。是经过平均数的垂线。2.正态分布的中央点(即平均数)最高,正态分布的中央点(即平均数)最高,然后逐渐向两侧下降,曲线的形式是先然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向个标准差处,曲线两端向X轴无限接近。轴无限接近。3. 正态曲线下的总的面积为正态曲线下的总的面积为1,经过平均数,经过平

33、均数的垂线将正态曲线下的面积划分为相等的两的垂线将正态曲线下的面积划分为相等的两个部分,各为个部分,各为0.5。 曲线下的面积为概率,可由积分公式计曲线下的面积为概率,可由积分公式计算:算:(6.8) 4. 正态分布是一族分布。它随随机变量的平正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位的不同而有不同均数、标准差的大小与单位的不同而有不同的分布形态。的分布形态。 标准正态分布的标准正态分布的=0, =1。标准正态分。标准正态分布通常写作布通常写作N(0,1)正态分布。)正态分布。(6.9) =2, =1=0, =1=-2, =1平均数决定了正态曲线在横轴上的位置平均数决定了正态

34、曲线在横轴上的位置=0, =0.5=0, =1=0, =2 标准差大的正态曲线低阔,标准差小标准差大的正态曲线低阔,标准差小的正态曲线高窄。的正态曲线高窄。5. 正态分布中各差异量数值相互间有固定正态分布中各差异量数值相互间有固定的比率。的比率。P102,P163s=1.2533AD=1.4826Qs标准差;标准差;AD平均差;平均差;Q四分位差。四分位差。6. 正态分布曲线下,标准差与概率(面积)正态分布曲线下,标准差与概率(面积)有一定的数量关系。有一定的数量关系。6.3.2 正态分布表的编制和使用正态分布表的编制和使用(一)正态分布表的编制与结构(一)正态分布表的编制与结构 利用积分公式

35、可求出正态曲线下任何区利用积分公式可求出正态曲线下任何区间的面积,但需要计算。统计学家编制了间的面积,但需要计算。统计学家编制了标准正态分布表,使其使用非常方便。标准正态分布表,使其使用非常方便。 使用正态分布表时,首先应该确定其编使用正态分布表时,首先应该确定其编制方法:制方法:1)从)从Z=- 开始。开始。2)Z=0开始。开始。本书中采用本书中采用Z=0开始开始。 P概率概率Y概率密度概率密度Z分数分数正态分布表一般分为三栏:正态分布表一般分为三栏:1)Z分数分数(X- )/ ,一般罗列到,一般罗列到3.99。2)概率密度)概率密度(y)某一某一Z分数对应的曲线分数对应的曲线纵坐标高度。当

36、纵坐标高度。当Z=0时,时,y=0.39893)概率值)概率值(P)不同不同Z分数点与平均数之分数点与平均数之间的曲线下的面积。间的曲线下的面积。(二)正态分布表的使用(二)正态分布表的使用1.依据依据Z分数求概率(分数求概率(p)(1)求某)求某Z分数值与平均数(分数值与平均数(Z=0)之间的)之间的概率。概率。P概率概率Z分数分数(2)求某)求某Z分数以上或以下的概率分数以上或以下的概率Z分数分数(3)求两个)求两个Z分数之间的概率。分数之间的概率。Z1Z22. 从概率(从概率(p)求)求Z分数分数(1)已知从平均数开始的概率值求)已知从平均数开始的概率值求Z值。值。P概率概率Z分数分数(

37、2)已知正态分布两端的概率值求该概率)已知正态分布两端的概率值求该概率值分界点的值分界点的Z值。值。Z分数分数P概率概率(3)若已知正态曲线下中央部分的概率,)若已知正态曲线下中央部分的概率,求求Z分数分数Z分数分数P概率概率3. 已知概率或已知概率或Z值,求概率密度值,求概率密度y。Z分数分数P概率概率6.3.3 次数分布的检验方法次数分布的检验方法(一)皮尔逊偏态量数法(一)皮尔逊偏态量数法MoMdMM-MdM-Mos为标准差,为标准差,SK为偏态量数;为偏态量数;当当SK=0时,分布对称;时,分布对称;当当SK0时,为正偏态;时,为正偏态;当当SK0时,分布为正偏态;时,分布为正偏态;当

38、当g1200时,偏度系数才可靠。时,偏度系数才可靠。 (7.2) 峰度系数用来反映呈单峰的数据表现出峰度系数用来反映呈单峰的数据表现出来的峰态情况。来的峰态情况。峰度系数:峰度系数: (7.3) g20 低阔当观测数据当观测数据N1000时,峰度系数才可靠。时,峰度系数才可靠。(三)观察直方图(三)观察直方图 (四)累加次数曲线(四)累加次数曲线 比较数据的累加频率分布曲线与累加比较数据的累加频率分布曲线与累加正态分布概率曲线。正态分布概率曲线。6.3.4 正态分布理论在测验中的应用正态分布理论在测验中的应用(一)化等级评定为测量数据(一)化等级评定为测量数据 在心理与教育评价中,对有些心理在

39、心理与教育评价中,对有些心理量,如爱好、意志强弱等常用等级评定量,如爱好、意志强弱等常用等级评定法赋予一定的评价分数或等级分数,不法赋予一定的评价分数或等级分数,不同评价者的标准可能不同,等级分数界同评价者的标准可能不同,等级分数界线宽,不一定是等距尺度。线宽,不一定是等距尺度。 应该将等级评定等距化。应该将等级评定等距化。被评定的心理量为正态分布,才能将等级被评定的心理量为正态分布,才能将等级评定转化为等距数据。评定转化为等距数据。E D C B A表表1为为3位教师对位教师对100名学生的学习能力所作等级名学生的学习能力所作等级评定的结果。表评定的结果。表2为为3名学生从名学生从3位老师那

40、里获得位老师那里获得的评定等级,试将其转化为的评定等级,试将其转化为Z分数。分数。评定等级评定等级等级等级教师甲教师甲教师乙教师乙教师丙教师丙A A5 510102020B B252520202525C C404040403535D D252520201515E E5 510105 5总数总数100100100100100100学生学生教师甲教师甲教师乙教师乙教师丙教师丙1 1B BA AA A2 2A AB BA A3 3D DC CC C表表1 教师对学生的评定结果教师对学生的评定结果表表2 教师对教师对3名学生的评定结果名学生的评定结果学生学生教师甲教师甲教师乙教师乙教师丙教师丙平均分平

41、均分1 10.940.941.651.651.281.281.291.292 21.961.960.840.841.281.281.361.363 3-0.94-0.940 0-0.32-0.32-0.42-0.42(二)确定测验题目的难易度(二)确定测验题目的难易度 题目难易度一般用答对者的百分数确定题目难易度一般用答对者的百分数确定,但是百分数不是等距尺度,有时要比较不同难但是百分数不是等距尺度,有时要比较不同难易度题目之间的难度距离,需要将难易百分数易度题目之间的难度距离,需要将难易百分数根据正态分布概率转换为难度分数。根据正态分布概率转换为难度分数。题号题号通过率通过率未通过率未通过率

42、Z Z分数分数Z+5Z+51 10.990.990.010.01-2.331-2.3312.6692.6693 30.950.950.050.05-1.645-1.6453.3553.3555 50.850.850.150.15-1.035-1.0353.9653.965用未通过率计算用未通过率计算Z分数分数(三)划分等级分数线(三)划分等级分数线公司对新员工工作绩效进行考核。设全体公司对新员工工作绩效进行考核。设全体员工的绩效得分呈正态分布,平均得分员工的绩效得分呈正态分布,平均得分80分,标准差分,标准差12分。现根据考核结果分。现根据考核结果“奖优奖优罚劣罚劣”:对得分最高的:对得分最高

43、的10%员工提升工资员工提升工资和职位,对得分最低的和职位,对得分最低的30%员工实行换岗员工实行换岗再培训。已知甲、乙两名员工的考核得分再培训。已知甲、乙两名员工的考核得分分别是分别是90和和60分,问他们是否得到提升或分,问他们是否得到提升或换岗?换岗? 查表Z2=-0.52,Z1=1.2890分的员工不能升职,分的员工不能升职,60分的员工会轮岗分的员工会轮岗由得:谢谢!谢谢!6.4 样本分布样本分布样本分布指样本统计量的分布,在科学研样本分布指样本统计量的分布,在科学研究中,一般是通过一个样本进行分析,只究中,一般是通过一个样本进行分析,只有知道了样本统计量的分布规律,才能依有知道了样

44、本统计量的分布规律,才能依据样本对总体进行推论。据样本对总体进行推论。在谈及样本统计量的分布时,首先要保证在谈及样本统计量的分布时,首先要保证各个样本是独立的,各个样本都服从同样各个样本是独立的,各个样本都服从同样的分布。的分布。样本的取样方法应该用随机抽样的方法。样本的取样方法应该用随机抽样的方法。研究总体与从中抽取的样本之间的关系是统计学的中心内容 。对这种关系的研究可从两方面着手:(1)抽样分布:从总体到样本 ,这就是研究抽样分布(sampling distribution)的问题,统计量的概率分布称为抽样分布; (2)统计推断: 从样本到总体,这就是统计推断(statistical i

45、nference)问题。 统计推断是以总体分布和样本抽样分布的理论关系为基础的。为了能正确地利用样本去推断总体,并能正确地理解统计推断的结论,须对样本的抽样分布有所了解。 我们知道,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量(如,S)也将随样本的不同而有所不同,因而样本统计量也是随机变量, 也有其概率分布。我们把统计量的概率分布称为抽样分布。 由总体随机抽样(random sampling)的方法可分为有复置抽样和不复置抽样两种。 复置抽样:指每次抽出一个个体后,这个个体应返回原总体;不复置抽样:指每次抽出的个体不返回原总体。对于无限总体,返回与否都可保证各个体被

46、抽到的机会相等。对于有限总体,就应该采取复置抽样,否则各个体被抽到的机会就不相等。 导言一、抽样的目的一、抽样的目的 运用样本推断总体运用样本推断总体试验测定所得 样本数据样本数据; 试验目的 获得总体信息总体信息因此要研究 样本与总体关系 如何通过对样本数据的分析获得总体信息总体信息总体总体 导言总体总体 二、样本平均数及其分布:二、样本平均数及其分布: 许多许多 Si 形成形成样本样本标准差抽样分布。标准差抽样分布。 许多许多 形成形成样本平均数抽样分布。样本平均数抽样分布。由样本平均数构成由样本平均数构成的总体称为的总体称为样本平均数的抽样总体。样本平均数的抽样总体。和一个标准差和一个标

47、准差Si 。每一个样本有一个样本平均数每一个样本有一个样本平均数样本平均数样本平均数 抽样分布抽样分布 样本平均数分布样本平均数分布151164153157161182178175172175151164153164161182157161172156平均值169163原始数据的分布原始数据的分布样本平均数分布图示样本平均数分布图示n=2n=3n=4n=5n=6随机抽样1000次1. 总体分布为正态,方差已知,样本平均总体分布为正态,方差已知,样本平均数的分布为正态分布。数的分布为正态分布。平均数分布的平均数;平均数分布的标准差,一般称为标准误,可用SE表示。(7.4a) (7.4b) 2.

48、总体分布为非正态,方差已知,总体分布为非正态,方差已知,这时样这时样本足够大时本足够大时,样本平均数的分布为渐近正,样本平均数的分布为渐近正态分布。态分布。(7.5a) (7.5b) 6.4.2 样本标准差和方差分布样本标准差和方差分布151164153157161182178175172175151164153164161182157161172711.367.77标准差标准差分布图示标准差分布图示n=2n=3n=4n=5n=6随机抽样1000次的标准差 自正态分布的总体中抽取容量为自正态分布的总体中抽取容量为n的样本,的样本,当样本量足够大时当样本量足够大时(n30),样本方差及标,样本方

49、差及标准差分布趋近于正态分布。准差分布趋近于正态分布。(7.6a) (7.6b) (7.6c) 二、样本平均数及其分布:二、样本平均数及其分布: 抽样分布总体与原总体有什么关系抽样分布总体与原总体有什么关系? 与与 ? 与与 ?抽样分布总体与原总体关系如下抽样分布总体与原总体关系如下:1、样本平均数分布的平均数等于原总体、样本平均数分布的平均数等于原总体平平2、样本平均数分布的标准差等于原总体标、样本平均数分布的标准差等于原总体标即即(标准误)(标准误)准差准差除以除以均数,即均数,即标 准 误标 准 误(平均数抽样总体的标准差) 的大小反映样本平均数 的抽样误差的大小,即精确性的高低 。 标

50、准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之, 小,说明各样本平均数 间的差异程度小 , 样本平均数的精确性高。 的大小与原总体的标准差成正比,与样本含量n的平方根成反比。从某特定总体抽样 ,因为是一常数 ,所以只有增大样本含量才能降低样本平均数 的抽样误差。 注意,样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别在于: 样 本 标 准 差 S 是 反 映 样 本中各 观测值 x1 ,x2 ,xn,变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。 样本标准误是样本平均数 , , 的标准差,它是抽样误差的估计值, 其大小说明了样本间变

51、异程度的大小及精确性的高低。 对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 S,用以说明所考察性状或指标的优良性与稳定性。 对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为 , 用 以表示 所考察性状或指标的优良性与 抽样误差的大小。 3、若原分布为正态分布,平均数分布亦为正态、若原分布为正态分布,平均数分布亦为正态分布。分布。若原分布是非正态分布,当若原分布是非正态分布,当n增大时,平均数分增大时,平均数分布亦趋向正态分布。布亦趋向正态分布。所以所以n30时,可以认为新分布符合正态分布。时,可以认为新分布符合正态分布。例例3-4,某品种葡萄总体,果穗长,某品种葡萄

52、总体,果穗长=30cm,=10.8cm, 随机抽随机抽50个果穗,个果穗,所得样本平均数与所得样本平均数与相差不超过相差不超过3cm的概率是多少?的概率是多少?解:已知解:已知U= 查附表查附表3得得P P ( (y y U +0.28, +0.28,以及以及以及以及y y U -0.28) =0.78 -0.28) =0.78P P ( (U -0.28 -0.28y y U +0.28) =1-0.78=0.22=22% +0.28) =1-0.78=0.22=22% 以上做法对不对以上做法对不对 不对不对!分析:已知分析:已知、,求,求 | -|3cm的概率,求样本平均数的信息,算的概率

53、,求样本平均数的信息,算U值须用值须用 ,上面的解答错用,上面的解答错用 。?正确做法正确做法:从样本均数分布规律入手从样本均数分布规律入手样本均数分布样本均数分布解:解: U=查附表查附表查附表查附表3 3得得得得P P ( (y y U +1.96, +1.96,以及以及以及以及y y U -1.96) =0.05 -1.96) =0.05P P ( (U -1.96 -1.96y y U +1.96) =1-0.05=0.95 +1.96) =1-0.05=0.95 若题目改为某葡萄品种总体,果穗长若题目改为某葡萄品种总体,果穗长=30cm,=10.8cm,若从其中抽取,若从其中抽取50

54、个穗,个穗,问问50 穗中,长度与穗中,长度与相相差不超过差不超过3cm的果穗共有多少穗?的果穗共有多少穗?解:解:U= P=0.22=22%500.22=11(穂)(穂)例例3-5 某枇杷单果重某枇杷单果重=30g, =9.6g, 今从今从中抽取中抽取5050个个分析:已知总体分布分析:已知总体分布=30,=9.6, 问问解:解:的概率是多少?的概率是多少?的概率的概率P?样本中样本中果,其平均单果重果,其平均单果重查附表查附表3得两尾概率得两尾概率0.46,那么单尾概率,那么单尾概率=0.46/2=0.23,所所以平均单果重小于等于以平均单果重小于等于29g的概率为的概率为0.23。若将是

55、题目改成:某枇杷品种平均单果重若将是题目改成:某枇杷品种平均单果重=30g,=9.6g,问单果重小于问单果重小于29g的概率是多少的概率是多少?解:解:U=P(29X30时,时,t分布接近正态分布,方差分布接近正态分布,方差大于大于1,随着,随着n-1的增大而方差趋于的增大而方差趋于1.(二)(二)t分布表的使用分布表的使用t值p(三)样本平均数的分布(三)样本平均数的分布1. 总体分布为正态,总体分布为正态,方差未知时方差未知时,样本平,样本平均数的分布为均数的分布为t分布。分布。其中:其中:平均数分布的标准差为:平均数分布的标准差为: (7.8) 2. 当总体为非正态分布,其方差由未知时,

56、当总体为非正态分布,其方差由未知时,若满足若满足n30这一条件,样本平均数的分布这一条件,样本平均数的分布近似为近似为t分布。分布。复习复习1. 总体分布为正态,总体分布为正态,方差已方差已知知,样本平均数的分布为正,样本平均数的分布为正态分布。态分布。2. 总体分布为正态,总体分布为正态,方差未知方差未知时时,样本平均数的分布为,样本平均数的分布为t分布。分布。6.4.4 卡方分布卡方分布 2分布是统计分析中应用较多的一种分布是统计分析中应用较多的一种抽样分布。抽样分布。 从一个服从正态分布的总体中,每次从一个服从正态分布的总体中,每次随机抽取随机变量:随机抽取随机变量:由 得 : (一)卡

57、方分布的计算:(一)卡方分布的计算: 总体为正态分布,已知总体平均总体为正态分布,已知总体平均数。数。 总体为正态分布,总体平均数未总体为正态分布,总体平均数未知,可用样本平均数代替。知,可用样本平均数代替。S2分布实质是卡方分布分布实质是卡方分布df=n-1 (7.9a) (7.9b) (二)卡方分布的特点(二)卡方分布的特点df=4 df=10 df=20 1. 2分布是一个正偏分布是一个正偏态分布,分布,df越小,越偏越小,越偏斜,斜,df 时,卡方分布趋近于正态分布。时,卡方分布趋近于正态分布。2. 2值都是正值。值都是正值。3. 2分布的和也是分布的和也是2分布,其自由度为各个分布,

58、其自由度为各个卡方分布自由度之和。卡方分布自由度之和。总体总体1:总体总体2:总体总体k:4. 如果如果df2,这时卡方分布,这时卡方分布5. 2分布为连续型分布,但有些离散型分布为连续型分布,但有些离散型分布也近似分布也近似2分布。分布。(三)(三)x2分布表分布表dfdfx2大于表内所列大于表内所列x2值的概率的概率0.9950.9950.50.50.250.250.10.10.050.050.0250.0250.010.010.0050.0051 10.00000.00004 40.4550.4551.321.322.712.713.843.845.025.026.636.637.887

59、.882 20.010.011.391.392.772.774.614.615.995.997.387.389.219.2110.610.6606035.535.559.359.3676774.474.479.179.183.383.388.488.49292P6.4.5 F分布分布 设有两个正态分布的总体,其平均值设有两个正态分布的总体,其平均值与方差分别为:与方差分别为:总体1:总体2:(7.10a) 由于:由于:当从同一个总体中进行抽样时,当从同一个总体中进行抽样时,分子的自由度为分子的自由度为分母的自由度为分母的自由度为(7.10b) (7.10c) (一)F分布的特点df1=5,df

60、2=5df1=5,df2=10df1=5,df2=20df1=5,df2=1000df1=5,df2=5df1=10,df2=5df1=20,df2=51.F分布形态是一个正偏态分布,它的分布分布形态是一个正偏态分布,它的分布曲线随分子、分母的自由度不同而不同。曲线随分子、分母的自由度不同而不同。2. F总为正值。总为正值。3. 当分子的自由度为当分子的自由度为1,分母的自由度为任,分母的自由度为任意值时,意值时,F值与分母自由度相同概率的值与分母自由度相同概率的t值值(双侧概率)的平方相等。(双侧概率)的平方相等。分子自由度为分子自由度为1时,分母自由度为时,分母自由度为20时:时:自由度为自由度为20时:时:(二)(二)F分布表分布表F值附表4单侧检验P附表3双侧检验:/2/2作业第六章知识点命题题型:选择题只交电子版SPSS操作操作检验数据的正态性偏度系数偏度系数峰度系数峰度系数谢谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号