心理与教育统计学第6章概率分布剖析

上传人:今*** 文档编号:106800532 上传时间:2019-10-16 格式:PPT 页数:140 大小:6.05MB
返回 下载 相关 举报
心理与教育统计学第6章概率分布剖析_第1页
第1页 / 共140页
心理与教育统计学第6章概率分布剖析_第2页
第2页 / 共140页
心理与教育统计学第6章概率分布剖析_第3页
第3页 / 共140页
心理与教育统计学第6章概率分布剖析_第4页
第4页 / 共140页
心理与教育统计学第6章概率分布剖析_第5页
第5页 / 共140页
点击查看更多>>
资源描述

《心理与教育统计学第6章概率分布剖析》由会员分享,可在线阅读,更多相关《心理与教育统计学第6章概率分布剖析(140页珍藏版)》请在金锄头文库上搜索。

1、第六章 概率分布,第6章 章节内容,6.1 概率的基本概念 6.2 正态分布 6.3 二项分布 6.4 样本分布,6.1 概率的基本概念,在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。例如掷硬币、抛骰子等 概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。,6.1.1 什么是概率,随机事件的频率,当n无限增大时,随机事件A的频率会稳定在一个常数P,这个常数就是随机事件A的概率。,(一)后验概率(或统计概率),(6.1),(6.2),观察随机事件A出现的次数的方式来决定A的概率,称为后验概率。,(二)先验概率(古典概率),古典概率模型要

2、求满足两个条件: 试验的所有可能结果(或基本事件)是有限的; 每一种基本事件出现的可能性相等。,n为基本事件的总数; m为事件A包含的基本事件的数目。,(6.3),在事件A发生之前,可以通过计算确定的概率,称为先验概率。,Dewey.G统计了约438023个字母,得到的英语中特定字母的频率,历史上的投掷硬币试验,投掷硬币的概率是后验概率与先验概率?,6.1.2 概率的基本性质,1任何随机事件的概率都是在0与1之间的正数,即: 0 P(A)1 2不可能事件的概率等于零,即: P(A)= 0 3必然事件的概率等于1,即: P(A)= 1,(一)概率的公理系统,(二)概率的加法定理,若事件发生,则事

3、件就一定不发生,这样的两个事件为互不相容事件。 两互不相容事件和的概率,等于这两个事件概率之和,即:,(6.4a),(6.4b),(三)概率的乘法定理,若事件发生不影响事件是否发生,这样的两个事件为互相独立事件。 两个互相独立事件同时出现的概率,等于这两个事件概率的乘积,即,(6.5a),(6.5b),例:某一学生从个试题中任意抽取一题,进行口试。如果抽到每一题的概率为15,则抽到试题或试题的概率是多少? 如果前一个学生把抽过的试题还回后,后一个学生再抽,则个学生都抽到试题1的概率是多少?,该学生抽到试题1或者试题2为不相容事件:,四个学生均抽到试题1为独立事件:,例:一个口袋装有6只球,其中

4、4只白球、2只红球,从袋中取球两次。 考虑两次取球方式(a)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。(b)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。 请问这两种情况下取到一只白球和一只红球的概率。,放回取样,第一次取到白球,第二次取到红球:,第一次取到红球,第二次取到白球:,取到一只白球和一只红球的概率:,不放回取样,第一次取到白球,第二次取到红球:,第一次取到红球,第二次取到白球:,取到一只白球和一只红球的概率:,问题:小明的班上有83名同学,至少有一位同学与小明的生日相同的概率?(一年按365天计算),82名同学与小明的生日均不相同的概率为:,至少

5、一位同学与小明的生日相同的概率为:,问题:83人的班上,至少两人生日相同的概率为多少?,“与小明生日相同的概率”与“班级人数”的关系,“至少两人生日相同的概率”与“班级人数”的关系,人数,概率,人数,概率,小明的小组有6人,(1)有人与小明出生月份相同的概率为多少?(2)至少2人出生月份相同的概率为多少?,(1),(2),6.1.3 概率分布类型,概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。 概率分布是总体的分布,而频率分布是样本的分布。 概率给出的是单个结果发生的可能性,概率分布是对随机变量所有可能结果的可能性分布描述,通常可以写成某个函数式形式。,学生身高次数

6、分布表,次数,频率,频率密度,150 159 168 177,150 159 168 177,150 159 168 177,151 160 169 178,151 160 169 178,151 160 169 178,学生身高次数分布图,全国学生身高概率分布图,151 160 169 178,151 160 169 178,概率,概率密度,概率分布中的曲线高度一般为概率密度,面积表示概率,横坐标为样本值; 有少数情况下,曲线高度表示概率(如P179二项分布)。,(一)离散分布与连续分布,依随机变量的类型,可将概率分布分为离散分布与连续分布。 当随机变量只取孤立的数值时,这种随机变量称为离散

7、随机变量,离散随机变量的概率分布称为离散分布。 连续随机变量的概率分布称为连续分布。 心理与教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。,(二)经验分布与理论分布,依分布函数的来源,可将概率分布分为经验分布与理论分布。 经验分布是指根据观察或实验所获得的数据而编制的次数分布或频率分布。经验分布往往是总体的一个样本。 理论分布有两个含义,一是随机变量概率分布的函数(如正态分布),二是按某种数学模型计算出的总体的次数分布(如二项分布)。,(三)基本随机变量分布与抽样分布,依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。 基本随机变量分布是随机变量各

8、种不同取值情况的概率分布,如二项分布与正态分布。 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布,如平均数分布,方差分布,相关系数分布等。,复习,古典概率与统计概率,加法原理:,乘法原理:,频率与概率 频率分布与概率分布,6.2 正态分布,正态分布也称为常态分布,是连续型随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。 心理与教育中大量的现象均按正态形式分布,如智力高低、成绩好坏、社会态度等。 正态分布由棣莫弗于1733年发现的。拉普拉斯、高斯对正态分布的研究也做出了贡献,故有时称正态分布为高斯分布。,是圆周率 3.14159 e是自然对数的底 2.

9、71828 X为随机变量取值 为理论平均数; 为理论标准差; y为概率密度,即正态分布的纵坐标。,6.2.1 正态分布的特征,正态分布的形式是对称的,它的对称轴是经过平均数的垂线。 正态分布的中央点(即平均数)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向X轴无限接近。,3. 正态曲线下的总的面积为1,经过平均数的垂线将正态曲线下的面积划分为相等的两个部分,各为0.5。 曲线下的面积为概率,可由积分公式计算:,(6.8),4. 正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位的不同而有不同的分布形态。 标准正态分布的=0, =1。标

10、准正态分布通常写作N(0,1)正态分布。,(6.9),=2, =1,=0, =1,=-2, =1,平均数决定了正态曲线在横轴上的位置,=0, =0.5,=0, =1,=0, =2,标准差大的正态曲线低阔,标准差小的正态曲线高窄,5. 正态分布中各差异量数值相互间有固定的比率。P102,P163 s=1.2533AD=1.4826Q s标准差; AD平均差; Q四分位差。,6. 正态分布曲线下,标准差与概率(面积)有一定的数量关系,6.2.2 正态分布表的编制和使用,(一)正态分布表的编制与结构 利用积分公式可求出正态曲线下任何区间的面积,但需要计算。统计学家编制了标准正态分布表,使其使用非常方

11、便。 使用正态分布表时,首先应该确定其编制方法:1)从Z=- 开始。2)Z=0开始。本书中采用Z=0开始,P概率,Y概率密度,Z分数,正态分布表一般分为三栏: 1)Z分数(X-)/,一般罗列到3.99。 2)概率密度(y)某一Z分数对应的曲线纵坐标高度。当Z=0时,y=0.3989 3)概率值(P)不同Z分数点与平均数之间的曲线下的面积。,(二)正态分布表的使用,依据Z分数求概率(p) (1)求某Z分数值与平均数(Z=0)之间的概率。,(2)求某Z分数以上或以下的概率,Z分数,(3)求两个Z分数之间的概率。,Z1,Z2,2. 从概率(P)求Z分数 (1)已知从平均数开始的概率值求Z值。,(2)

12、已知正态分布两端的概率值求该概率值分界点的Z值。,Z分数,P概率,(3)若已知正态曲线下中央部分的概率,求Z分数,Z分数,P概率,3. 已知概率或Z值,求概率密度y。,Z分数,P概率,6.2.3 次数分布的检验方法,(一)皮尔逊偏态量数法,s为标准差,SK为偏态量数; 当SK=0时,分布对称; 当SK0时,为正偏态; 当SK0时,为负偏态。,(7.1a),(7.1b),(二)峰度、偏度检验法,偏度系数:,偏度系数用来反映呈单峰的数据偏斜程度和方向。,当g1=0时,分布是对称的; 当g10时,分布为正偏态; 当g1200时,偏度系数才可靠。,(7.2),峰度系数用来反映呈单峰的数据表现出来的峰态

13、情况,峰度系数:,(7.3),g20 高窄,g2=0 正态,g20 低阔,当观测数据N1000时,峰度系数才可靠。,(三)观察直方图,(四)累加次数曲线 比较数据的累加频率分布曲线与累加正态分布概率曲线。,6.2.4 正态分布理论在测验中的应用,(一)化等级评定为测量数据,在心理与教育评价中,对有些心理量,如爱好、意志强弱等常用等级评定法赋予一定的评价分数或等级分数,不同评价者的标准可能不同,等级分数界线宽,不一定是等距尺度。 应该将等级评定等距化。,被评定的心理量为正态分布,才能将等级评定转化为等距数据。,表1为3位教师对100名学生的学习能力所作等级评定的结果。表2为3名学生从3位老师那里

14、获得的评定等级,试将其转化为Z分数。,表1 教师对学生的评定结果,表2 教师对3名学生的评定结果,(二)确定测验题目的难易度,题目难易度一般用答对者的百分数确定,但是百分数不是等距尺度,有时要比较不同难易度题目之间的难度距离,需要将难易百分数根据正态分布概率转换为难度分数。,用未通过率计算Z分数,(三)划分等级分数线,公司对新员工工作绩效进行考核。设全体员工的绩效得分呈正态分布,平均得分80分,标准差12分。现根据考核结果“奖优罚劣”:对得分最高的10%员工提升工资和职位,对得分最低的30%员工实行换岗再培训。已知甲、乙两名员工的考核得分分别是90和60分,问他们是否得到提升或换岗?,查表Z2

15、=-0.52,Z1=1.28,90分的员工不能升职,60分的员工会轮岗,由,得:,6.3 二项分布,二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创立的,所以又叫贝努里分布。 二项分布是心理与教育统计中常用的一种基本随机变量分布。,6.3.1 二项试验,二项试验又称为贝努里试验,它必须满足以下几个条件: 任何一次试验恰好有两个结果,成功与失败。 共有n次试验,并且n是预先给定的任一正数。 每次试验各自独立,各次试验之间无相互影响。 某种结果出现的概率在任何一次试验中都是固定的。,是否为二项试验? (1)投掷硬币试验 (2)一个口袋装有6只球,其中4只白球、2只红球,从袋中取球两次。 (a)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。 (b)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。,6.3.2 二项分布函数,二项定理:,项数:二项展开式中共有n1项。 指数:p的指数,从n0下降;q指数从0n为上升。每项p与q指数之和等于n。 系数:n个元素中依次取0n个元素的组合数。,1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 1 0 10 5 1 1 6 15 20 15 6 1,杨辉三角形,用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号