文档详情

心理与教育统计学课件(张厚粲版)ch6概率分布电子教案

yuzo****123
实名认证
店铺
PPT
389KB
约50页
文档ID:141376423
心理与教育统计学课件(张厚粲版)ch6概率分布电子教案_第1页
1/50

第六章 概率分布第一节 概率的基本概念,一、概率的意义: 什么是概率: 随机事件是指在一定条件下可能出现也可能不出现的事件,表明随机事件出现可能性大小的客观指标就是概率 后验概率 在对随机事件进行n次观测时,其中某一随机事件A出现了m次,则m/n称为事件A出现的频率随着试验次数的增加,事件A的频率将稳定在某一常数p,则此常数p就是事件A出现概率的近似值,可表示为: 以随机事件A在大量重复试验中出现的稳定频率值作为随机事件A的概率估计值,这种求得的概率叫做后验概率第一节 概率的基础知识,一、概率的意义: 先验概率: 先验概率是通过古典概率模型加以定义的,故又称之古典概率古典概率要求满足两个条件:试验的所有可能结果(即基本事件)是有限的;每一种基本事件出现的可能性相等如果基本事件的总次数为n,事件A包括m个基本事件, 则事件A的概率为: 先验概率是在特定条件下计算出来的,是随机事件的真实概率,不是由频率估计出来的当试验重复次数较多时,后验概率也就接近先验概率二、概率的基本性质与定理,基本性质 任一随机事件A的概率取值范围都在0与1之间,即 必然事件(是指在一定条件下必然发生的事件,记做)的概率等于1,即 。

不可能事件(是指在一定条件下必然不发生的事件,记做)的概率等于0,即,二、概率的基本性质与定理,乘法定理: 两个独立事件同时都发生的概率,等于这两个事件概率的乘积用公式表示: 所谓独立事件是指一个事件的出现对另一个事件 的出现不发生影响,如果事件A的概率随事件B是否出现而改变,事件B的概率随事件A是否出现而改变,则这两个事件称为相关事件乘法定理也可推广到有限多个独立事件中,即: 推论:有限个独立事件都同时发生的概率,等于这些概率的乘积即,例题,例2:某专业研究生复试,让考生从6个试题中任意抽取一题进行口试,若抽到每1题的概率为1/6,前一考生抽过的试题再放回,后一考生再抽,问2个考生都抽到试题1的概率是多少? 例3: 掷骰子游戏中,两个骰子掷一次时,问掷得11点数的概率是多少?,三、概率分布的类型,概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述 离散分布和连续分布:按照随机变量是否具有连续性来划分 离散分布:随机变量只取孤立的数值时,这种随机变量称之离散型随机变量,离散随机变量的概率分布,简称离散分布常见的离散分布是二项分布 连续分布:指连续随机变量的概率分布, 也就是测量数据的概率分布,它用连续随机变量的分布函数描述其分布规律。

常见的连续随机变量的分布为正态分布三、概率分布的类型,经验分布和理论分布:如果按照分布函数的来源来划分,则可分为经验分布和理论分布 经验分布:是指根据观察或试验所获得的数据而编制的次数分布或相对频率分布 理论分布:有两个含义,一是指随机变量的次数函数数学模型;二是指按照某种数学模型计算出的总体的次数分布三、概率分布的类型,基本随机变量分布和抽样分布: 如果按照概率分布所描述的数据特征来划分, 则可分为基本随机变量分布和抽样分布 基本随机变量分布:是指理论分布中描述总体的基本变量的分布,在教育界统计学中常用 的基本随机变量分布有二项分布和正态分布 抽样分布:是样本统计量的理论分布,样本统计量有;平均数、两平均数之差、方差、标准差、相关系数、百分比率等等样本统计量是基本随机变量的函数,所以抽样分布又叫随机变量函数的分布第二节 正态分布,一、正态分布和正态曲线的特征 正态分布:正态分布也称常态分布或常态分配,是连续随机变量概率分布的一种最早由棣莫弗(De.Moivre)于1733年发现的,其后拉普拉斯(Laplace)和高斯(Ganss)对正态分布的研究也做出了很大的贡献,故有时称正态分布为高斯分布。

定义:对于连续随机变量X,如果它的分布密度函数为: 其中和为待定参数(即理论平均数和理论标准差),且0,则称随机变量X服从正态分布一、正态分布和正态曲线的特征,正态分布:正态分布的图形称做正态曲线,它的形状为钟形线,由正态分布的函数表达式来刻划 由于每个正态分布的,和N的不同,正态曲线也就不同这样,随着,和N的不同就形成一簇不同的正态曲线如果把原始分数X改为标准分数Z=(X-)/,即把零点沿横轴移到点,并以为单位,把Y轴的尺度由频数改为频率,于是就由频率总和1代替频数总和N,这样不仅不影响正态分布的固有特征,而且还把所有绝对量数表示总体参数和的正态分布函数,都变成了以平均数为0,标准差为1的正态分布函数,这种平均数为0,标准差为1的正态分布又叫标准正态分布其分布函数为:,正态分布的特征:,正态曲线在X=点取得最大值,即 标准正态分布曲线在Z=0点取得最大值,即 正态曲线关于直线X=对称(但对称的不一定是正态的),即随机变量X在的对称区间上取值的概率相等显然标准正态分布关于直线Z=0对称 正态曲线下的面积为1,过平均数点的垂线将正态曲线下的面积划分为相等的两部分,即各为0.50. 因正态曲线下每一横坐标所对应的面积与总面积之比,其值等于该部分面积值,故正态曲线下的面积可视为概率,即值为每一横坐标值( 加减一定标准差)的随机变量出现的概率。

一、正态分布和正态曲线的特征,正态分布的特征: 正态分布是一族分布它随随机变量的平均数、标准差的大小与单位而有不同的分布形态平均数决定正态曲线在横轴上的位置;当固定时,越小,则正态曲线越高狭,越大, 则正态曲线则越低阔 正态曲线从最高点向左右延伸时,在正负1个标准差之内, 即向下又向内弯,从正负1个标准差开始,即向下又向外弯,即拐点位于正负1个标准差处 正态曲线下,标准差与概率(面积)有一定的数量关系如正负1个标准差之间,包含总面积的68.26%,正负1.96个标准差之间包含总面积的95%,正负2.58个标准差之间,包含总面积的99%更详细的数量关系,可通过查附表1得出二、正态曲线表的编制与使用,正态曲线表的编制: 根据正态分布的密度函数,可用积分计算不同Z值时,正态曲线下面积与密度函数值(Y值)有两种不同的编制方法:一种是从Z=-开始,所用的计算分式为: 另一种是从Z=0开始所用的计算公式为:,二、正态曲线表的编制与使用,正态曲线表的编制: 正态分布表一般有三栏:第一栏是Z分数,即横轴上某一点与平均数的差度, 以标准差为单位,一般在平均数这一点上Z=0, 一般正态表Z分数从0到3.99。

更详细的有列到5.00的 第二栏是Y值,即某一Z分数点上的曲线纵坐标的高度; 第三栏是概率值,常标为p,不同Z分数与平均数之间的面积与总面积之比,也就是某一Z值到Z=0之间的面积正态分布表的基本使用方法,已知Z值求概率: 求某一Z值与Z=0之间的概率直接查表即可如: 某一Z值以上或以下的概率如求Z=1以上的概率, 又如求Z=1以下的概率正态分布表的基本使用方法,巳知Z值求概率: 求两个Z值之间的概率正态分布表的基本使用方法,由概率(p)求Z值 已知从平均数开始的概率值求Z值(直接查表) 求两端概率的Z值 已知正态曲线下中央部分的概率求Z值 求概率密度Y(即正态曲线的纵线高) 已知Z值(直接查表) 已知P值 注意区分已知概率是位于正态曲线的中间部分,还是两尾端部分三、次数分布是否正态的检验方法,皮尔逊偏态量数法: 在次数分布中,有的符合正态分布,有的不符合正态分布,其中最常见的是偏态分布,这种分布有两种:一种是正偏态,另一种是负偏态 皮尔逊发现在偏态分布中,平均数距离中数较近,距离众数较远在正偏态中MMdM0在负偏态中, MMdM0 在正态分布中三者重合于一点于是根据三者的这种关系,提出一个偏态量数公式,用来描述分布的形态: 当SK=0时,分布对称(但不一定是正态);当SK0时,分布属于正偏态;当SK<0时,分布属于负偏态。

峰度、偏度检验法,偏态系数: 当 =0,分布呈对称形态;当 0时,分布为正偏态;当 200时,所计算的偏态系数才比较可靠 峰度系数: 当 =0时,分布呈正态分布的峰度;当 0时,分布的峰度比正态分布的峰度低阔;当 1000时,所计算出的峰度系数才比较可靠累加次数曲线法,由于标准正态分布的形态固定,因此其累加概率与标准差的关系也相应固定根据此种情况,可把一般分布的累加概率与标准正态分布累加概率相比较通常这种比较是在累加正态分布概率图纸上进行其具体步骤为: 将原始数据绘制次数分布表,计算各组上限以下的累加频率,求平均数和标准差 计算各组的组上限与平均数的离差x,即(上限-平均数),然后求各组Z分数 在概率作图纸上画出正态累加概率曲线,然后画出实际观测数据的累加频率曲线; 在图上进行两曲线的比较如果两曲线完全重合,则说明某样本的分布呈正态,若样本的累加频率曲线偏离正态曲线较大时,则不服从正态分布四、正态分布在测验中的应用,确定测验题目的难易度: 具体步骤: 计算各题目的通过率即答对人数与总人数的比率 根据通过率查正态表求Z值用0.5减去通过率,不计正负号,作为查正态分布表的概率值p 依照p值查正态表中相应的Z值,通过率大于50%的Z值记为负值,通过率小于50%的Z值记为正值。

将查表求得的Z加上5(假定正负5个标准差包括了全体),便可得到从010的十进制的难度分数值表6-5 试题难度分数的计算表,确定录取分数线,在一些选拔性考试中,录取的人数(或比率)往往是事先确定的如果考试分数服从正态分布或接近正态分布,在确定录取分数线时,可以把录取人数的比率作为正态分布中的上端面积,由此找出相对应的标准分数Z,然后根据标准分数的计算公式 的变形公式 由Z值来求原始分数X,这个X就是录取分数的分界点,即平时人们称谓的录取分数线例9 某地区进行公务员考试,准备在参加考试的1500人中录取180人,考试分数接近正态分布,平均数为72分,标准差是12.5分,问录取分数线是多少?,解:录取率:180/1500=0.12,即正态分布上端的面积,然后根据0.5-0.12=0.38,查附表1得出最接近0.38的p值为0.3810,它所对应的Z=1.18 录取分数线:,确定能力分组或等级评定的人数,如果学生知识能力的水平呈正态分布,欲将他们分成等距的几个等级或几个组,在确定各等级人数时,可把正态分布中Z=-3至Z=3之间6个标准差的距离分成相等的几份(因为正态分布在X=3之间的面积为0.9973,几乎包括了全体),即将6个标准差除以分组或等级的数目,作到Z分数等距,然后查附表1求出各组Z分数之间的面积,将各组的概率乘以总人数,则可得到各等级或分组应有的人数。

例10 若有100人某种能力呈正态分布,欲将其分成5个等距的等级,问各等级应有的人数解:65=1.2,每个等级应占1.2个标准差的距离,确定各等级的Z值界限,然后查表,计算下表:,测验分数的正态化,学生的学业成绩、能力、智力等教育或心理现象,一般都呈正态分布因此在研究中我们总是从理论上假设所研究的对象在总体上服从正态分布但是,往往由于一些偶然因素如抽样误差、题目难易等方面的影响,使得测验分数的分布与理论上的正态分布不一致,要解决总体是正态的问题,可以采用一定的统计方法将非正态的原始分数转换成正态分布,迫使其恢复本来面目,这一转换过程我们称之为测验分数的正态化 注意:原始分数正态化是有一定条件的,即要求研究对象的总体事实上呈正态分布,如果研究对象的总体事实上不是正态分布,那么强迫原始分数正态化,就会歪曲事实,这是我们在使用正态化标准分数必须注意的问题测验分数的正态化,T分数:T分数是从Z分数转换而来的一种正态化的标准分数它是将标准分数扩大10倍,再加上50 即:T=10Z+50 T分数由美国教育测量学家麦柯尔(W.A.Mecall)提出的,其取值范围为0,100,比较符合人们的记分习惯。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档