《第五章概率分布ppt课件》由会员分享,可在线阅读,更多相关《第五章概率分布ppt课件(47页珍藏版)》请在金锄头文库上搜索。
1、 第五章第五章 概率分布概率分布 第一节第一节 概率的根本概念概率的根本概念 第二节第二节 正态分布正态分布 第三节第三节 二项分布二项分布 第四节第四节 样本分布样本分布 第一节第一节 概率的概率的根本概念根本概念一、什么是概率一、什么是概率 随机事件随机事件: 在一定条件下有能够发生也有能够在一定条件下有能够发生也有能够不发生的事件。不发生的事件。 例如:投掷一枚硬币,出现正面;例如:投掷一枚硬币,出现正面; 随机抽一张扑克牌,抽出来是红随机抽一张扑克牌,抽出来是红 桃桃 概率的定义概率的定义概率是用来描画一随机事件出现能够性大小的统计目的,其值介于0和1之间,值越大表示这一随机事件发生的
2、能够性越大。1统计概率(后验概率:对随机事件进展n次观测,其中某一事件A出现的次数m与n的比值,当n趋于无穷大时,它将稳定在一个常数P上,这一常数P称为事件A发生的概率。 概率的两种定义概率的两种定义2古典概率先验概率:在以下条件下a实验的每一种能够结果是有限的;b每一个根身手件出现的能够性相等。假设根身手件的总数为n,事件A包含 m个根身手件,那么事件A的概率为 概率的两种定义概率的两种定义 二、概率的根本性质二、概率的根本性质一概率的公理系统任何一个事件出现的概率都是非负的;必然事件的概率为1;不能够事件的概率为0;任何一个随机事件的概率介于0和1之间。二概率的根本定理二概率的根本定理加法
3、定理:两个互不相容的事件加法定理:两个互不相容的事件A、B之和之和的概率等于两个事件概率之和,即:的概率等于两个事件概率之和,即: P(A+B)=P(A)+P(B) 互不相容事件:假设互不相容事件:假设A 发生,那么发生,那么B一一定不发生,定不发生, 假设假设B 发生,那么发生,那么A一定不发一定不发生,生,如:得优的概率为如:得优的概率为0.10;得良得概率为;得良得概率为0.50,按照加法定理,该生成果为优良或优,按照加法定理,该生成果为优良或优或良的概率为或良的概率为0.10+0.500.60二概率的根本定理二概率的根本定理 乘法定理:两个独立事件同时出现的概率乘法定理:两个独立事件同
4、时出现的概率等于两事件概率的乘积。等于两事件概率的乘积。 独立事件:一个事件能否出现对另外一个独立事件:一个事件能否出现对另外一个事件不产生影响。事件不产生影响。 第二节第二节 正态分布正态分布(normal distribution) 正态分布又称为常态分布,是延续随机变正态分布又称为常态分布,是延续随机变量概率分布的一种。量概率分布的一种。 ( (二二) )正态分布的特征正态分布的特征 1正态分布的方式是对称的(但对称的不一定是正态的),它的对称轴是经过平均数点的垂线。正态分布中,平均数、中数、众数三者相等,此点y值最大(0.3989)。左右不同间距的y值不同,各相当间距的面积相等,y值也
5、相等。 2正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的方式是先向内弯,然后向外弯,拐点位于正负1个规范差处,曲线两端向接近基线处无限延伸,但终不能与基线相交。 ( (二二) )正态分布的特征正态分布的特征 3正态曲线下的面积为1,由于它在平均数处左右对称,故过平均数点的垂线将正态曲线下的面积划分为相等的两部分,即各为0.50。 4正态分布是一族分布。它随随机变量的平均数、规范差的大小与单位不同而有不同的分布形状。假设平均数一样,规范差不同,这时规范差大的正态分布曲线方式低阔;假设规范差小,那么正态曲线的方式高狭。 一正态分布表的编制与构造一正态分布表的编制与构造从从Z=0Z=
6、0开开场场,逐逐渐渐变变化化Z Z分分数数,计计算算从从Z=0Z=0致致某某一一特特定定值值之之间间的的概概率率。由由于于正正态态分分布布为为对对称称分分布布,且且对对称称轴轴为为过过Z=0Z=0点点的的纵纵线线,故故当当Z Z0 0时时其其概概率率与与Z Z0 0时的概率值相等。两侧均为时的概率值相等。两侧均为0.500.50。二、正态分布表的编制与运用二、正态分布表的编制与运用正态分布表包括三栏:正态分布表包括三栏:第第一一栏栏是是Z Z分分数数单单位位,在在平平均均数数这这一一点点上上,Z=0,Z=0,在在平平均均数数以以上上曲曲线线右右侧侧分分数数为为正正值值,在在平平均均数数以以下下
7、曲曲线线左左侧侧分分数数为为负负值值。普普通通正正态态分分布布表表中中Z Z分数列到分数列到3.993.99,更详细的列到,更详细的列到5.005.00。第第二二栏栏为为密密度度函函数数或或比比率率数数值值y y,即即某某一一Z Z分分数数点点上上的的曲曲线线纵纵坐坐标标的的高高度度。在在规规范范正正态态曲曲线线下下,当当Z=0Z=0时时,y0=0.3989,y0=0.3989,是是规规范范形形状状曲曲线线中中纵纵坐坐标标具具有的最大值。有的最大值。第第三三栏栏为为概概率率值值p p,即即不不同同Z Z分分数数点点与与平平均均数数之之间的面积与总面积之比。间的面积与总面积之比。二正态分布表的运
8、用二正态分布表的运用 运运用用正正态态分分布布表表,可可以以进进展展如如下下几几个个方方面的计算:面的计算:1 1根根据据Z Z分分数数求求概概率率(p)(p),即即知知规规范范分分数数求求面面积积。有有下述三种情况:下述三种情况: 求某求某Z Z分数值与平均数分数值与平均数(Z(Z0)0)之间的概率。之间的概率。如如:Z=1,p=0.34134;:Z=1,p=0.34134;Z=1.96,p= ;Z=1.96,p= ;Z=2.58,p=Z=2.58,p=求某求某Z Z分数以上或以下的概率。分数以上或以下的概率。如求如求Z=1Z=1以上的概率是多少?以上的概率是多少?先先查查出出Z=1Z=1的
9、的概概率率p=0.34134p=0.34134,那那么么 Z=1Z=1以以上上的的概概率率是是0.5-0.341340.5-0.341340.158660.15866。求求Z=1.96Z=1.96以上的概率?以上的概率?求求Z=-1.96Z=-1.96以下的概率?以下的概率?求求Z=1.96Z=1.96以下的概率?以下的概率?求求Z=-1.96Z=-1.96以上的概率?以上的概率?求两个求两个Z Z分数之间的概率。分数之间的概率。如求如求Z=1Z=1与与Z=2Z=2之间的概率之间的概率: :0.475-0.34134=0.133660.475-0.34134=0.13366。假设假设Z Z分数
10、为一正一负那么将两个概率值相加。分数为一正一负那么将两个概率值相加。如求如求Z=-1.96Z=-1.96到到Z=+1.96Z=+1.96之间的概率,为之间的概率,为0.475+0.4750.952 2从从概概率率(p)(p)求求Z Z分分数数,即即从从面面积积求求规规范范分分数数值值。也也有有三三种种情情况况:知知从从平平均均数数开开场场的的概率值求概率值求Z Z值。值。直接查正态分布表。直接查正态分布表。如知如知p=0.25,p=0.25,求求Z Z知知位位于于正正态态分分布布两两端端的的概概率率值值求求该该概概率率值值分界点的分界点的Z Z。不能直接查表,需求用不能直接查表,需求用0.50
11、.5p,p,再查表再查表如如:求求上上端端0.050.05概概率率分分界界点点的的Z Z值值,那那么么查查0.5-0.050.5-0.050.450.45,Z=Z=假假设设知知正正态态曲曲线线下下中中央央部部分分的的概概率率,求求Z Z分分数数是是多多少。少。将中央部分值将中央部分值22,再查,再查Z Z值。值。如如求求正正态态曲曲线线中中间间部部分分0.950.95概概率率处处分分界界点点的的Z Z值值,这这时查时查0.9520.9520.4750.475的概率,的概率,Z Z1.96 1.96 3 3知知概概率率或或z z值,求求概概率率密密度度y y,即即正正态曲曲线的高。的高。 直接直
12、接查正正态分布表。分布表。一化等级评定为丈量数据一化等级评定为丈量数据将将等等级级评评定定转转化化为为丈丈量量数数据据的的方方法法是是用用各各等等级中点的级中点的Z Z分数代表该等级分数。分数代表该等级分数。四、正态分布实际在检验中的运用四、正态分布实际在检验中的运用【例例5 51 1】下下表表5 51 1是是3 3位位教教师对100100名名学学生生的的学学习才才干干所所作作等等级评定定的的结果果。表表5-25-2是是3 3名名学学生生从从3 3位位教教师那那获得得的的评定定等等级,试将其将其转化化为Z Z分数。分数。解解:学学习习才才干干的的分分布布普普通通为为正正态态,故故可可以以将将等
13、级评定转化为丈量数据进展比较。等级评定转化为丈量数据进展比较。详细步骤详细步骤1.1.求各等级的人数比率求各等级的人数比率p;p;2.2.求各等级比率值的中间值,作为该等级的中点;求各等级比率值的中间值,作为该等级的中点;3.3.求各等级中点以下的累加比率;求各等级中点以下的累加比率;4.4.用用累累加加比比率率查查正正态态分分布布表表,求求Z Z值值,该该Z Z分分数数就就是是各等级代表性的丈量值;各等级代表性的丈量值;5.5.求每个被评者的综合评定分数。求每个被评者的综合评定分数。学生学生1 1的平均成果为:的平均成果为:0.94+1.65+1.280.94+1.65+1.28331.29
14、1.29学生学生2 2的平均成果为:的平均成果为:1.96+0.84+1.2831.36学生学生3 3的平均成果为:的平均成果为:-0.94+0-0.323-0.42学学生生的的学学习习成成果果、才才干干或或智智力力等等教教育育或或心心思思景景象象,普普通通都都为为正正态态分分布布,因因此此在在研研讨讨中中总总是是从从实实际际上上假假设设研研讨讨对对象象在在总总体体上上呈呈正正态态分分布布的的。但但由由于于抽抽样样误误差差或或测测试试标标题题难难度度等等偶偶尔尔要要素素的的影影响响,实实践践得得到到的的原原始始分分数数分分布布往往往往不不是是正正态态分分布布。需需求求将将非正态的原始分数转换成
15、正态分布。非正态的原始分数转换成正态分布。二检验分数的正态化二检验分数的正态化原原始始分分数数正正态态化化的的前前提提条条件件是是:研研讨讨对对象象的的总总体体现现实实上上应应该该是是正正态态分分布布,否否那那么么就就会会歪歪曲现实。曲现实。T分数是从分数是从Z分数转化来的一种正态化的规范分数。分数转化来的一种正态化的规范分数。T=10Z+50T分数计算步骤:分数计算步骤:1.将原始分数正态化将原始分数正态化2.把正态化的把正态化的Z值代入值代入T值公式加以直线转换。值公式加以直线转换。T分数优点:分数优点:1.没没有有负负数数,假假设设出出现现小小数数时时可可以以四四舍舍五五入入,误误差差不
16、会很大。不会很大。2.它它的的取取值值范范围围比比较较符符合合百百分分制制的的记记分分习习惯惯,易易于于被人们接受。被人们接受。3.由由于于偶偶尔尔要要素素导导致致原原始始分分数数偏偏态态,运运用用T分分数数可可转转化为正态。化为正态。例例:某某研研讨讨中中随随机机抽抽取取了了180名名学学生生的的某某一一才才干干检检验验分分数数,由由于于这这些些分分数数不不是是正正态态,需需求求正正态态化化。已已有有研研讨讨阐阐明明学学生生的的总总体体才才干干分分布布为为正正态态,所所以以可可以以用用正正态态化化原原理理和和T分分数公式将其正态化。数公式将其正态化。二项分布的运用投掷硬币的实验,有投掷硬币的
17、实验,有10个硬币掷一次,个硬币掷一次,5次次正面向上的概率是多大,正面向上的概率是多大,5次或次或5次以上正次以上正面向上的概率是多大。面向上的概率是多大。第四节第四节 样本分布样本分布(抽样分布抽样分布样本分布是指样本统计量的分布,是统计样本分布是指样本统计量的分布,是统计推论的重要根据,只需知道样本统计量的推论的重要根据,只需知道样本统计量的分布规律,才干经过样本对总体进展推论,分布规律,才干经过样本对总体进展推论,并确定推论正确或错误的概率是多少。并确定推论正确或错误的概率是多少。样本平均数的分布2.总体分布非正态,但方差知,当总体分布非正态,但方差知,当n大于大于30时,时,其样本平
18、均数的分布为渐进正态分布。其样本平均数的分布为渐进正态分布。一一t t分布的特点分布的特点1.平均数为平均数为0。2.以平均值以平均值0左右对称的分布,左侧左右对称的分布,左侧t为负值,右侧为负值,右侧为正值。为正值。3.变量取值在变量取值在-+之间。之间。4.当样本容量趋于当样本容量趋于时,时,t分布为正态分布,方差为分布为正态分布,方差为1;当;当n-130以上时,以上时,t分布接近正态分布,方差大分布接近正态分布,方差大于于1,随,随n-1的增大而方差渐趋于的增大而方差渐趋于1;当;当n-130这这一一条条件件,样样本本平平均均数数的的分分布布近似为近似为t分布。分布。 2. 值都是正值
19、。3. 分布的和也是 分布。4.假设df 2,这时 分布的平均数:5. 是延续型分布,但有些离散型的分布也近似 分布。6. (二 分布表如df=1时,在 以上的概率为0.995。其以下的概率为1-0.9950.005;在 以上的概率为0.005,在其以下的概率为1-0.0050.995。它的意思是从一个正态分布的总体,每次抽取1个随机变量, 分布为在统计分析中运用于计数数据的分布为在统计分析中运用于计数数据的假设检验以及样本方差与总体方差差别能假设检验以及样本方差与总体方差差别能否显著的检验等。否显著的检验等。 四、F分布来自两个正态总体的独立样本,其方差之来自两个正态总体的独立样本,其方差之
20、比的样本分布为:比的样本分布为: 来自同一总体,来自同一总体, ,F比率:比率:2.F总为正值,由于总为正值,由于F为两个方差之比率。为两个方差之比率。3.当分子的自在度为当分子的自在度为1,分母的自在度为恣意,分母的自在度为恣意值时,值时,F值与分母自在度一样概率的值与分母自在度一样概率的t值双值双侧概率的平方相等。侧概率的平方相等。 如分子自在度为如分子自在度为1,分母自在度为,分母自在度为20时,时,F0.05(1,20)=4.35,F0.01(1,20)=8.10,查查t值表值表df=20时,时,t0.05=2.086,(t0.05)24.35,t0.01=2.845,(t0.01)2=8.10。这一点可以阐明,当组间自在度为这一点可以阐明,当组间自在度为1时即分子自在时即分子自在度为度为1,F检验与检验与t检验的结果一样。检验的结果一样。 二二F分布表分布表F0.05(2,9)=4.26 F0.05(2,9)=4.26 意思:取自同一个正态总体的两个样本的方差比值意思:取自同一个正态总体的两个样本的方差比值F F,只需,只需5 5的样本能够比的样本能够比4.264.26大。大。