《概率与概率分布》PPT课件.ppt

上传人:hs****ma 文档编号:576657145 上传时间:2024-08-20 格式:PPT 页数:62 大小:688.10KB
返回 下载 相关 举报
《概率与概率分布》PPT课件.ppt_第1页
第1页 / 共62页
《概率与概率分布》PPT课件.ppt_第2页
第2页 / 共62页
《概率与概率分布》PPT课件.ppt_第3页
第3页 / 共62页
《概率与概率分布》PPT课件.ppt_第4页
第4页 / 共62页
《概率与概率分布》PPT课件.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《《概率与概率分布》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《概率与概率分布》PPT课件.ppt(62页珍藏版)》请在金锄头文库上搜索。

1、o掌握概率的概念、性质和法则掌握概率的概念、性质和法则o明明确确概概率率分分布布的的含含义义,了了解解二二项项试试验验和和分分布布的基础知识。的基础知识。第五章第五章 概率及概率分布概率及概率分布 概率论起源于概率论起源于17世纪,当时在人口统计、人世纪,当时在人口统计、人寿保险等工作中,要整理和研究大量的随机数据资寿保险等工作中,要整理和研究大量的随机数据资料,这就需要一种专门研究大量随机现象的规律性料,这就需要一种专门研究大量随机现象的规律性的数学。的数学。 参赌者就想:如果同时掷两颗骰子参赌者就想:如果同时掷两颗骰子 ,则点数,则点数之和为之和为9 和点数之和为和点数之和为10 ,哪种情

2、况出现的可能,哪种情况出现的可能性较大?性较大? 例如例如17世纪中叶,贵族德世纪中叶,贵族德梅尔发现:将一枚梅尔发现:将一枚骰子连掷四次,骰子连掷四次,只只出现一个出现一个6 点的机会比较多,而点的机会比较多,而同时将两枚掷同时将两枚掷24次,次,只只出现一次双出现一次双6 的机会却很的机会却很少。少。第一节第一节 概率的一般概念概率的一般概念 概率论的创始人是法国的帕斯卡概率论的创始人是法国的帕斯卡概率论的创始人是法国的帕斯卡概率论的创始人是法国的帕斯卡(1623(16231662)1662)和和和和费尔马费尔马费尔马费尔马(1601(16011665)1665),他们在以通信的方式讨论赌

3、博,他们在以通信的方式讨论赌博,他们在以通信的方式讨论赌博,他们在以通信的方式讨论赌博的机率问题时,发表了的机率问题时,发表了的机率问题时,发表了的机率问题时,发表了骰子赌博理论骰子赌博理论骰子赌博理论骰子赌博理论一书。棣莫弗一书。棣莫弗一书。棣莫弗一书。棣莫弗(1667(16671754)1754)发现了正态方程式。同一时期瑞士的伯发现了正态方程式。同一时期瑞士的伯发现了正态方程式。同一时期瑞士的伯发现了正态方程式。同一时期瑞士的伯努利努利努利努利(1654(1654一一一一1705)1705)提出了二项分布理论。提出了二项分布理论。提出了二项分布理论。提出了二项分布理论。18141814年

4、,年,年,年,法国的拉普拉斯法国的拉普拉斯法国的拉普拉斯法国的拉普拉斯(1749(17491827)1827)发表了发表了发表了发表了概率分析论概率分析论概率分析论概率分析论,该书奠定了古典概率理论的基础,并将概率理论应用于自该书奠定了古典概率理论的基础,并将概率理论应用于自该书奠定了古典概率理论的基础,并将概率理论应用于自该书奠定了古典概率理论的基础,并将概率理论应用于自然和社会的研究。此后,法国的泊松然和社会的研究。此后,法国的泊松然和社会的研究。此后,法国的泊松然和社会的研究。此后,法国的泊松(1781(17811840)1840)提提提提出了泊松分布,德国的高斯出了泊松分布,德国的高斯

5、出了泊松分布,德国的高斯出了泊松分布,德国的高斯(1777(17771855)1855)提出了最小提出了最小提出了最小提出了最小平方法。平方法。平方法。平方法。一、频率和概率的定义一、频率和概率的定义 1. 1. 频率频率 对对随随机机现现象象进进行行观观测测时时,若若事事件件在在次次观观测测中中出出现现了了次次, ,则则与与的的比比值值,就就是是事事件件出出现现的的频频率率(也也称称为为相相对对频频数数)。用用 ()表表示示事事件件的频率。的频率。公式为:()公式为:()= =/ /2. 概率概率o概率是对随机事件出现可能性大小的客观量度。概率是对随机事件出现可能性大小的客观量度。事件发生的

6、概率记为事件发生的概率记为P P()。()。o在相同的条件下,某个事件在相同的条件下,某个事件A A发生的概率是一个发生的概率是一个常数。常数。o根据概率的计算方法,概率可分为后验概率和先根据概率的计算方法,概率可分为后验概率和先验概率。验概率。 后验概率(统计概率)后验概率(统计概率)o以随机事件以随机事件A A在大量重复试验中出现的稳定频率在大量重复试验中出现的稳定频率作为随机事件作为随机事件A A概率的估计值。概率的估计值。o事件事件A A的频率不是常数的频率不是常数, ,它随试验次数的变化而变它随试验次数的变化而变化,但是随着试验次数的无限增大,事件化,但是随着试验次数的无限增大,事件

7、A A的频的频率会逐渐趋近于一个常数率会逐渐趋近于一个常数P P,P P就是随机事件就是随机事件A A出出现概率的近似值。现概率的近似值。 先验概率(古典概率)先验概率(古典概率)o如果某个随机现象所有可能结果是有限的,其总数为n,每一种可能结果出现的可能性相等,这个现象中的随机事件A包括m个可能结果,则事件A的概率为与的比值,即 P(A)=/。o例:某班有20名男生,25名女生,现随机从全班同学中抽取一名同学,抽到男生的概率为20/45=4/9,抽到女生的概率为25/45=5/9。二、概率的性质二、概率的性质1. 对于任何事件,均有对于任何事件,均有0()()12. 不可能事件的概率为零,不

8、可能事件的概率为零,P(V)=03. 必然事件的概率为必然事件的概率为1,P(U)=11. 概率的加法概率的加法 互不相容事件:在一次试验中不可能同时出现的事件。 事件之和:有限个互不相容事件中任意一个发生。如:A+B=A或B发生。 概率的加法法则:有限个互不相容事件之和的概率等于这些事件概率的和。 例:某学生从5个试题中任意抽取一题,则抽到试题2或试题3的概率为2/5。三、概率的加法和乘法三、概率的加法和乘法 例:根据上海市职业代际流动的统计,向下流动的概率是0.07,静止不动的概率是0.6,求向上流动的概率是多少? 例:为了研究父代文化程度对子代文化程度的影响,某大学统计出学生中只有父亲具

9、有大学文化程度的占30,只有母亲具有大学文化程度的占20,而双方都具有大学文化程度的占有10,问从学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少?2. 概率的乘法概率的乘法独立事件:出现概率相互不影响的事件。事件之积:有限个互相独立事件同时发生。如: AB=A和B同时发生。概率的乘法法则:有限个独立事件乘积的概率等于这些事件概率的乘积。例:两个学生从5个试题中任意抽取一题,第一个学生把抽出的题还回去后,第二个学生再抽,则两个学生都抽到试题2的概率为1/25。 例:根据统计结果,男婴出生的概率是例:根据统计结果,男婴出生的概率是22/4322/43,女,女婴出生的概率是婴出生的概率是

10、21/4321/43,某单位有两名孕妇,问两名孕,某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?都生女婴的概率是多少?妇都生男婴的概率是多少?都生女婴的概率是多少?其中一男一女的概率是多少?其中一男一女的概率是多少?o随机事件及其概率回答的是随机现象某一局部结随机事件及其概率回答的是随机现象某一局部结果,例如对给定的复合事件求先验概率。而概率果,例如对给定的复合事件求先验概率。而概率分布则要在满足完备性分布则要在满足完备性(穷举穷举)和互不相容性和互不相容性(互斥互斥)的前提下,回答随机现象一共会出现多少种结果,的前提下,回答随机现象一共会出现多少种结果,以及每种结果所伴随的概率是多少。以

11、及每种结果所伴随的概率是多少。o应该指出,在统计中,概率分布是就随机现象呈应该指出,在统计中,概率分布是就随机现象呈现的宏观结果而言的。它可以在宏观层次加以识现的宏观结果而言的。它可以在宏观层次加以识别而与特定排列次序无关。别而与特定排列次序无关。四、概率分布四、概率分布X23456789101112合计P(X) 例如掷两颗骰子的试验,点数就是随机现象,它例如掷两颗骰子的试验,点数就是随机现象,它一共有一共有1111种宏观结果。我们用古典法对每种宏观结果种宏观结果。我们用古典法对每种宏观结果计算计算P P,便得到了如下表所示的概率分布。,便得到了如下表所示的概率分布。 频率分布与概率分布的区别

12、频率分布与概率分布的区别经验分布:经验分布:频率分布是经资料整理而来频率分布是经资料整理而来;频频率分布随样本不同而不同率分布随样本不同而不同;频率频率分布有对应的频数分布。分布有对应的频数分布。理论分布:理论分布:概率分布是先验的;概概率分布是先验的;概率分布是唯一的;概率率分布是唯一的;概率分布无频率分布所对应分布无频率分布所对应的频数分布。的频数分布。o概率分布是理论性的或理念性的,它描绘了在一个完美的世界中百分比应该是多少。不幸的是,根据现实的(实际得到的)数据得到的百分比和理论上的总是不完全一致。o假设把两枚硬币投1000次,得到的结果为下表:正面的数量频数(f)百分比(%)0253

13、25.3149949.9224824.8总计1000100.0o概率分布实质上是无限次抛掷的频数分布。尽概率分布实质上是无限次抛掷的频数分布。尽管我们永远不能观察到这个无限次抛掷的频数管我们永远不能观察到这个无限次抛掷的频数分布,但我们知道这是的频数分布会无限接近分布,但我们知道这是的频数分布会无限接近概率分布。概率分布。四、概率分布四、概率分布 概率分布:对随机变量取值的概率分布情况用数学 方法进行描述。 根据随机变量取值情况可分为:离散变量概率分布 连续变量概率分布离散变量概率分布离散变量概率分布o离散型随机变量的取值是可数的,如果对X的每个可能取值xi计算其实现的概率Pi ,我们便得到了

14、离散型随机变量的概率分布,即离散型随机变量的概离散型随机变量的概率分布也可以用表格率分布也可以用表格和图形两种形式来表和图形两种形式来表示。由于离散型随机示。由于离散型随机变量的特点,表示离变量的特点,表示离散型随机变量概率分散型随机变量概率分布多为折线图。布多为折线图。离散变量概率分布离散变量概率分布o连续型随机变量的取值充满某一区间,因而取某一数值讨连续型随机变量的取值充满某一区间,因而取某一数值讨论其概率是无意义的。为此,我们引进概率密度论其概率是无意义的。为此,我们引进概率密度 的概念来表达连续型随机变量的概率分布。的概念来表达连续型随机变量的概率分布。o前面曾提到过频率密度的概念,频

15、率密度等于频率除以组距。以频率密度为纵坐标,可以作出频率分布直方图。类似地,以概率密度为纵坐标,可以作出概率密度曲线。所不同的是,概率密度由于对组距求了x0的极限,其图形乃平滑曲线。(x)j2. 连续型变量概率分布连续型变量概率分布这样,随机变量这样,随机变量X取值在区间取值在区间x1 ,x2上的概率等于概率密度曲上的概率等于概率密度曲线线 下面下面x1与与x2两点之间面积,即两点之间面积,即 所以有概率密所以有概率密度的性质度的性质因为概率不可能是负的,且因为概率不可能是负的,且 和 (离散变量)或 (连续变量)的关系,就像向上累计频率和频率的关系一样。不同之处在于, 累计的是概率。但使用分

16、布函数的好处是很明显的,它不仅在数学上统一了对离散型随机变量和连续型随机变量概率的研究,而且由于它计算概率的起点都固定为,因而可以把概率值换算成表,以易于求得任何区间的概率,从而达到计算快捷和应用广泛之目的。例:求两颗骰子点数的分布函数。例:求两颗骰子点数的分布函数。X23456789101112合计合计P(X)F(X)一、二项试验一、二项试验o二项试验:满足以下条件的试验。 1. 一次试验只有两种可能结果,可记为成功和失败; 2. 各次试验之间相互不影响,即相互独立; 3. 各次试验中两种结果的概率保持不变。第二节第二节 二项分布二项分布 从掷硬币的试验入手。假定二项试验由重复抛掷n次硬币组

17、成,已知硬币面朝上(成功)的概率是p,面朝下(失败)的概率是q (显然有 q1p)。这样,对试验结果而言,成功的次数(即硬币面朝上的次数)X是一个离散型随机变量,它的可能取值是0,1,2,3,n。而对X的一个具体取值x而言,根据乘法规则,我们立刻可以就试验结果计算出一种特定排列方式(先x次面朝上,而后nx次面朝下)实现的概率,即 ppppqqqqpxqn-x二、二项分布函数二、二项分布函数 光考虑乘法规则是不够的,还要考虑加法规则,于是光考虑乘法规则是不够的,还要考虑加法规则,于是就就x次成功和(次成功和(nx)次失败这个宏观结果而言所包含)次失败这个宏观结果而言所包含的所有排列的方式数,用符

18、号表示的所有排列的方式数,用符号表示 这样,我们就得到了二项试验中随机变量这样,我们就得到了二项试验中随机变量X的概率分的概率分布,即布,即 譬如,二项试验是将一枚譬如,二项试验是将一枚硬币重复做硬币重复做8次抛掷,假设次抛掷,假设这枚硬币是无偏的,即这枚硬币是无偏的,即 pq0.5,那么恰好得到,那么恰好得到5次次面朝上的概率是面朝上的概率是 硬币面朝上数x 概率P(X=x) 012345678 1/256= .004 8/256= .031 28/256= .109 56/256= .219 70/256= .274 56/256= .219 28/256= .109 8/256= .03

19、1 1/256= .004合 计 1.000 同理,我们也可以求出这个二项试验中硬币刚好为0,1,2,8次面朝上的各种宏观结果的概率。o例:从男生占2/5的学校中随机抽取6个学生,正好抽到4个男生的概率是多少?o解:这是一个二项试验,试验次数n=6,每次抽取中抽到男生的概率p=2/5=0.4,抽不到男生的概率q=3/5=0.6,此题要求抽到4个男生,即X=4,根据二项分布函数可得:三、二项分布的平均数和标准差三、二项分布的平均数和标准差o当二项试验的次数当二项试验的次数n比较大时,二项分布接近正态比较大时,二项分布接近正态分布,此时在分布,此时在n次二项试验中成功事件出现次数的次二项试验中成功

20、事件出现次数的平均数和标准差分别为:平均数和标准差分别为: o例:从男女各占例:从男女各占1/2的学校中随机抽的学校中随机抽10名学生,名学生,从理论上说,平均应抽到男生从理论上说,平均应抽到男生5人,标准差为人,标准差为1.58九个二项分布九个二项分布B(5,p) (p0.1到到0.9)的概率分布图的概率分布图四、二项分布图四、二项分布图o当n趋近于无限大时,二项分布接近于正态分布;o当p=q,不管n多大,二项分布呈对称形;o当pq,且n相当小时,图形呈偏态,pq与pq偏斜方向相反;o当pq且np5,或者pq且nq5时,二项分布近似正态分布。五、二项分布的应用五、二项分布的应用1. 求二项试

21、验中成功事件出现X次的概率;2. 判断二项试验结果的机遇性和真实性;3. 用于推断统计。练习o一名参加古代史期中考试的学生遇到了两个在他缺席的一堂课中讲述的问题,所以他决定采用随机猜测的方法给出答案。下面的概率格式多少?n对错题的答案正确;n单选题的答案正确;n对错题和单选题的答案都正确;n对错题和单选题的答案都不正确;n对错题的答案正确,单选题的答案不正确;n对错题的答案不正确,单选题的答案正确。练习练习o一名参加古代史期中考试的学生遇到了两个在他缺席的一堂课中讲述的问题,所以他决定采用随机猜测的方法给出答案。下面的概率各是多少?n对错题的答案正确;n单选题的答案正确;n对错题和单选题的答案

22、都正确;n对错题和单选题的答案都不正确;n对错题的答案正确,单选题的答案不正确;n对错题的答案不正确,单选题的答案正确。第三节第三节 正态分布正态分布o理解正态分布的意义和特征。o理解标准分数的意义,掌握标准分数的转化方法并能应用。o理解标准正态分布的意义和特征,能熟练使用标准正态分布表。o了解正态分布的应用。学习目标学习目标一、正态分布一、正态分布1. 正态分布的数学形式o正态分布又称为常态分布,是一种连续型随机变量的概率分布。正态曲线函数为:2. 正态分布性质正态分布性质(1)正态曲线以x=呈钟型对称,均值=中位数=众数(2)在x=处,概率密度最大;当区间离越远,x落在这个区间的概率越小。

23、 (3)正态曲线的外形由值确定。对于固定的值,不同均值的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置 。(4)对于固定的值,改变值,值越小,正态曲线越陡峭;值越大,正态曲线越低平。固定,固定,变动变动固定,固定,变动变动3. 正态曲线的特点正态曲线的特点o曲线不止一条,而是有一个正态曲线族。o曲线随着分布的、N的变化而变化。o曲线在平均数处为最高点。o以平均数为中心,形成中间高,两侧逐渐降低的对称分布。o以横轴为渐进线。三、标准正态分布三、标准正态分布1. 标准正态分布:平均数为0,标准差为1的正态分布。分布函数为:标准正态曲线是一个以Z=0(平均数)为中心的双侧对称曲

24、线,曲线在Z=0处为最高点,两侧逐渐降低,并无限延伸,但永不与基线相交。o由于把一组原始数据转化成Z分数之后,这组Z分数的平均数为0,标准差为1,因此,只要将自变量X转化成标准分数Z,就可以将任何一个正态分布转化为标准正态分布。2. 标准正态分布表标准正态分布表o结构:结构:(教材323页附表1) (1)Z值(Z0) (2)Y值:Z值的纵线高度(概率) (3)P值:某个Z值到Z=0之间的概率o用途:用途: (1)已知Z值查Y值、P值 (2)已知P值查Z值、Y值o查表方法查表方法 (1)已知Z值查Y值 Z为正数时直接查表;Z为负数时以Z的绝对值查表。 例:Z=1时,以Z=1查表,对应的Y=0.2

25、4179。 (2)已知Z值查P值:Z=0到某个Z值之间的P Z为正数时直接查表,Z为负数时以Z的绝对值查表。 例:Z= 1时,以Z=1查表,P=0.34134,即Z=0于Z= 1之间的概率为0.34134。(2)已知Z值查P值:两个Z值之间的P 两个Z值符号相同,它们之间的P等于两个Z值与Z=0之间的概率之差。 例:Z=2与Z=1之间的概率为: P=0.47725 0.34134=0.13591 两个Z值符号相反,它们之间的P等于两个Z值与Z=0之间的概率之和。 例:Z= 2与Z=1之间的概率为: P=0.47725+0.34134=0.81859(2)已知Z值查P值:一个Z值以上或以下区间的

26、P 第一步:查出Z与Z=0之间的P 第二步:计算0.5 P或0.5+P 例:Z=1以上区间的概率 P=0.50.34134=0.15866 Z=1以下区间的概率 P=0.5+0.34134=0.84134(3)已知P值查Z值、Y值oP为Z=0以上或以下某个区间的概率时,直接以P值查表。 例: Z=0以上一个区间的概率为0.25,在表P列找到和0.25最接近的0.24857,查得Z=0.67,Y=0.31874。 如果区间是Z=0以下,则把查出的Z值加上负号即可,Y值不变。pP为正态曲线上端或下端某个区间的概率,且P0.5时,用0.05P的值查表。 例:正态曲线上端一个区间的P=0.05,求得0

27、.50.05=0.45,在表P列找到和0.45最接近的0.45053,对应的Z=1.65,Y=0.10226 如果区间在曲线下端,则把查出的Z值加上负号即可,Y值不变。pP为正态曲线右端或左端某个区间的概率,且P0.5时,用P-0.05的值查表。 例:正态曲线右端某个区间的P=0.7,则0.70.5=0.2,在表P列找到和0.2最接近的0.19847,其对应的Z=0.52,Y=0.34849,此区间的端点小于0,故Z=0.52。 如果区间在曲线左端,Z为正值。pP为正态曲线以Z=0为中心的某个对称区间的概率时,用P2的值查表。 例:已知正态曲线以Z=0为中心的某个对称区间的概率为0.99,则0

28、.99 2=0.495,在表中P列找到和0.495最接近的0.49506,对应的Z=2.58, Y=0.01431,下端的Z= 2.58 。四、正态分布的应用四、正态分布的应用1. 推断统计中的应用2. 教育测验、评价方面的应用原始分数转化为标准分数确定录取分数线确定等级评定人数品质评定数量化 例:在任意正态分布中,总面积的百分比之多少落在以下各区间内?l 位于均值和均值之上一个标准差的数值之间;l 位于均值之上的一个标准差的数值和一个均值之下一个标准差的数值之间;l 位于均值和均值之上2的数值之间;l 位于均值之上+2和-2的数值之间。 例:学力评估测试(SAT)按正态分布进行了标准化,其均

29、值=500。标准差=100.SAT分数的多少百分比落在以下各区间内?l 500和600之间;l 400和600之间;l 500和700之间;l 300和700之间;l 高于600;l 低于300。 例:在某所大学的学生中,平均缺课天数=3.5,标准差=1.2.假设这所大学的缺课情况符合正态分布,请确定:l 一名学生缺课3.5到5天的概率;l 一名学生缺课5天或以上的概率;l 三名学生都缺课5天或以上的概率。 例:儿科数据显示儿童平均在26个月时学会控制便溺,但是这个正态分布中有2个月的标准差。请问:l 在23个月以前学会控制便溺的儿童的百分比是多少?l 一位母亲为她的儿子是在第30个月学会控制

30、便溺而焦虑。她儿子的百分等级是多少?儿童有多大可能在这个时间及以前学会控制便溺?l 一位母亲发现她的儿子是在18个月学会控制便溺的。她儿子的百分等级是多少?儿童有多大可能在这个时间及以前学会控制便溺?例:智商分数符合均值=100,标准差=15的正态分布。基于这个分布,确定:l 智商分数在100到120的百分比;l 智商分数在88到100之间的百分比;l 随机抽中其中一个人,其智商分数在88到100之间的概率;l 智商分数在110及以上的百分比;l 随机抽中一人,其智商分数在110及以上的概率;l 智商分数125的百分等级。确定录取分数线确定录取分数线o前提:在教育研究中,许多现象如学习成绩,身

31、高,品德等一般都呈正态分布。o例:某项职业录取考试,在参加考试的1600人中准备录取200人,考试分数接近正态分布,平均分数为74分,标准差为11,问录取分数线是多少?确定等级评定的人数确定等级评定的人数o例:如果100个人的某种能力呈正态分布,欲将他们分成甲、乙、丙、丁四个等距的等级,问各等级应有多少人?品质评定数量化品质评定数量化o例:张、李两位老师以甲、乙、丙、丁、戊五个等级分别对45名学生的书法作业进行评定。对于学生A,张老师评定为甲等,李老师评定为丙等;对于学生B,两位老师均评定为乙等。等级张老师李老师甲115乙2112丙613丁612戊13例:某次测验 =65 s =10 问65分

32、到85分的概率是多少?两个重要的数据: 在-1.96,1.96之间的概率(面积)为95%。 在-2.58,2.58之间的概率(面积)为99%。 落到-1.96,1.96以外的可能性为5%,称1.96是=0.05的临界值。 落到-2.58,2.58以外的可能性更小,仅为1%,称2.58是=0.01的临界值。例:某班48人,语文测验分数呈正态分布, =80 ,s =10 ,问分数在 70-88 之间的学生比例为多少?人数为多少? 例:某校欲招收500名新生,报考人数为3160人,考生平均成绩为176分,标准差为64分,考试满分400分,若全体考生成绩呈正态分布,问:(1)成绩为300分的考生大约能列多少名?(2)最低录取分数线约为多少?

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号