大连理工大学概率统计复习ppt课件

上传人:博****1 文档编号:568645553 上传时间:2024-07-25 格式:PPT 页数:164 大小:984KB
返回 下载 相关 举报
大连理工大学概率统计复习ppt课件_第1页
第1页 / 共164页
大连理工大学概率统计复习ppt课件_第2页
第2页 / 共164页
大连理工大学概率统计复习ppt课件_第3页
第3页 / 共164页
大连理工大学概率统计复习ppt课件_第4页
第4页 / 共164页
大连理工大学概率统计复习ppt课件_第5页
第5页 / 共164页
点击查看更多>>
资源描述

《大连理工大学概率统计复习ppt课件》由会员分享,可在线阅读,更多相关《大连理工大学概率统计复习ppt课件(164页珍藏版)》请在金锄头文库上搜索。

1、数理统计数理统计学学 教材:数理统计学,大连理工大教材:数理统计学,大连理工大学出版社,滕素珍,冯敬海编学出版社,滕素珍,冯敬海编概率论与数理统计概率论与数理统计 复复 习习E Email: dlut_mail: dlut_Password: dlutstatPassword: dlutstat概率统计是研究什么的?客观世界中发生的现象客观世界中发生的现象 确定性的确定性的在一定条件下必然在一定条件下必然发生的生的现象象1)1)抛出物体会下落。抛出物体会下落。2)2)充满气的气球受到挤压会破。充满气的气球受到挤压会破。随机性的随机性的在一定条件下,具有多种可能在一定条件下,具有多种可能的结果,

2、但事先又不能预知确切的结果的结果,但事先又不能预知确切的结果1)1)拋掷一枚硬币,其结果可能是国徽面朝上,也可能是国徽面拋掷一枚硬币,其结果可能是国徽面朝上,也可能是国徽面朝下。朝下。2)2)足球比赛,其结果可能是胜、平、负。足球比赛,其结果可能是胜、平、负。3)3)投掷一个骰子,其结果有投掷一个骰子,其结果有6 6种,即可能出现种,即可能出现1,2,3,4,5,61,2,3,4,5,6点。点。4)4)股市的变化。股市的变化。5)5)人的寿命。人的寿命。经典的数学理论如微积分、微分方程等经典的数学理论如微积分、微分方程等都是研究确定性现象的有力的数学工具。都是研究确定性现象的有力的数学工具。对

3、于某些随机现象,虽然对个别试验来对于某些随机现象,虽然对个别试验来说,无法预言其结果,但在相同的条件说,无法预言其结果,但在相同的条件下,进行大量的重复试验或观察时,却下,进行大量的重复试验或观察时,却又呈现出某些规律性(如拋掷硬币)。又呈现出某些规律性(如拋掷硬币)。随着社会生产与科学技术的发展,研究随着社会生产与科学技术的发展,研究随机现象的统计规律性的理论和方法获随机现象的统计规律性的理论和方法获得了迅速的发展,形成了数学的一个重得了迅速的发展,形成了数学的一个重要分支,并被广泛应用于工业、农业、要分支,并被广泛应用于工业、农业、军事、科技、经济等领域。军事、科技、经济等领域。 概率统计

4、概率统计研究和揭示随机现象研究和揭示随机现象统计规律性的学科统计规律性的学科 应用范围广泛。例如:应用范围广泛。例如: 气象预报、水文预报、地震预报、产品质量检验、气象预报、水文预报、地震预报、产品质量检验、产品的可靠性评估、寿命预测、生物统计、卫生统计、产品的可靠性评估、寿命预测、生物统计、卫生统计、保险、金融等各领域。保险、金融等各领域。 经典数学与概率典数学与概率论与数理与数理统计是相是相辅相成,互相渗透的。相成,互相渗透的。第一章第一章 概率论的基本概念概率论的基本概念随机事件及其运算随机事件及其运算频率与概率频率与概率1.1随机试验、样本空间、随机事件随机试验、样本空间、随机事件一、

5、随机试验(简称一、随机试验(简称“试验试验”)随机试验的特点随机试验的特点 (1)(1)试验可以在相同条件下重复进行;试验可以在相同条件下重复进行;(2)(2)每每次次试试验验的的可可能能结结果果不不止止一一个个,并并且且事事先先可可以知道试验所有可能的结果;以知道试验所有可能的结果;(3)(3)进进行行一一次次试试验验之之前前不不能能确确定定出出现现的的是是哪哪个个结结果果; ;满足上述特点的试验称为满足上述特点的试验称为随机试验随机试验,一般记为,一般记为E。 E1:拋掷一枚质地均匀的硬币拋掷一枚质地均匀的硬币,观察正面和反面出观察正面和反面出现的情况;现的情况;E2:掷一颗质地均匀的骰子

6、,观察其出现的点数;掷一颗质地均匀的骰子,观察其出现的点数;E3:记录某网站一分钟内受到的点击次数;记录某网站一分钟内受到的点击次数;E4:在某高楼上任意掷下一朵玫瑰花,观察其在地在某高楼上任意掷下一朵玫瑰花,观察其在地面上的位置;面上的位置;E5:从某品牌的电视机中任取一台,观察其使用寿从某品牌的电视机中任取一台,观察其使用寿命。命。随机试验的例子二、样本空间二、样本空间 1、样本空间:、样本空间:由随机试验的一切可能的结果由随机试验的一切可能的结果组成的一个集合组成的一个集合称为试验称为试验E的的样本空间样本空间,记为,记为S或或; 2、样本点:、样本点:试验的每一个可能的结果试验的每一个

7、可能的结果(或样或样本空间的元素)称为一个本空间的元素)称为一个样本点样本点,记为,记为e。三、随机事件三、随机事件例例 将一颗骰子连掷两次,依次记录所得点将一颗骰子连掷两次,依次记录所得点数,则所有可能出现的结果即该试验的数,则所有可能出现的结果即该试验的样本空间是:样本空间是: 1、随机事件随机事件随机试验随机试验E的样本空间的样本空间S的子集为的子集为E的的随机事件随机事件,简称事件。通常用大写字母,简称事件。通常用大写字母A、B、C表示表示。 任何事件均可表示为样本空间的某个子集任何事件均可表示为样本空间的某个子集.称称事件事件A发生发生当且仅当试验的结果是子集当且仅当试验的结果是子集

8、A中的元素。中的元素。当一个事件仅包含一个样本点时,称为基本事件当一个事件仅包含一个样本点时,称为基本事件 2、两个特殊事件两个特殊事件 必然事件必然事件S 包含所有的样本点,每次试验包含所有的样本点,每次试验它总是发生它总是发生 不可能事件不可能事件 空集空集,不包含任何样本点,不包含任何样本点,每次试验总是不发生每次试验总是不发生1.事件的包含与相等事件的包含与相等A中的样本点一定属于B,记为AB,也称A是B的子事件。A与B两个事件相等:AB AB且BA。四、事件之间的关系四、事件之间的关系2.2.和事件和事件和事件和事件 :“ “事件事件事件事件A与与与与B至少有一个发生至少有一个发生至

9、少有一个发生至少有一个发生” ”,记作,记作,记作,记作A B2n个事件个事件A1, A2, An至少有一个发生,记作至少有一个发生,记作2” 可列个事件可列个事件A1, A2, An 至少有一个发生,记作至少有一个发生,记作3.积事件积事件 :A与与B同时发生,记作同时发生,记作 ABAB3n个事件个事件A1, A2, An同时发生,记作同时发生,记作3”可列个事件可列个事件A1, A2, An , 同时发生,记作同时发生,记作4.差事件差事件 :AB称为称为A与与B的差事件的差事件,表示事件表示事件A发生而发生而B不发生,不发生,它是由属于它是由属于A而不属于而不属于B的样本点所构成的事件

10、。的样本点所构成的事件。5.互斥的事件互斥的事件 :AB= ,指事件指事件A与与B不能同时发生。不能同时发生。又称又称A与与B互不相容。互不相容。6. 互逆的互逆的事件事件 AB , 且且AB 五、事件的运算五、事件的运算1、交换律:、交换律:ABBA,ABBA2、结合律、结合律:(AB)CA(BC), (AB)CA(BC)3、分配律、分配律:(AB)C(AC)(BC), (AB)C(AC)(BC)4、对偶、对偶(De Morgan)律律: 1.2 频率与概率频率与概率一、频率一、频率定定义义1.1.设设在在相相同同的的条条件件下下,进进行行了了n次次试试验验。若若随随机机事事件件A在在这这n

11、次次试试验验中中发发生生了了nA次次, ,则比值则比值二、概率二、概率从直观上来看,事件从直观上来看,事件A A的概率是指事件的概率是指事件A A发发生的可能性生的可能性1、概率的统计定义、概率的统计定义设随机事件设随机事件A在在n次重复试验中发生的次数为次重复试验中发生的次数为nA,若当试验次数若当试验次数n很大时,频率很大时,频率nA/n稳定地在某稳定地在某一数值一数值p的附近摆动,且随着试验次数的附近摆动,且随着试验次数n的增加,的增加,其摆动的幅度越来越小,则称数其摆动的幅度越来越小,则称数p为随机事件为随机事件A的概率,记为的概率,记为P(A)=p。由定义,显然有由定义,显然有00P

12、( (A)1, )1, P(S)=1,P()=0。设设E是是随随机机试试验验,S是是它它的的样样本本空空间间,对对于于E的的每每一一个个事事件件A,赋赋予予一一个个实实数数P(A)与与之之对对应应,如如果果集集合合函数函数P()具有如下性质:具有如下性质:非负性:对任意一个事件非负性:对任意一个事件A,均有,均有P(A)0 ;规范性:规范性:P(S)=1;可可列列可可加加性性:若若A1,A2,An,是是两两两两互互不不相相容的事件序列,即容的事件序列,即AiAj=(ij, i, j=1,2,),有,有P(A1A2An)= P(A1)+ P(A2) + P(An)+则称则称P(A)为事件为事件A

13、的的概率概率。2、概率的公理化定义、概率的公理化定义3、概率的性质、概率的性质 不可能事件的概率为零,即不可能事件的概率为零,即P()=0;概概率率具具有有有有有有限限限限可可可可加加加加性性性性,即即若若事事件件A1,A2,An两两两两互互不不相容,则必有相容,则必有P(A1A2An)= P(A1)+ P(A2) + P(An)设设A,B是两个事件,则是两个事件,则P(A- -B)=P(A)- -P(AB)特特 别别 地地 , 若若 A B, 则则 AB=B, 有有 P(A- -B)=P(A)- -P(B), 且且P(A)P(B),此性质称为此性质称为单调不减性单调不减性单调不减性单调不减性

14、。二、条件概率二、条件概率在事件在事件B发生的条件下,事件发生的条件下,事件A发生的发生的条件概条件概率率,记为,记为 乘法法则乘法法则 全概率公式:全概率公式:贝叶斯公式:贝叶斯公式: 二、事件的独立性二、事件的独立性两个事件的独立两个事件的独立第二章第二章 随机变量及其分布随机变量及其分布随机变量随机变量离散型随机变量离散型随机变量随机变量的分布函数随机变量的分布函数连续型随机变量连续型随机变量随机变量函数的分布随机变量函数的分布用实数来表示随机试验的各种结果,即引入随机变量用实数来表示随机试验的各种结果,即引入随机变量的概念。这样,不仅可以更全面揭示随机试验的客观的概念。这样,不仅可以更

15、全面揭示随机试验的客观存在的统计规律性,而且可使我们用(高等数学)微存在的统计规律性,而且可使我们用(高等数学)微积分的方法来讨论随机试验。积分的方法来讨论随机试验。 在随机试验中,如果把试验中观察的对象与实数对应在随机试验中,如果把试验中观察的对象与实数对应起来,即建立对应关系起来,即建立对应关系X,使其对试验的每个结果,使其对试验的每个结果e,都有一个实数都有一个实数X(e)与之对应,与之对应, 试验的结果试验的结果e实数实数X( (e) )对应关系对应关系XX的取值随着试验的重复而不同,的取值随着试验的重复而不同, X是一个变量,且是一个变量,且在每次试验中,究竟取什么值事先无法预知,也

16、就是在每次试验中,究竟取什么值事先无法预知,也就是说说X是一个随机取值的变量。由此,我们称是一个随机取值的变量。由此,我们称X为为随机变随机变量量。 关于随机变量关于随机变量(及向量及向量)的研究,是概率论的的研究,是概率论的中心内容中心内容对于一个随机试验,我们所关心的往往是与对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而所研究的特定问题有关的某个或某些量,而这些量就是随机变量这些量就是随机变量随机事件是从静态的观点来研究随机现象,随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点而随机变量则是一种动态的观点2.12.1随机变量的概念随机变量的概

17、念定义定义2.1 2.1 设设E是一个随机试验,是一个随机试验,S=e 是试验是试验E的样的样本空间,如果对于本空间,如果对于S中的每一个样本点中的每一个样本点e,有一实,有一实数数X( (e) )与之对应,这个定义在与之对应,这个定义在S上的实值函数上的实值函数X( (e) )就称为就称为随机变量随机变量。由由定定义义可可知知,随随机机变变量量X( (e) )是是以以样样本本空空间间 S为为 定定义义域域的的一一个个单单值值实实值值函函数数。有关随机变量定义的几点说明:有关随机变量定义的几点说明:(1)随机变量随机变量X是样本点是样本点e的函数,的函数,常用大写字母常用大写字母X、Y、Z 或

18、小写希腊字母或小写希腊字母 、 、 等表示等表示。(2)随机变量随机变量X随着试验结果而取不同的值,因而在试验随着试验结果而取不同的值,因而在试验结束之前,只知道其可能的取值范围,而事先不能预结束之前,只知道其可能的取值范围,而事先不能预知它取什么值,对任意实数区间知它取什么值,对任意实数区间( (a,b) ),“aXb”的的概率是确定的;概率是确定的;(3)(3)随机随机变量量X( (e) )的的值域即域即为其一切可能取其一切可能取值的全体构的全体构成的集合;成的集合;(4)(4)引入随机引入随机变量后,就可以用随机量后,就可以用随机变量描述事件,而量描述事件,而且事件的且事件的讨论,可以,

19、可以纳入随机入随机变量的量的讨论中。中。 随机变量的分类随机变量的分类:随机变量随机变量2.2 2.2 离散型随机变量离散型随机变量 一、一、 离散型随机变量及其分布律离散型随机变量及其分布律1 1、离散型随机变量的概念、离散型随机变量的概念 若某个随机变量的所有可能取值是有限多个或若某个随机变量的所有可能取值是有限多个或可列无限多个,则称这个随机变量为可列无限多个,则称这个随机变量为离散型随机变离散型随机变量量。 讨论随机变量的目的是要研究其统计规律性,讨论随机变量的目的是要研究其统计规律性,要知道离散型随机变量要知道离散型随机变量X的统计规律必须且只须知的统计规律必须且只须知道道X的所有可

20、能取值以及的所有可能取值以及X取每一个可能值的概率。取每一个可能值的概率。 2 2、分布律、分布律 设离散型随机变量设离散型随机变量X,其所有可能,其所有可能取值为取值为x1, x2, , xk, , 且取这些值的概率依次为且取这些值的概率依次为p1, p2, , pk, , 即即则称则称P(X=xk)=pk(k=1, 2, ) 为随机变量为随机变量X 的概率分布的概率分布律(律(列列),简称),简称分布律分布律。分布分布律律可用表格形式表示为:可用表格形式表示为:P(X=xk)=pk, (k=1, 2, )满足满足(1 1)P(X=xk)=pk0,(k=1, 2, )(2)Xx1x2x3xk

21、Pp1p2p3pk二、二、几个常用的离散型随机变量的概率分布律几个常用的离散型随机变量的概率分布律1、 (0-1)分布分布 若随机变量若随机变量X的分布律为:的分布律为: P(X=k)=pk(1- -p)1- -k, k=0,1,(0p1)则称则称X服从以服从以p为参数的为参数的0-1分布,记为分布,记为XB(1,p)。0-1分布的分布律也可写成分布的分布律也可写成X1 10 0Pp1-1-p即随机变量只可能取即随机变量只可能取0 0,1 1两个值,且取两个值,且取1 1的概率为的概率为p,取,取0 0的概率为的概率为1-1-p (0p00是常数,则称是常数,则称X服从参数为服从参数为 的泊松

22、分的泊松分布,记为布,记为XP( )。4、几何分布几何分布 设随机变量设随机变量X的可能取值是的可能取值是1,2,3,1,2,3,且且P(X=k)=(1- -p)k- -1p=qk- -1p,k=1,2,3, ,其中其中0p1是参数,则称随机变量是参数,则称随机变量X服从参数服从参数p为的几何分布。为的几何分布。几何分布背景:几何分布背景: 随机试验的可能结果只有随机试验的可能结果只有2 2种,种,A与与试验进行到试验进行到A发生为止的概率发生为止的概率P( (X=k) ),即,即k次试次试验,前验,前k- -1次失败,第次失败,第k次成功。次成功。2.3 随机变量的分布函数随机变量的分布函数

23、 离散型随机变量,我们可用分布律来完整地描离散型随机变量,我们可用分布律来完整地描述。而对于非离散型随机变量,由于其取值不可能述。而对于非离散型随机变量,由于其取值不可能一个一个列举出来,而且它们取某个值的概率可能一个一个列举出来,而且它们取某个值的概率可能是零。例如:灯泡的寿命是零。例如:灯泡的寿命 由于许多随机变量的概率分布情况不能以其取由于许多随机变量的概率分布情况不能以其取某个值的概率来表示,因此我们往往关心随机变量某个值的概率来表示,因此我们往往关心随机变量X取值落在某区间取值落在某区间 ( (a, ,b 上的概率上的概率( (ab) )。 由于由于 a Xb=Xb-Xa,(,(ab

24、) ),因此对,因此对任意任意xR,只要知道事件,只要知道事件 Xx 发生的概率,则发生的概率,则X落落在在( (a, ,b 的概率就立刻可得。因此我们用的概率就立刻可得。因此我们用P( (Xx) )来讨来讨论随机变量论随机变量X的概率分布情况。的概率分布情况。P( (Xx) ):“随机变量随机变量X取值不超过取值不超过x的概率的概率”。 定义定义 设设X是一随机变量,是一随机变量,X是任意实数,则实值是任意实数,则实值函数函数F(x)P X x, x(-(-,+)+)称为随机变量称为随机变量X的的分布函数分布函数。 有了分布函数定义,任意有了分布函数定义,任意x1,x2R, x1x2,随,随

25、机变量机变量X落在落在( (x1, ,x2 里的概率可用分布函数来计算:里的概率可用分布函数来计算:P x1X x2PX x2PX x1 F(x2)F(x1). 在这个意义上可以说,在这个意义上可以说,分布函数完整地描述了随分布函数完整地描述了随机变量的统计规律性机变量的统计规律性,或者说,或者说,分布函数完整地表示分布函数完整地表示了随机变量的概率分布情况了随机变量的概率分布情况。 一、分布函数的概念一、分布函数的概念二、分布函数的性质二、分布函数的性质 1、单调不减性单调不减性:若:若x1x2, 则则F(x1) F(x2); 2、归一归一 性性:对任意实数:对任意实数x,0 F(x) 1,

26、且,且 3、右连续性:对任意实数右连续性:对任意实数x,反之,具有上述三个性质的实函数,必是某个反之,具有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函随机变量的分布函数。故该三个性质是分布函数的充分必要性质数的充分必要性质。2.4 连续型随机变量1 1、概念概念 设设F(X)是随机变量是随机变量X的分布函数,若的分布函数,若存在非负可积函数存在非负可积函数f(x),(- - x+ + ),使对一切,使对一切实数实数x,均有,均有则称则称X为连续型随机变量,且称为连续型随机变量,且称f(x)为随机变量为随机变量X的的概率密度函数概率密度函数,简称密度。常记为,简称密度。

27、常记为X f(x) , (- - x+ )一、连续型随机变量及其概率密度函数一、连续型随机变量及其概率密度函数X连续型随机变量,则连续型随机变量,则X的分布函数必是连续函数。的分布函数必是连续函数。 (1) 非负性非负性 f(x) 0,(- - x0)f(x)的图像为的图像为 (1) 单峰对称单峰对称 密度曲线关于直线密度曲线关于直线x= 对称对称,即f( + +x)=f( - -x),x(- -,+)正态分布密度函数正态分布密度函数f(x)的性质的性质(2)x= 时,时, f(x)取得最大值取得最大值f( )= ; (3)x= 处有拐点;处有拐点;正态分布也称为高斯正态分布也称为高斯( (G

28、auss)Gauss)分布分布(5)曲线曲线f(x)以以x轴为渐近线。轴为渐近线。正态分布随机变量正态分布随机变量X的分布函数为的分布函数为其图像为其图像为O xF(x)1标准正态分布标准正态分布 当参数当参数 0, 21时,称随机变量时,称随机变量X服从服从标准正标准正态分布,记作态分布,记作XN(0, 1)。分布函数表示为分布函数表示为其其密度函数密度函数表示为表示为O x1(x)标准正态分布的密标准正态分布的密度函数与分布函数度函数与分布函数的图像分别为的图像分别为可得可得在工程应用中,通常认为在工程应用中,通常认为 ,忽略,忽略 的值。质量控制中,常用标准指标值的值。质量控制中,常用标

29、准指标值33 作两条线,当生产过作两条线,当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常。程的指标观察值落在两线之外时发出警报,表明生产出现异常。在一次试验中,正态分布的随机变量在一次试验中,正态分布的随机变量X落在以落在以 为中心,为中心,3 3 为半径为半径的区间的区间( ( - -3 , +3 )内的概率相当大内的概率相当大(0.9974),即,即X几乎必然落几乎必然落在上述区间内,或者说在一般情形下,在上述区间内,或者说在一般情形下,X在一次试验中落在在一次试验中落在( ( - -3 , +3 )以外的概率可以忽略不计。以外的概率可以忽略不计。 3、指数分布、指数分布设

30、连续型随机变量设连续型随机变量X具有概率密度具有概率密度则称则称X服从参数为服从参数为0的指数分布。的指数分布。其分布函数为其分布函数为 指数分布的另一种表示形式指数分布的另一种表示形式 则称则称X服从参数为服从参数为 0的指数分布。的指数分布。其分布函数为其分布函数为2.5 2.5 随机变量函数的分布随机变量函数的分布 Y=g(X),如,如sin(X)离散型随机变量:总结离散型随机变量:总结Y Y不同取值对应的不同取值对应的X X的概的概率率 连续型随机变量:连续型随机变量:1.1.确定确定Y Y的取值范围;的取值范围;2.2.列出列出Y Y的分布函数(化作的分布函数(化作X X落在一定范围

31、的积分);落在一定范围的积分);3.3.求导得求导得Y Y的密度函数的密度函数第三章第三章 多维随机变量及其分布多维随机变量及其分布二维随机变量二维随机变量随机变量的独立性随机变量的独立性3.1 3.1 二维随机变量及其分布二维随机变量及其分布一、二维随机变量及其分布函数一、二维随机变量及其分布函数 定义定义3.13.1 设设(X,Y)是二维随机变量,二元实是二维随机变量,二元实值函数值函数F(x,y)=P(X xY y)=P(X x,Y y) x(- -,+),y(- -,+)称为二维随机变量称为二维随机变量(X,Y)的的分布函数分布函数,或称,或称X与与Y的联合分布函数。的联合分布函数。即

32、即F(x,y)为事件为事件X x与与Y y同时发生的概率。同时发生的概率。2 2、二维随机变量的联合分布函数、二维随机变量的联合分布函数几何意义:几何意义:若把二维随机变量若把二维随机变量(X,Y)看成平面上随机点的坐标,看成平面上随机点的坐标,则分布函数则分布函数F(x,y)在在(x,y)处的函数值处的函数值F(x0,y0)就表示就表示随机点随机点(X,Y)落在区域落在区域 - -X x0, - -Y y0中的概率。如图阴影部分:中的概率。如图阴影部分:(x0,y0)xyO(x1, y1)(x2, y2)O x1 x2 xy1y2y(1)对任意对任意(x, y) R2 , 0 F(x, y)

33、 1。(2)F(x, y)是变量是变量x或或y的非降函数,即的非降函数,即 对任意对任意y R, 当当x1x2时,时,F(x1,y) F(x2,y); 对任意对任意x R, 当当y10, 大数定律以严格的数学形式表达了随大数定律以严格的数学形式表达了随机现象最根本的性质之一:机现象最根本的性质之一:平均结果的稳定性平均结果的稳定性中心极限定理中心极限定理 自从高斯指出测量误差服从正态分布之后,自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见人们发现,正态分布在自然界中极为常见. 观察表明,如果一个量是由大量相互独立观察表明,如果一个量是由大量相互独立的随机因素的影响所

34、造成,而每一个别因素在的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大总影响中所起的作用不大. 则这种量一般都服则这种量一般都服从或近似服从正态分布从或近似服从正态分布.定理:(定理:(独立同分布下的中心极限定理)独立同分布下的中心极限定理)它表明,当它表明,当n充分大时,充分大时,n个具有期望和方差个具有期望和方差的独立同分布的的独立同分布的r.v之和近似服从正态分布之和近似服从正态分布.设设X1,X2, 是独立同分布的随机是独立同分布的随机变量序列,且变量序列,且E(Xi)= Var(Xi)= ,i=1,2,,则,则第六章第六章 数理统计的基本概念数理统计的基本概念总体和样本

35、总体和样本几个常用的分布和抽样分布几个常用的分布和抽样分布总体和样本总体和样本一、总体一、总体 在数理统计中,把所研究的对象的全体称为在数理统计中,把所研究的对象的全体称为总体总体。通常指研究对象的某项数量指标,一般记为通常指研究对象的某项数量指标,一般记为X。 把总体的每一个基本单位称为把总体的每一个基本单位称为个体个体。如全体在校生的身高如全体在校生的身高X,某批灯泡的寿命,某批灯泡的寿命Y。对不同的个体,对不同的个体,X的取值是不同的。的取值是不同的。X是一个随机变量是一个随机变量。X的分布也就完全描述了我们所关心的指标,即总体就的分布也就完全描述了我们所关心的指标,即总体就是指分布。是

36、指分布。二、随机样本二、随机样本从总体从总体X中抽出若干个个体称为中抽出若干个个体称为样本样本,一般记为一般记为(X1,X2,Xn)。n称为称为样本容量样本容量。而对这。而对这n个个体的一次个个体的一次具体的观察结果具体的观察结果(x1,x2,xn)是完全确定的一组数值,是完全确定的一组数值,但它又随着每次抽样观察而改变。但它又随着每次抽样观察而改变。(x1,x2,xn)称为样本称为样本观察值。观察值。如果样本如果样本(X1,X2,Xn)满足满足(1)代表性:样本的每个分量代表性:样本的每个分量Xi与与X有相同的分布;有相同的分布;(2)独立性:独立性: X1,X2,Xn是相互独立的随机变量,

37、是相互独立的随机变量,则称样本则称样本(X1,X2,Xn)为为简单随机样本简单随机样本。设总体设总体X的分布为的分布为F(x),则样本则样本(X1,X2,Xn)的联合分的联合分布为布为当总体当总体X是离散型时,其分布律为是离散型时,其分布律为样本的联合分布律为样本的联合分布律为当总体当总体X是连续型时,是连续型时, Xf(x),则样本的联合密度为则样本的联合密度为总体、样本、样本观察值的关系总体、样本、样本观察值的关系总体总体 样本样本 样本观察值样本观察值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资料样本观察值,去推断总样本观察值,去推断总体的情况体的情况总体分布。总体分布

38、决定了样本取值的总体分布。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而概率规律,也就是样本取到样本观察值的规律,因而可以用样本去推断总体。可以用样本去推断总体。三、统计量三、统计量 样本是我们进行分析和推断的起点,但实际上我样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断,而需对样本进行们并不直接用样本进行推断,而需对样本进行“加工加工”和和“提炼提炼”,将分散于样本中的信息集中起来,为,将分散于样本中的信息集中起来,为此引入统计量的概念。此引入统计量的概念。 (X1,X2,Xn)g(X1,X2,Xn)其中其中g(x1,x2,xn)是是(x1,x2,

39、xn)的连续函数。的连续函数。如果如果g(X1,X2,Xn)中不含有未知参数,称中不含有未知参数,称g(X1,X2,Xn)为为统计量统计量。(不含未知参数的样本的函数)(不含未知参数的样本的函数)如如未知:未知:是统计量是统计量不是统计量不是统计量若若已知,已知,2未知:未知:是统计量是统计量几个常用的统计量几个常用的统计量样本均值样本均值样本方差样本方差样本标准差样本标准差样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩几个常用的分布和抽样分布几个常用的分布和抽样分布(一一) 2分布分布1、定义:设、定义:设n个个r.v. X1,X2,Xn,XiN(0,1),i=1,2,n则称则称一、常

40、用分布一、常用分布 2分布、分布、 t 分布和分布和F分布。分布。 服从自由度为服从自由度为n的的 2分布。分布。 2分布的密度函数分布的密度函数f(y)曲线曲线2、性质、性质(1)(2) 2分布的可加性分布的可加性X1, X2 相互独立,则相互独立,则X1+X2 2(n1+n2)练习练习3、 2分布表及有关计算分布表及有关计算(1)构成构成 P 2(n)=p,已知已知n,p可查表求得可查表求得;(2)有关计算有关计算p分位点分位点1、定义、定义 若若XN(0, 1),Y 2(n),X与与Y独立,独立,则则t(n)称为自由度为称为自由度为n的的t分布。分布。(二二) t分布分布t(n) 的概率

41、密度为的概率密度为2、基本性质、基本性质: (1) f(t)关于关于t=0(纵轴纵轴)对称;对称;(2) f(t)的极限为的极限为N(0,1)的密度函数,即的密度函数,即 3、t分布表及有关计算分布表及有关计算(1)构成:构成: Pt(n)=p(2)有关计算有关计算Pt(n)=p,=tp(n)p注注:(三三) F分布分布1、定义、定义 若若X 2(n1),Y 2(n2) ,X,Y独立,则独立,则 称为第一自由度为称为第一自由度为n1 ,第二自由度为第二自由度为n2的的F分布,其分布,其概率密度为概率密度为2、 F分布表及有关计算分布表及有关计算(1)构成:构成:PF(n1,n2)=p(2)有关

42、计算有关计算PF(n1,n2)=p=Fp(n1,n2)一、抽样分布一、抽样分布 统计量的分布 1、设、设(X1,X2,Xn)是正态总体是正态总体N(,2)的样本,的样本,则则 (1)(2)(3)与与S2独立独立2、设、设(X1i,X2i,Xnii)是来自具有相同方差是来自具有相同方差2 ,均值为,均值为i的正态总体的正态总体N(i,2)的样本,的样本,i=1,2,t,且设这且设这t个样本个样本之间相互独立,设之间相互独立,设分别是第分别是第i个总体的样本均值和样本方差,个总体的样本均值和样本方差,i=1,2,t,则有则有(1)2t个随机变量个随机变量是相互独立的。是相互独立的。(2)其中其中(

43、3)当当t=2时,有时,有3、设、设(X1,X2,Xn)是正态总体是正态总体N(,2)的样本,的样本,则则4、设、设(X1,X2,Xn1)是是N(1,12)的样本,的样本,(Y1,Y2,Yn2)是是N(2,22)的样本,且相互独立,的样本,且相互独立,S12,S22是样本方差,则是样本方差,则(1)第六章第六章 参数估计参数估计参数的点估计参数的点估计 估计量的评选标准估计量的评选标准正态总体参数的区间估计正态总体参数的区间估计参数的点估计参数的点估计一、参数估计的概念一、参数估计的概念问题的提出:已知总体问题的提出:已知总体X的分布函数的分布函数F(x;1,2,k),其中其中1, 2, k是

44、未知参数。是未知参数。点估计:由总体的样本点估计:由总体的样本(X1,X2,Xn)对每一个未知参数对每一个未知参数i(i=1,2,k)构造统计量构造统计量作为参数作为参数i的的估计估计,称,称为参数为参数i的的估计量估计量。样本样本(X1,X2,Xn)的一组取值的一组取值(x1,x2,xn)称为样本观察称为样本观察值,将其代入估计量值,将其代入估计量 ,得到数值,得到数值称为参数称为参数i的的估计值估计值。由于由于现用它来估计未知参数现用它来估计未知参数 ,故称这种估计为故称这种估计为点估计点估计。是实数域上的一个点,是实数域上的一个点,点估计的经典方法是:点估计的经典方法是: (1)矩估计法

45、矩估计法 (2)极大似然估计法极大似然估计法二、矩估计法二、矩估计法(简称简称“矩法矩法”) 英国统计学家皮尔逊英国统计学家皮尔逊(Karl Pearson)提出提出1、矩法的基本思想:、矩法的基本思想:以样本矩作为相应的总体同阶矩的估计;以样本矩作为相应的总体同阶矩的估计;以样本矩的函数作为相应的总体矩的同一函数的以样本矩的函数作为相应的总体矩的同一函数的估计。估计。2、矩法的步骤:、矩法的步骤:设总体设总体X的分布为的分布为F(x;1,2,k),k个参数个参数1,2,k待估计,待估计,(X1,X2,Xn)是一个样本是一个样本 。(1)计算总体分布的计算总体分布的i阶原点矩阶原点矩E(Xi)

46、=i(1,2,k),i=1,2,k,(计算到计算到k阶矩为止,阶矩为止,k个参数个参数);(2)列方程列方程从中解出方程组的解,记为从中解出方程组的解,记为则则为参数为参数1,2,k的矩估计。的矩估计。二、极大似然估计法二、极大似然估计法( (R.A.Fisher) )例例 设总体设总体X服从服从01分布,即分布律为分布,即分布律为i=0,1,其中其中01未知未知(X1,X2,Xn)为为X的一个样本,设其观察值为的一个样本,设其观察值为(x1,x2,xn),则事件则事件(X1=x1,X2=x2,Xn=xn)发生的概率为发生的概率为对于给定的样本观察值,上述概率为对于给定的样本观察值,上述概率为

47、的函数,称其为似的函数,称其为似然函数,并记为然函数,并记为L()为使上述随机事件的概率达到最大,为使上述随机事件的概率达到最大,应选取使应选取使L()达到最大的参数值达到最大的参数值(如果存在如果存在),即,即1、极大似然估计法的基本思想、极大似然估计法的基本思想 一般说,事件一般说,事件A发生的概率与参数发生的概率与参数 有关,有关, 取值不同,则取值不同,则P(A)也不同。因而应记也不同。因而应记事件事件A发生的概发生的概率为率为P(A| )。若若A发生了,则认为此时的发生了,则认为此时的 值应是在值应是在 中使中使P(A| )达到最大的那一个达到最大的那一个。使得取该样本值发生的可能性

48、最大。使得取该样本值发生的可能性最大。 由样本的具体取值,选择参数由样本的具体取值,选择参数的估计量的估计量 对每一样本值对每一样本值(x1,x2,xn),在参数空间,在参数空间 内使似内使似然函数然函数L(x1,x2,xn;)达到最大的参数估计值达到最大的参数估计值,称为参数称为参数的的极大似然估计值极大似然估计值,它满足,它满足称统计量称统计量为参数为参数的的极大似然估计量极大似然估计量。记为记为2、似然函数与极大似然估计似然函数与极大似然估计设设则称则称为该总体为该总体X的的似然函数似然函数。3、求极大似然估计的步骤、求极大似然估计的步骤设总体设总体X的分布中,有的分布中,有m个未知参数

49、个未知参数1,2,m,它们,它们的取值范围的取值范围 。(1)写出似然函数写出似然函数L的表达式的表达式如果如果X是离散型随机变量,分布律为是离散型随机变量,分布律为P(X=k),则则如果如果X是连续型随机变量,密度函数为是连续型随机变量,密度函数为f(x),则则(2)在在 内求出使得似然函数内求出使得似然函数L达到最大的参数的估计值达到最大的参数的估计值它们就是未知参数它们就是未知参数1,2,m的极大似然估计。的极大似然估计。 一般地,先将似然函数取对数一般地,先将似然函数取对数lnL,然后令然后令lnL关关于于1,2,m的偏导数为的偏导数为0,得方程组,得方程组从中解出从中解出注:注:由似

50、然方程解不出由似然方程解不出 的似然估计时,可由定义的似然估计时,可由定义通过分析直接推求。事实上通过分析直接推求。事实上满足满足极大似然估计具有下述性质:极大似然估计具有下述性质:若若 是未知参数是未知参数 的极大似然估计,的极大似然估计, g( )是是 的严的严格单调函数,则格单调函数,则g( )的极大似然估计为的极大似然估计为g( ),估计量的评选标准估计量的评选标准一、无偏性一、无偏性估计量估计量的观察或试验的结果,估计值可能较真实的参数值偏大的观察或试验的结果,估计值可能较真实的参数值偏大或偏小,而一个好的估计量不应总是偏大或偏小,在多或偏小,而一个好的估计量不应总是偏大或偏小,在多

51、次试验中所得的估计量的平均值应与真实参数吻合,这次试验中所得的估计量的平均值应与真实参数吻合,这就是无偏性所要求的。就是无偏性所要求的。 是一个随机变量,对一次具体是一个随机变量,对一次具体定义定义是是 的一个估计量,如果的一个估计量,如果 有有则称则称是是 的一个的一个无偏估计无偏估计。如果如果不是无偏的,就称该估计是有偏的。不是无偏的,就称该估计是有偏的。二、有效性二、有效性对于参数对于参数 的无偏估计量,其取值应在真值附近波动,的无偏估计量,其取值应在真值附近波动,我们希望它与真值之间的偏差越小越好。我们希望它与真值之间的偏差越小越好。 定义定义 设设均为未知参数均为未知参数 的无偏估计

52、量,若的无偏估计量,若则称则称比比有效有效。在在 的所有无偏估计量中,若的所有无偏估计量中,若估计量,则称估计量,则称是具有最小方差的无偏是具有最小方差的无偏显然也是最有效的无偏估计量,简称有效估计量。显然也是最有效的无偏估计量,简称有效估计量。为一致最小方差无偏估计量。为一致最小方差无偏估计量。区间估计区间估计点估计的方法得到的估计值不一定是参数的真值,即点估计的方法得到的估计值不一定是参数的真值,即使与真值相等也无法肯定这种相等(因为总体参数本使与真值相等也无法肯定这种相等(因为总体参数本身是未知的),也就是说,由点估计得到的参数估计身是未知的),也就是说,由点估计得到的参数估计值没有给出

53、它与真值之间的可靠程度,在实际应用中值没有给出它与真值之间的可靠程度,在实际应用中往往还需要知道参数的估计值落在其真值附近的一个往往还需要知道参数的估计值落在其真值附近的一个范围。范围。为此我们要求由样本构造一个以较大的概率包含真实为此我们要求由样本构造一个以较大的概率包含真实参数的一个范围或区间,这种带有概率的区间称为置参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计信区间,通过构造一个置信区间对未知参数进行估计的方法称为区间估计。的方法称为区间估计。 定义定义 设总体设总体X的分布函数族为的分布函数族为F(x;), ,对对于给定的于给定的(00;(3) H0:= 0,H1:0;检验规则为;检验规则为当当时,拒绝时,拒绝H0当当时,接受时,接受H0(3) H0:= 0,H1:0;检验规则为;检验规则为当当时,拒绝时,拒绝H0当当时,接受时,接受H0(3) H0:= 0,H1:02;(3) H0:2=02,H1:202;检验规则为;检验规则为当当时,拒绝时,拒绝H0当当时,接受时,接受H0(3) H0:2=02,H1:202;检验规则为;检验规则为当当时,拒绝时,拒绝H0当当时,接受时,接受H0

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号