《第六章节概率与概率分布》由会员分享,可在线阅读,更多相关《第六章节概率与概率分布(43页珍藏版)》请在金锄头文库上搜索。
1、 第六章第六章 概率与概率分布概率与概率分布n n 本章是推本章是推断断统计的的基基础主主要要内内容容基基础概率概率概率的数学性概率的数学性质概率分布、期望概率分布、期望值与与变异数异数9/21/20241第六章节概率与概率分布参数估参数估计和假和假设检验 推断推断推断推断统计研究如何依据研究如何依据样本本资料料对总体性体性质作出推断,作出推断,这是以概率是以概率论为基基础的。的。 随机原随机原则总体参数体参数统计量量推断估推断估计参数估参数估计检验假假设检验抽抽样分布分布9/21/20242第六章节概率与概率分布第一第一节 基基础概率概率 概率概率概率概率论论起源于起源于起源于起源于1717
2、世世世世纪纪,当,当,当,当时时在人口在人口在人口在人口统计统计、人寿保、人寿保、人寿保、人寿保险险等工作中,要整理和研究大量的随机数据等工作中,要整理和研究大量的随机数据等工作中,要整理和研究大量的随机数据等工作中,要整理和研究大量的随机数据资资料,料,料,料,这这就需就需就需就需要一种要一种要一种要一种专门专门研究大量随机研究大量随机研究大量随机研究大量随机现现象的象的象的象的规规律性的数学。律性的数学。律性的数学。律性的数学。 参参参参赌赌者就想:如果同者就想:如果同者就想:如果同者就想:如果同时掷时掷两两两两颗颗骰子骰子骰子骰子 ,则则点数之和点数之和点数之和点数之和为为9 9 9 9
3、 和点数之和和点数之和和点数之和和点数之和为为10 10 10 10 ,哪种情况出,哪种情况出,哪种情况出,哪种情况出现现的可能性的可能性的可能性的可能性较较大?大?大?大? 例如例如例如例如17171717世世世世纪纪中叶,中叶,中叶,中叶,贵贵族德族德族德族德梅梅梅梅尔发现尔发现:将一枚骰子:将一枚骰子:将一枚骰子:将一枚骰子连掷连掷四次,出四次,出四次,出四次,出现现一个一个一个一个6 6 点的机会比点的机会比点的机会比点的机会比较较多,而同多,而同多,而同多,而同时时将两枚将两枚将两枚将两枚掷掷24242424次,出次,出次,出次,出现现一次双一次双一次双一次双6 6 的机会却很少。的
4、机会却很少。的机会却很少。的机会却很少。 9/21/20243第六章节概率与概率分布 概率概率概率概率论论的的的的创创始人是法国的帕斯卡始人是法国的帕斯卡始人是法国的帕斯卡始人是法国的帕斯卡(16231662)(16231662)和和和和费费尔马尔马(16011665)(16011665),他,他,他,他们们在以通信的方式在以通信的方式在以通信的方式在以通信的方式讨论赌讨论赌博的机率博的机率博的机率博的机率问题时问题时,发发表了骰子表了骰子表了骰子表了骰子赌赌博理博理博理博理论论一一一一书书。棣莫弗。棣莫弗。棣莫弗。棣莫弗(1667(16671754)1754)发发现现了了了了正正正正态态方方
5、方方程程程程式式式式。同同同同一一一一时时期期期期瑞瑞瑞瑞士士士士的的的的伯伯伯伯努努努努利利利利(1654(1654一一一一1705)1705)提出了二提出了二提出了二提出了二项项分布理分布理分布理分布理论论。18141814年,法国的拉普拉斯年,法国的拉普拉斯年,法国的拉普拉斯年,法国的拉普拉斯(17491827)(17491827)发发表了概率分析表了概率分析表了概率分析表了概率分析论论,该书该书奠定了古典概奠定了古典概奠定了古典概奠定了古典概率理率理率理率理论论的基的基的基的基础础,并将概率理,并将概率理,并将概率理,并将概率理论应论应用于自然和社会的研用于自然和社会的研用于自然和社会
6、的研用于自然和社会的研究。此后,法国的泊松究。此后,法国的泊松究。此后,法国的泊松究。此后,法国的泊松(17811840)(17811840)提出了泊松分布,德提出了泊松分布,德提出了泊松分布,德提出了泊松分布,德国的高斯国的高斯国的高斯国的高斯(17771855)(17771855)提出了最小平方法。提出了最小平方法。提出了最小平方法。提出了最小平方法。 9/21/20244第六章节概率与概率分布1.随机随机随机随机现现象和随机事件象和随机事件象和随机事件象和随机事件 随机随机现象具有一定象具有一定条件呈条件呈现多种可能多种可能结果的特性。果的特性。 人人们把随机把随机现象的象的结果以及果以
7、及这些些结果的集合体果的集合体称作随机事件。称作随机事件。 概率是与随机概率是与随机现现象相象相联联系的一个概念。所系的一个概念。所谓谓随随机机现现象,是指事先不能精确象,是指事先不能精确预预言其言其结结果的果的现现象,如即象,如即将出生的将出生的婴婴儿是男儿是男还还是女?一枚硬是女?一枚硬币币落地后其正面是落地后其正面是朝上朝上还还是朝下是朝下? ?等等。所有等等。所有这这些些现现象都有一个共同的象都有一个共同的特点,那就是在特点,那就是在给给定的条件下,定的条件下,观观察所得的察所得的结结果不止果不止一个。随机一个。随机现现象具有非确定性,但内中也有一定的象具有非确定性,但内中也有一定的规
8、规律性。例如,事先我律性。例如,事先我们虽们虽不能准确不能准确预预言一个言一个婴婴儿出生儿出生后的性后的性别别,但大量,但大量观观察,我察,我们们会会发现妇发现妇女生男生女的女生男生女的可能性几乎一可能性几乎一样样大,都是大,都是0.50.5,这这就是概率。就是概率。 9/21/20245第六章节概率与概率分布 在在在在统计统计学中,我学中,我学中,我学中,我们们把把把把类类似似似似掷掷一枚硬一枚硬一枚硬一枚硬币币的行的行的行的行为为(或(或(或(或对对某某某某一随机一随机一随机一随机现现象象象象进进行行行行观观察)称之察)称之察)称之察)称之为为随机随机随机随机试验试验。随机。随机。随机。随
9、机试验试验必必必必须须符符符符合以下三个条件:合以下三个条件:合以下三个条件:合以下三个条件:它可以在相同条件下重复它可以在相同条件下重复它可以在相同条件下重复它可以在相同条件下重复进进行;行;行;行;试验试验的所有的所有的所有的所有结结果事先已知;果事先已知;果事先已知;果事先已知;每次每次每次每次试验试验只出只出只出只出现这现这些可能些可能些可能些可能结结果中的一个,但不能果中的一个,但不能果中的一个,但不能果中的一个,但不能预预先断定出先断定出先断定出先断定出现现哪个哪个哪个哪个结结果。果。果。果。1.1.样样本点本点本点本点2.2.样样本空本空本空本空间间 例例例例 掷掷一一一一颗颗骰
10、子,骰子,骰子,骰子,试试列出它的基本事件和列出它的基本事件和列出它的基本事件和列出它的基本事件和样样本空本空本空本空间间。随机随机试验的每一个可能的每一个可能的的结果,称果,称为基本事件基本事件(或称(或称样本点)本点) 所有所有样本点的全体称作本点的全体称作样本空本空间(Sample space),记作作9/21/20246第六章节概率与概率分布 简单事件:事件:仅含含样本空本空间中中一个一个样本点的事件。本点的事件。复合事件:含复合事件:含样本空本空间中一中一个个样本点以上的的事件。本点以上的的事件。必然事件:从必然事件:从样本空本空间来看来看 ,该事件事件是由其全部基本事件所事件事件是
11、由其全部基本事件所组成,成,记作作S 。随随机机事事件件不可能事件:从不可能事件:从样本空本空间来看来看 ,不含任何基本事件,不含任何基本事件,记作作 。 极端的极端的随机事件随机事件9/21/20247第六章节概率与概率分布 例例例例 对掷对掷一一一一颗颗骰子的骰子的骰子的骰子的试验试验,我,我,我,我们们研究如下研究如下研究如下研究如下事件:事件:事件:事件:A A为为“ “点数是点数是点数是点数是3”3”;B B为为“ “出出出出现现奇数点奇数点奇数点奇数点” ”;C C为为“ “出出出出现现点数不超点数不超点数不超点数不超过过6”6”;D D为为“ “点数是点数是点数是点数是7”7”。
12、 解解解解 因因因因为为11,2 2,3 3,4 4,5 5,66,所以,所以,所以,所以 A A3 3 ,为简单为简单事件;事件;事件;事件; B B11,3 3,55,为为复合事件;复合事件;复合事件;复合事件; C C11,2 2,3 3,4 4,5 5,66,为为必然事件;必然事件;必然事件;必然事件; D D77,为为不可能事件。不可能事件。不可能事件。不可能事件。 9/21/20248第六章节概率与概率分布2. 2. 事件之事件之事件之事件之间间的关系的关系的关系的关系 (1 1)事件和()事件和()事件和()事件和(Or conjunction)Or conjunction)事件
13、事件事件事件A A与与与与事件事件事件事件B B至少有一个事件至少有一个事件至少有一个事件至少有一个事件发发生所构成的事件生所构成的事件生所构成的事件生所构成的事件C C称称称称为为A A与与与与B B的事件和,的事件和,的事件和,的事件和,记记作作作作 (2 2)事件)事件)事件)事件积积(As-well-as conjunction)(As-well-as conjunction)事事事事件件件件A A与事件与事件与事件与事件B B同同同同时发时发生所构成的事件生所构成的事件生所构成的事件生所构成的事件C C称称称称为为A A与与与与B B的事件的事件的事件的事件积积,记记作作作作9/21
14、/20249第六章节概率与概率分布 (3 3)事件的包含与相等)事件的包含与相等)事件的包含与相等)事件的包含与相等事件事件事件事件A A发发生必然生必然生必然生必然导导致事件致事件致事件致事件B B发发生,生,生,生,则则称称称称为为B B包含包含包含包含A A记记作作作作 如果如果如果如果 则则 (4 4)互斥事件)互斥事件)互斥事件)互斥事件事件事件事件事件A A和事件和事件和事件和事件B B不能同不能同不能同不能同时时发发生,生,生,生,则则称称称称B B和和和和A A是互斥事件,或互不相容事是互斥事件,或互不相容事是互斥事件,或互不相容事是互斥事件,或互不相容事件,件,件,件,记记作
15、作作作9/21/202410第六章节概率与概率分布 (5 5)对对立事件立事件立事件立事件事件事件事件事件A A与事件与事件与事件与事件B B是互斥事是互斥事是互斥事是互斥事件,且在一次件,且在一次件,且在一次件,且在一次试验试验中必有其一中必有其一中必有其一中必有其一发发生,称生,称生,称生,称A A与与与与B B为为对对立事件(逆事件),立事件(逆事件),立事件(逆事件),立事件(逆事件),记记作作作作 (6 6)相互独立事件)相互独立事件)相互独立事件)相互独立事件事件事件事件事件A A的的的的发发生与事生与事生与事生与事件件件件B B是否是否是否是否发发生毫无关系,称生毫无关系,称生毫
16、无关系,称生毫无关系,称A A与与与与B B为为相互独立事相互独立事相互独立事相互独立事件,件,件,件,记记作作作作 9/21/202411第六章节概率与概率分布两之两之 随随间 机的机的 事关事关 件系件系9/21/202412第六章节概率与概率分布3. 3. 先先先先验验概率概率概率概率 在在在在统计统计学中,有两种常学中,有两种常学中,有两种常学中,有两种常见见的确定概率的方法:的确定概率的方法:的确定概率的方法:的确定概率的方法:古古古古典法和典法和典法和典法和频频率法。率法。率法。率法。 由普拉斯1814年提出。以想象总体为对象,利用模型本身所具有的对称性来事先求得概率,故被称为先验
17、概率 。 条件: (1)在一样本空间中,各样本点出现的机会均等; (2)该样本空间只有有限(n)个样本点。用古典用古典用古典用古典法求出法求出法求出法求出的概率的概率的概率的概率9/21/202413第六章节概率与概率分布 例例 掷掷两枚均匀的硬两枚均匀的硬币币, 求求“ “两枚都朝上两枚都朝上” ”的概率;的概率; 求求“ “一枚朝上,一枚朝下一枚朝上,一枚朝下” ”的概的概率。率。 这样对这样对于含有于含有于含有于含有mm个个个个样样本点的事件本点的事件本点的事件本点的事件A A,其出,其出,其出,其出现现的概率的概率的概率的概率为为n n 用古典法求算概率,在应用上有两个缺点:它只适用于
18、有限样本点的情况;它假设机会均等,但这些条件实际上往往不能得到满足。 9/21/202414第六章节概率与概率分布4. 4. 经验经验概率概率概率概率 求算概率的另一途径是运用求算概率的另一途径是运用求算概率的另一途径是运用求算概率的另一途径是运用频频率法。率法。率法。率法。设设想有一个与某想有一个与某想有一个与某想有一个与某试验试验相相相相联联系的事件系的事件系的事件系的事件A A,把,把,把,把这这个个个个试验试验一次又一次地做下去,每次都一次又一次地做下去,每次都一次又一次地做下去,每次都一次又一次地做下去,每次都记录记录事件事件事件事件A A是否是否是否是否发发生了。假如做了生了。假如
19、做了生了。假如做了生了。假如做了 n n 次次次次试验试验,而,而,而,而记录记录到事件到事件到事件到事件A A发发生了生了生了生了 m m 次次次次(即成功(即成功(即成功(即成功 m m 次),次),次),次),则频则频数与数与数与数与试验试验次数的比次数的比次数的比次数的比值值,称作次,称作次,称作次,称作次试验试验中事件中事件中事件中事件A A发发生的生的生的生的频频率率率率 显显然,然,然,然,频频率具有双重性率具有双重性率具有双重性率具有双重性质质:随机性和:随机性和:随机性和:随机性和规规律性律性律性律性. . 当当当当试验试验或或或或观观察次数察次数察次数察次数趋趋近于无近于无
20、近于无近于无穷时穷时相相相相应频应频率率率率趋趋于于于于稳稳定,定,定,定,这这个极个极个极个极限限限限值值就是用就是用就是用就是用频频率法所定率法所定率法所定率法所定义义的概率,即的概率,即的概率,即的概率,即 频频率率率率稳稳定到概率定到概率定到概率定到概率这这个事个事个事个事实实,给给了了了了“ “机会大小机会大小机会大小机会大小” ”即概率一个浅即概率一个浅即概率一个浅即概率一个浅显显而而而而说说得通的解得通的解得通的解得通的解释释,这这在在在在统计统计学上具有很重要的意学上具有很重要的意学上具有很重要的意学上具有很重要的意义义。坚坚持持持持这这种种种种观观点的点的点的点的统计统计学派
21、也就被称学派也就被称学派也就被称学派也就被称为频为频率学派。率学派。率学派。率学派。 9/21/202415第六章节概率与概率分布n n比如:比如:n n法国法国统计统计学家蒲丰(学家蒲丰(BuffonBuffon)把)把铜铜板抛了板抛了40404040次,次,正面的次数是正面的次数是20482048,比例是,比例是0.5069 0.5069 。n n19001900年,英国年,英国统计统计学家皮学家皮尔逊尔逊把硬把硬币币抛了抛了2400024000次,正面的次数是次,正面的次数是1201212012,比例是,比例是0.50050.5005n n南非数学家柯屈瑞在南非数学家柯屈瑞在监狱时监狱时
22、,把硬,把硬币币抛了抛了1000010000次,正面的次数是次,正面的次数是50675067,比例是,比例是0.5067 0.5067 。n n再如:再如:n n保保险险公司会利用概率公司会利用概率进进行人寿保行人寿保险经营险经营,比如研,比如研究表明究表明20202424岁岁的男性中明年死亡的概率是的男性中明年死亡的概率是0.00150.0015,同,同龄龄的女性是的女性是0.00050.0005,保,保险险公司公司对对男性男性的保的保费费就多收一些。就多收一些。9/21/202416第六章节概率与概率分布2.2.加法加法加法加法规则规则 如果事件如果事件A A和事件和事件B B互斥,那么互
23、斥,那么 如果如果A A和和B B是任何事件是任何事件( (不一定互斥不一定互斥) ),加法加法规则规则更普通地表示更普通地表示为为如下形式如下形式 第二第二节 概率的数学性概率的数学性质1.非非负性性特特别对必然事件必然事件和不可能事件有和不可能事件有9/21/202417第六章节概率与概率分布n n 例例例例 从一副普通扑克牌中抽一从一副普通扑克牌中抽一从一副普通扑克牌中抽一从一副普通扑克牌中抽一张张牌,求抽到一牌,求抽到一牌,求抽到一牌,求抽到一张红张红桃或者方桃或者方桃或者方桃或者方块块的概率。的概率。的概率。的概率。 n n 例例例例 在一副在一副在一副在一副5252张张扑克牌中,求
24、扑克牌中,求扑克牌中,求扑克牌中,求单单独抽取一次抽到一独抽取一次抽到一独抽取一次抽到一独抽取一次抽到一张红张红桃或桃或桃或桃或爱爱司的概率。司的概率。司的概率。司的概率。9/21/202418第六章节概率与概率分布 加法加法加法加法规则规则可推广到可推广到可推广到可推广到对对两个以上的事件,若事两个以上的事件,若事两个以上的事件,若事两个以上的事件,若事件件件件A A,B B,CKCK都互斥,那么有都互斥,那么有都互斥,那么有都互斥,那么有 P ( P (A A或或或或B B或或或或C C或或或或K K) )P(P(A A)+P()+P(B B)+P()+P(C C) ) +P(+P(K K
25、) ) 例例 根据上海市根据上海市职业职业代代际际流流动动的的统计统计,向下流,向下流动动的概率是的概率是0.070.07,静止不,静止不动动的概率是的概率是0.60.6,求向上流,求向上流动动的的概率是多少?概率是多少? 例例 为为了研究父代文化程度了研究父代文化程度对对子代文化程度的影子代文化程度的影响,某大学响,某大学统计统计出学生中父出学生中父亲亲具有大学文化程度的占具有大学文化程度的占3030,母,母亲亲具有大学文化程度的占具有大学文化程度的占2020,而双方都具,而双方都具有文化程度的占有有文化程度的占有1010,问问从学生中任抽一名,父代从学生中任抽一名,父代至少有一名具有大学文
26、化程度的概率是多少?至少有一名具有大学文化程度的概率是多少?9/21/202419第六章节概率与概率分布3.3.3.3.乘法乘法乘法乘法规则规则 式中符号式中符号 和和 代表条件概率。代表条件概率。 应应理理解解为为,“在在B B已已经发经发生条件下生条件下A A发发生的概率生的概率”。条件概率的意思是,。条件概率的意思是,A A发发生的概率可能与生的概率可能与B B是否是否发发生有关系。生有关系。换换言之,言之,B B已已经发经发生生时时A A发发生生的概率可能有的概率可能有别别于于B B没有没有发发生生时时A A发发生的概率。生的概率。 理解理解统计统计独立的概念,独立的概念,对对于灵活运
27、用概率的乘法于灵活运用概率的乘法规则规则很重要。很重要。现现在用条件概率来加以表达,在用条件概率来加以表达,统计统计独立是指独立是指 若若A A和和B B在在统计统计上相互独立上相互独立( (无关无关) ) ,这时这时乘法乘法规则规则可以可以简简化化为为 9/21/202420第六章节概率与概率分布 例例例例 假定有下列假定有下列假定有下列假定有下列30003000个社区的数据,如果随机地从个社区的数据,如果随机地从个社区的数据,如果随机地从个社区的数据,如果随机地从这这个个个个总总体中抽取一个社区,得到一个中等的而且犯罪率体中抽取一个社区,得到一个中等的而且犯罪率体中抽取一个社区,得到一个中
28、等的而且犯罪率体中抽取一个社区,得到一个中等的而且犯罪率低的社区的概率是多少低的社区的概率是多少低的社区的概率是多少低的社区的概率是多少? ? 例例例例 假定数据假定数据假定数据假定数据变动变动如下,随机地从如下,随机地从如下,随机地从如下,随机地从这这个个个个总总体中抽取一个社区,体中抽取一个社区,体中抽取一个社区,体中抽取一个社区,得得得得到一个中等的而且犯罪率低的社区的概率又是多少到一个中等的而且犯罪率低的社区的概率又是多少到一个中等的而且犯罪率低的社区的概率又是多少到一个中等的而且犯罪率低的社区的概率又是多少? ?属性属性属性属性大大大大中中中中小小小小总总和和和和高犯罪率高犯罪率高犯
29、罪率高犯罪率60060030030010010010001000低犯罪率低犯罪率低犯罪率低犯罪率60060090090050050020002000总总和和和和120012001200120060060030003000属性属性属性属性大大大大中中中中小小小小总总和和和和高犯罪率高犯罪率高犯罪率高犯罪率10010030030060060010001000低犯罪率低犯罪率低犯罪率低犯罪率50050090090060060020002000总总和和和和6006001200120012001200300030009/21/202421第六章节概率与概率分布n n 例例 根据根据统计结统计结果,男果,
30、男婴婴出生的概率是出生的概率是22/4322/43,女,女婴婴出生的概率是出生的概率是21/4321/43,某,某单单位有两位有两名名孕孕妇妇,问问两名孕两名孕妇妇都生男都生男婴婴的概率是多少?都的概率是多少?都生女生女婴婴的概率是多少?其中一男一女的概率是的概率是多少?其中一男一女的概率是多少?多少? n n 例例 某居民楼共某居民楼共2020户户,其中核心家庭,其中核心家庭为为2 2户户,问访问问访问两两户户都是核心家庭的概率是多少?都是核心家庭的概率是多少?问访问问访问第二第二户户才是核心家庭的概率是多少?才是核心家庭的概率是多少?9/21/202422第六章节概率与概率分布n n 例
31、为了研究父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30,母亲具有大学文化程度的占20,而双方都具有文化程度的占有10,问从学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少?9/21/202423第六章节概率与概率分布 在抽在抽样样方法中方法中还经还经常涉及到回置抽常涉及到回置抽样样和不回置抽和不回置抽样样。如前所。如前所述,所述,所谓谓回置抽回置抽样样,就是抽取的,就是抽取的单单位登位登记记后又被放回后又被放回总总体中去,然体中去,然后再后再进进行下一次抽取。使用回置抽行下一次抽取。使用回置抽样样法,先后两次抽取是彼此独立法,先后两次抽取是彼此独立的
32、。因的。因为为每一次抽取后抽取到的每一次抽取后抽取到的单单位都得返位都得返还还,总总体保持不体保持不变变,前,前一次的一次的结结果不可能影响到后一次。所果不可能影响到后一次。所谓谓不回置抽不回置抽样样,就是不再把抽,就是不再把抽取到的取到的单单位退位退还总还总体。体。这样这样先后两次抽取就不再独立了,必先后两次抽取就不再独立了,必须须使用使用条件概率的概念。条件概率的概念。n n用不回置法从一幅普用不回置法从一幅普通扑克牌抽取两次,通扑克牌抽取两次,计计算算得到两得到两张爱张爱司的概率。司的概率。n n用回置法从一幅普通用回置法从一幅普通扑克牌抽取两次,扑克牌抽取两次,计计算算得到两得到两张爱
33、张爱司的概率。司的概率。9/21/202424第六章节概率与概率分布4. 4. 排列和排列和样样本点的本点的计计数数 要正确解决概率要正确解决概率问题问题,往往光考,往往光考虑虑乘法乘法规则还规则还不不够够,还还要同要同时时考考虑虑使用加法使用加法规则规则。一般最。一般最简单简单的做法是:首先确定一种符合要求的做法是:首先确定一种符合要求的排列方式并的排列方式并计计算它算它们发们发生的概率,然后再考生的概率,然后再考虑还虑还有没有其他同有没有其他同样样符合要求的排列方式。如果存在着其他符合要求的排列方式。如果存在着其他实现实现方式,并且都具有相同方式,并且都具有相同的概率,就可以的概率,就可以
34、简单简单地把排列方式数与以某一地把排列方式数与以某一给给定的排列方式定的排列方式计计算算的概率相乘。注意,后一步相当于使用了加法的概率相乘。注意,后一步相当于使用了加法规则规则。n n所有所有N N个元个元素都不相同的素都不相同的情况下,排列情况下,排列方式数方式数为为n nN N个元素中,若其中第一个元素中,若其中第一组组中有中有r r1 1个不能个不能区分的元素,第区分的元素,第2 2组组中有中有r r2 2个不能区分的元个不能区分的元素,素,第,第k k组组中有中有r rk k个不能区分的元素,个不能区分的元素,且各且各组组彼此是可以区分的,彼此是可以区分的,则总则总的排列数的排列数为为
35、9/21/202425第六章节概率与概率分布 例例 从一幅洗得很好的扑克牌中做了从一幅洗得很好的扑克牌中做了3 3次抽取,假定使用回置次抽取,假定使用回置法,求至少得到法,求至少得到1 1张张A A和一和一张张K K的概率是多少的概率是多少? ? 解解 按照按照题题意,要在不同意,要在不同样样本空本空间间中考中考虑虑三种复合事件:抽到三种复合事件:抽到1 1张张A A和和1 1张张K K,另,另l l张张非非A A非非K K,用符号,用符号(AKO)(AKO)表示表示( (其中其中“O”“O”表示其表示其他他) );抽到;抽到1 1张张A A和和2 2张张K K,用符号,用符号(4KK)(4K
36、K)表示;抽到表示;抽到2 2张张A A和和1 1张张K K,用,用符号(符号(AAK)AAK)表示。因表示。因为为在不同在不同样样本空本空间间中基本事件中基本事件实现实现的概率不的概率不同,必同,必须对须对它它们们加以区加以区别别。 次序次序为为AKOAKO的的样样本点本点实现实现的概率是的概率是 次序次序为为AKKAKK的的样样本点本点实现实现的概率是的概率是 次序次序为为AAKAAK的的样样本点本点实现实现的概率是的概率是 再考再考虑虑每个复合事件各含有多少种可能的排列方式每个复合事件各含有多少种可能的排列方式 (AKK)(AKK)含有含有3 3!2!2!3 3种排列方式种排列方式 (A
37、AK) (AAK)含有含有3 3!2!2!3 3种排列方式种排列方式 (AKO)AKO)含有含有3 3!6 6种排列方式种排列方式 所以,在三次抽取中,至少得到所以,在三次抽取中,至少得到1 1张张A A和和1 1张张K K的概率是的概率是 9/21/202426第六章节概率与概率分布 例例 假如假如对对10001000个大学生个大学生进进行歌曲欣行歌曲欣赏调查赏调查,发现发现其中有其中有500500个学生喜个学生喜欢欢民族歌曲,民族歌曲,400400个学生喜个学生喜欢欢流行歌流行歌曲,而曲,而这这些学生中有些学生中有100100人属于既喜人属于既喜欢欢民族歌曲又喜民族歌曲又喜欢欢流流行歌曲的
38、,剩下来的学生两种歌曲都不喜行歌曲的,剩下来的学生两种歌曲都不喜欢欢。如果我。如果我们们随机地从随机地从该总该总体中抽取一个学生,并体中抽取一个学生,并设设事件事件A A为该为该学生喜学生喜欢欢民族歌曲,事件民族歌曲,事件B B为该为该学生喜学生喜欢欢流行歌曲。流行歌曲。 用数字用数字证证明明P(AP(A且且B)=P(A)P(B/A)=P(B)P(A/B)B)=P(A)P(B/A)=P(B)P(A/B) 得到一个喜得到一个喜欢欢两种两种风风格歌曲之一的学生的概率是格歌曲之一的学生的概率是多少?多少? 随机地随机地选选取一个由取一个由3 3个学生个学生组组成的成的样样本,要求本,要求这这三三个学
39、生全都有相同的欣个学生全都有相同的欣赏赏方式,得到方式,得到这这种种样样本的概率是本的概率是多少?多少?9/21/202427第六章节概率与概率分布5. 5. 运用概率方法运用概率方法运用概率方法运用概率方法进进行行行行统计统计推断的前提推断的前提推断的前提推断的前提随机抽随机抽样样本容量相本容量相对于于总体来体来说,是,是较小的小的总体中个体的体中个体的组合具有被同等抽中的概率合具有被同等抽中的概率注意独立性注意独立性问题9/21/202428第六章节概率与概率分布n n 简单简单随机抽随机抽样样要求每一个个体要求每一个个体拥拥有相同的被有相同的被选选入入样样本的机会。本的机会。 n n 严
40、严格来格来讲讲,由于我,由于我们实际们实际上上总总是做不回置抽是做不回置抽样样,因此独立性的假定,是,因此独立性的假定,是难难以完全以完全满满足的。足的。 只只有在有在样样本非常大,可以忽略。本非常大,可以忽略。n n 一个随机一个随机样样本具有以下的性本具有以下的性质质:不:不仅仅要要给给每每一个个体以相等的被抽中的机会,而且要一个个体以相等的被抽中的机会,而且要给给每一每一种个体的种个体的组组合以相等的被抽中的机会。合以相等的被抽中的机会。n n 在要概括社区或其他空在要概括社区或其他空间间上限定区域的上限定区域的单单位位的情况的情况时时,也必,也必须须注意到缺乏独立性的注意到缺乏独立性的
41、问题问题。9/21/202429第六章节概率与概率分布 第三第三节 概率分布、期望概率分布、期望值与与变异数异数 随机事件及其概率回答的是随机随机事件及其概率回答的是随机随机事件及其概率回答的是随机随机事件及其概率回答的是随机现现象某一局部象某一局部象某一局部象某一局部结结果,例如果,例如果,例如果,例如对给对给定的复合事件求先定的复合事件求先定的复合事件求先定的复合事件求先验验概率。而概率概率。而概率概率。而概率概率。而概率分布分布分布分布则则要在要在要在要在满满足完足完足完足完备备性性性性( (穷举穷举) )和互不相容性和互不相容性和互不相容性和互不相容性( (互斥互斥互斥互斥) )的的的
42、的前提下,回答随机前提下,回答随机前提下,回答随机前提下,回答随机现现象一共会出象一共会出象一共会出象一共会出现现多少种多少种多少种多少种结结果,以果,以果,以果,以及每种及每种及每种及每种结结果所伴随的概率是多少。果所伴随的概率是多少。果所伴随的概率是多少。果所伴随的概率是多少。 应该应该指出,在指出,在指出,在指出,在统计统计中,概率分布是就随机中,概率分布是就随机中,概率分布是就随机中,概率分布是就随机现现象象象象呈呈呈呈现现的宏的宏的宏的宏观结观结果而言的。所果而言的。所果而言的。所果而言的。所谓谓宏宏宏宏观结观结果,是指可以果,是指可以果,是指可以果,是指可以在宏在宏在宏在宏观层观层
43、次加以次加以次加以次加以识别识别的而与特定排列次序无关的的而与特定排列次序无关的的而与特定排列次序无关的的而与特定排列次序无关的样样本空本空本空本空间间的子集。的子集。的子集。的子集。9/21/202430第六章节概率与概率分布X X2 23 34 45 56 67 78 89 91 10 011111 12 2合合合合计计P(X)P(X) 例如例如掷掷两两颗颗骰子的骰子的试验试验,点数就是随机,点数就是随机现现象,它一象,它一共有共有1111种宏种宏观结观结果。我果。我们们用古典法用古典法对对每种宏每种宏观结观结果果计计算算P P,便得到了如下表所示的概率分布。,便得到了如下表所示的概率分布
44、。 频频率分布与概率分布的区率分布与概率分布的区率分布与概率分布的区率分布与概率分布的区别别 经验分布:分布:频率分布是率分布是经资料整理而来料整理而来;频率分布随率分布随样本不同而不同本不同而不同;频率分布有率分布有对应的的频数分布。数分布。 理理论分布:分布:概率分布是先概率分布是先验的;的;概率分布是唯一的;概率分布是唯一的;概率分布无概率分布无频率分布率分布所所对应的的频数分布。数分布。9/21/202431第六章节概率与概率分布1. 1. 离散型随机离散型随机离散型随机离散型随机变变量的概率分布量的概率分布量的概率分布量的概率分布 离散型随机离散型随机离散型随机离散型随机变变量的取量
45、的取量的取量的取值值是可数的,如果是可数的,如果是可数的,如果是可数的,如果对对X X的每个可能取的每个可能取的每个可能取的每个可能取值值x xi i计计算其算其算其算其实现实现的概率的概率的概率的概率P Pi i ,我,我,我,我们们便得到了离散型随机便得到了离散型随机便得到了离散型随机便得到了离散型随机变变量的概率分布,即量的概率分布,即量的概率分布,即量的概率分布,即 离散型随机离散型随机离散型随机离散型随机变变量量量量的概率分布也可以用的概率分布也可以用的概率分布也可以用的概率分布也可以用表格和表格和表格和表格和图图形两种形式形两种形式形两种形式形两种形式来表示。由于离散型来表示。由于
46、离散型来表示。由于离散型来表示。由于离散型随机随机随机随机变变量的特点,表量的特点,表量的特点,表量的特点,表示离散型随机示离散型随机示离散型随机示离散型随机变变量概量概量概量概率分布多率分布多率分布多率分布多为为折折折折线图线图。9/21/202432第六章节概率与概率分布2. 2. 连续连续型随机型随机型随机型随机变变量的概率分布量的概率分布量的概率分布量的概率分布 连续连续型随机型随机型随机型随机变变量的取量的取量的取量的取值值充充充充满满某一区某一区某一区某一区间间,因而取某一数,因而取某一数,因而取某一数,因而取某一数值讨论值讨论其概率其概率其概率其概率是无意是无意是无意是无意义义的
47、。的。的。的。为为此,我此,我此,我此,我们们引引引引进进概率密度概率密度概率密度概率密度 的概念来表达的概念来表达的概念来表达的概念来表达连续连续型随机型随机型随机型随机变变量的概率分布。量的概率分布。量的概率分布。量的概率分布。 本本书书第三章第三第三章第三节节曾出曾出现过频现过频率密度的概念,率密度的概念,频频率率密度等于密度等于频频率除以率除以组组距。以距。以频频率密度率密度为纵为纵坐坐标标,可以作,可以作出出频频率分布直方率分布直方图图。类类似地似地,以概率密度,以概率密度 为纵为纵坐坐标标,可以作出概率密度曲,可以作出概率密度曲线线。所不同的是,概率密度。所不同的是,概率密度由于由
48、于对组对组距求了距求了x0x0的极的极限,其限,其图图形乃平滑曲形乃平滑曲线线。9/21/202433第六章节概率与概率分布 这样这样一来,随机一来,随机变变量量X X取取值值在区在区间间 x x1 1 ,x x2 2 上的概率等于上的概率等于概率密度曲概率密度曲线线 下面下面x x1 1与与x x2 2两点之两点之间间面面积积,即,即 所以所以所以所以有概率密有概率密有概率密有概率密度的性度的性度的性度的性质质因因因因为为概率不可能是概率不可能是概率不可能是概率不可能是负负的,且的,且的,且的,且 9/21/202434第六章节概率与概率分布3. 3. 分布函数分布函数分布函数分布函数 为为
49、了从数学上能了从数学上能了从数学上能了从数学上能够统够统一一一一对对随机随机随机随机变变量的概率量的概率量的概率量的概率进进行研究引入分布函行研究引入分布函行研究引入分布函行研究引入分布函数数数数 的概念,它被定的概念,它被定的概念,它被定的概念,它被定义为义为 有了分布函数,就可以很容易得到随机有了分布函数,就可以很容易得到随机有了分布函数,就可以很容易得到随机有了分布函数,就可以很容易得到随机变变量量量量X X取取取取值值在任意区在任意区在任意区在任意区间间 x x1 1 ,x x2 2 上的概率,即上的概率,即上的概率,即上的概率,即 连续连续型随机型随机型随机型随机变变量量量量离散型随
50、机离散型随机离散型随机离散型随机变变量量量量 9/21/202435第六章节概率与概率分布 和和和和 ( (离散离散离散离散变变量量量量) )或或或或 ( (连续变连续变量量量量) )的关系,就像的关系,就像的关系,就像的关系,就像向上累向上累向上累向上累计频计频率和率和率和率和频频率的关系一率的关系一率的关系一率的关系一样样。不同之。不同之。不同之。不同之处处在于,在于,在于,在于, 累累累累计计的是概率。的是概率。的是概率。的是概率。但使用分布函数的好但使用分布函数的好但使用分布函数的好但使用分布函数的好处处是很明是很明是很明是很明显显的,它不的,它不的,它不的,它不仅仅在数学上在数学上在
51、数学上在数学上统统一了一了一了一了对对离散型离散型离散型离散型随机随机随机随机变变量和量和量和量和连续连续型随机型随机型随机型随机变变量概率的研究,而且由于它量概率的研究,而且由于它量概率的研究,而且由于它量概率的研究,而且由于它计计算概率的起点算概率的起点算概率的起点算概率的起点都固定都固定都固定都固定为为,因而可以把概率,因而可以把概率,因而可以把概率,因而可以把概率值换值换算成表,以易于求得任何区算成表,以易于求得任何区算成表,以易于求得任何区算成表,以易于求得任何区间间的的的的概率,从而达到概率,从而达到概率,从而达到概率,从而达到计计算快捷和算快捷和算快捷和算快捷和应应用广泛之目的。
52、用广泛之目的。用广泛之目的。用广泛之目的。 例例例例 求两求两求两求两颗颗骰子点数的分布函数。骰子点数的分布函数。骰子点数的分布函数。骰子点数的分布函数。 X X2 23 34 45 56 67 78 89 91 10 01111 1212合合合合计计P(X)P(X)F(X)F(X)9/21/202436第六章节概率与概率分布4. 4. 数学期望数学期望数学期望数学期望 在前面在前面在前面在前面统计统计分分分分组组的的的的讨论讨论中,我中,我中,我中,我们们在得到在得到在得到在得到频频数数数数( (或或或或频频率率率率) )分布分布分布分布后,后,后,后,为为了了了了对变对变量有系量有系量有系
53、量有系统统概括的概括的概括的概括的认识认识,分,分,分,分别别研究了集中研究了集中研究了集中研究了集中趋势趋势和离中和离中和离中和离中趋势趋势。而。而。而。而对对集中集中集中集中趋势趋势和离中和离中和离中和离中趋势趋势量度,我量度,我量度,我量度,我们们分分分分别别得到了平均指得到了平均指得到了平均指得到了平均指标标和和和和变变异指异指异指异指标标,其中最有代表性的是算,其中最有代表性的是算,其中最有代表性的是算,其中最有代表性的是算术术平均数和平均数和平均数和平均数和标标准差。很准差。很准差。很准差。很显显然,然,然,然,现现在当我在当我在当我在当我们们面面面面对对随机随机随机随机变变量的理
54、量的理量的理量的理论论分布分布分布分布时时,也要,也要,也要,也要对对随机随机随机随机变变量的量的量的量的集中集中集中集中趋势趋势和离中和离中和离中和离中趋势趋势作概括性的描述,作概括性的描述,作概括性的描述,作概括性的描述,这这就引出数学期望和就引出数学期望和就引出数学期望和就引出数学期望和变变异异异异数数数数这这两个概念。两个概念。两个概念。两个概念。 所所所所谓谓数学期望,是反映随机数学期望,是反映随机数学期望,是反映随机数学期望,是反映随机变变量量量量X X取取取取值值的集中的集中的集中的集中趋势趋势的理的理的理的理论论均均均均值值( (算算算算术术平均平均平均平均) ),记记作作作作
55、E E( (X X) )。离散型随机离散型随机离散型随机离散型随机变变量量量量 连续连续型随机型随机型随机型随机变变量量量量9/21/202437第六章节概率与概率分布例 谁的技术比较好?乙射手乙射手甲射手甲射手解解故甲射手的技故甲射手的技术比比较好好9/21/202438第六章节概率与概率分布 例例例例 一家保一家保一家保一家保险险公司在投保的公司在投保的公司在投保的公司在投保的5050万元人寿保万元人寿保万元人寿保万元人寿保险险的保的保的保的保单单中,估中,估中,估中,估计计每每每每1000 1000 保保保保单单每年有每年有每年有每年有1515个理个理个理个理赔赔,若每一保,若每一保,若
56、每一保,若每一保单单每年的每年的每年的每年的营营运成本及利运成本及利运成本及利运成本及利润润的期的期的期的期望望望望值为值为200200元,元,元,元,试试求每一保求每一保求每一保求每一保单单的保的保的保的保费费。 解解解解 依依依依题题意知,利意知,利意知,利意知,利润润的期望的期望的期望的期望值值 E E( (X X) )200(200(元元元元) ) 设设x x1 1表示保表示保表示保表示保费费,x x2 2为为理理理理赔费赔费 x x2 2-(500000-(500000- x x1 1) ),则则可得可得可得可得 所以,所以,所以,所以,x x1 17700(7700(元元元元) )
57、。即每一保。即每一保。即每一保。即每一保单单每年的保每年的保每年的保每年的保费应费应定在定在定在定在77007700元。元。元。元。9/21/202439第六章节概率与概率分布 数学期望也常常数学期望也常常数学期望也常常数学期望也常常记为记为 ,在推,在推,在推,在推论统计论统计中同中同中同中同总总体均体均体均体均值值的的的的记记号,而号,而号,而号,而 则则在推在推在推在推论统计论统计中被作中被作中被作中被作为样为样本均本均本均本均值值的的的的记记号。数学期望和号。数学期望和号。数学期望和号。数学期望和总总体均体均体均体均值值一一一一样样,都是唯,都是唯,都是唯,都是唯一的,不一的,不一的,
58、不一的,不过过它是一个先它是一个先它是一个先它是一个先验验的理的理的理的理论值论值。由于它是用随机。由于它是用随机。由于它是用随机。由于它是用随机变变量各取量各取量各取量各取值值分分分分别别乘以乘以乘以乘以取取取取值值的概率来的概率来的概率来的概率来计计算的,因此数学期望又可称算的,因此数学期望又可称算的,因此数学期望又可称算的,因此数学期望又可称为为随机随机随机随机变变量的加量的加量的加量的加权权算算算算术术平均平均平均平均数。数。数。数。样样本均本均本均本均值值依据依据依据依据统计统计数据数据数据数据计计算而来,但它具有随机性。在算而来,但它具有随机性。在算而来,但它具有随机性。在算而来,
59、但它具有随机性。在统计统计推推推推论论中,中,中,中,E E( (X X) ) , 是是是是“ “估估估估计计” ”。 (2)常数常数c与随机与随机变量量X之之积的期望等于的期望等于X的期望与的期望与c的的积,即即 E(cX)cE(X) (3)两个随机两个随机变量之和的期望等于它量之和的期望等于它们的期望之和,的期望之和,即即 E (X+Y)E(X)+ E(Y) (4)两个独立随机两个独立随机变量乘量乘积的期望等于它的期望等于它们的期望之的期望之积,即即E(XY)E(X)E(Y)(1)常数常数c的期望等于的期望等于该常数,即常数,即 E(c)c数学期望的几个基本性数学期望的几个基本性质:和和
60、都是都是为服服务的,的,E(X)是是“期望期望”9/21/202440第六章节概率与概率分布5. 5. 变变异数异数异数异数 数学期望反映了随机数学期望反映了随机数学期望反映了随机数学期望反映了随机变变量的集中量的集中量的集中量的集中趋势趋势,但,但,但,但仅仅知道集中知道集中知道集中知道集中趋势还趋势还不不不不够够,还应该还应该知道随机知道随机知道随机知道随机变变量在均量在均量在均量在均值值周周周周围围的离散程度,即离中的离散程度,即离中的离散程度,即离中的离散程度,即离中趋势趋势。变变异异异异数是数是数是数是综综合反映随机合反映随机合反映随机合反映随机变变量取量取量取量取值值分散程度的指分
61、散程度的指分散程度的指分散程度的指标标,其功能相当于描述,其功能相当于描述,其功能相当于描述,其功能相当于描述统计统计中已中已中已中已讨论过讨论过的方差及的方差及的方差及的方差及标标准差,准差,准差,准差,记记用用用用D D( (X X) )。 离散型随机离散型随机离散型随机离散型随机变变量量量量 连续连续型随机型随机型随机型随机变变量量量量 由于由于变变异数的异数的单单位是随机位是随机变变量量单单位的平位的平方。方。为为了使随机了使随机变变量量变变异指异指标标的的单单位与其本身位与其本身的的单单位相同,将位相同,将D(X)D(X)开方开方( (取正取正值值) )称作随机称作随机变变量量X X
62、的的标标准差准差 ;同;同时为时为了更明确的表示了更明确的表示D(X)D(X)与与标标准差之准差之间间只是开方关系,索性把只是开方关系,索性把D(X)D(X)写写成成 2 2,并直接称,并直接称D(X)D(X)为为随机随机变变量量X X的方差。的方差。于是有于是有 9/21/202441第六章节概率与概率分布很很很很显显然随机然随机然随机然随机变变量量量量X X的的的的变变异数也可以写成异数也可以写成异数也可以写成异数也可以写成 简简化公式化公式化公式化公式 当然不当然不当然不当然不难难理解,在推理解,在推理解,在推理解,在推论统计论统计中随机中随机中随机中随机变变量量量量变变异数的异数的异数
63、的异数的记记号常号常号常号常常同常同常同常同总总体方差的体方差的体方差的体方差的记记号,即用号,即用号,即用号,即用 2 2表示之。而表示之。而表示之。而表示之。而S S2 2 则则被作被作被作被作为样为样本方本方本方本方差的差的差的差的记记号。号。号。号。变变异数和异数和异数和异数和总总体方差一体方差一体方差一体方差一样样,都是唯一的,不,都是唯一的,不,都是唯一的,不,都是唯一的,不过过它是它是它是它是一个先一个先一个先一个先验验的理的理的理的理论值论值。样样本方差本方差本方差本方差S S2 2 依据依据依据依据统计统计数据数据数据数据计计算而来,但算而来,但算而来,但算而来,但它具有随机
64、性。它具有随机性。它具有随机性。它具有随机性。 试求两求两颗骰骰子点数的子点数的变异数异数D(X) 9/21/202442第六章节概率与概率分布变变异数的几个基本性异数的几个基本性异数的几个基本性异数的几个基本性质质: (1)常数常数c的方差等于的方差等于0,即,即D(c)0 (2)常数常数c与随机与随机变量量X之之积的方差,等于随机的方差,等于随机变量量X的方差的方差c2倍,即倍,即D(cX)c2D(X) (3)随机随机变量与常数之和的方差等于随机量与常数之和的方差等于随机变量的方差,量的方差,即即D(X+c)D(X) (4)两个独立随机两个独立随机变量之和的方差等于它量之和的方差等于它们的方差和,的方差和,即即D(X+Y)D(X) +D(Y)9/21/202443第六章节概率与概率分布