医学高等数学:第九章概率的基本理论与应用

上传人:夏** 文档编号:568809454 上传时间:2024-07-27 格式:PPT 页数:112 大小:2.27MB
返回 下载 相关 举报
医学高等数学:第九章概率的基本理论与应用_第1页
第1页 / 共112页
医学高等数学:第九章概率的基本理论与应用_第2页
第2页 / 共112页
医学高等数学:第九章概率的基本理论与应用_第3页
第3页 / 共112页
医学高等数学:第九章概率的基本理论与应用_第4页
第4页 / 共112页
医学高等数学:第九章概率的基本理论与应用_第5页
第5页 / 共112页
点击查看更多>>
资源描述

《医学高等数学:第九章概率的基本理论与应用》由会员分享,可在线阅读,更多相关《医学高等数学:第九章概率的基本理论与应用(112页珍藏版)》请在金锄头文库上搜索。

1、数学与生物信息学教研室Mathematics & Bioinformatics Group第九章 概率的基本理论与应用第一节 随机事件的概率及其运算随机事件的概率及其运算第二节 全概率公式和贝叶斯公式全概率公式和贝叶斯公式第三节 随机变量及其概率分布随机变量及其概率分布第四节 随机变量的数字特征随机变量的数字特征第五节第五节 大数定律与中心极限定理大数定律与中心极限定理27 七月 2024数学与生物信息学教研室Mathematics & Bioinformatics Group 2第一节 随机事件的概率及其运算随机事件的概率及其运算一、一、随机试验与随机事件随机试验与随机事件 二、二、随机事件

2、的概率随机事件的概率三、三、概率的加法公式概率的加法公式四、条件概率四、条件概率五、概率的乘法公式五、概率的乘法公式数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、随机试验与随机事件随机试验与随机事件 3试验是我们熟悉的,它包括各种各样的科学实验,甚至对某一事物的某一特征的观察. 针对随机现象进行实验或观察称为随机试验随机试验(random trial),数学与生物信息学教研室Mathematics & Bioinformatics Group 随机试验的每一种可能结果或其中某些结果的集合称为随机事件(random event)简称事件,通常

3、用大写字母 表示. 例如,射击击中目标;经过十字路口遇到红色交通指挥灯;观察治疗结果为治愈等等都是随机事件。4数学与生物信息学教研室Mathematics & Bioinformatics Group 二、二、随机事件的概率随机事件的概率51频率及其稳定性频率及其稳定性数学与生物信息学教研室Mathematics & Bioinformatics Group 掷硬币试验掷硬币试验试验者投掷次数出现正面次数出现正面的频率Demorgen204610610.5186Buffon404020480.5096Pearson1200060190.5016Pearson24000120120.5005数学

4、与生物信息学教研室Mathematics & Bioinformatics Group 出生出生年份年份 出生数出生数 频率频率男孩男孩女孩女孩合计合计男男 女女19274965444621899587330.518 0.48219285136544773399909930.518 0.48219295147654793369941010.518 0.482193052807249433910228110.516 0.48419314969864675879645730.515 0.48519324824314522329346630.516 0.484合计合计3032452283342258

5、658740.517 0.483 某地婴儿出生数与频率某地婴儿出生数与频率数学与生物信息学教研室Mathematics & Bioinformatics Group 2概率的统计定义概率的统计定义在相同的条件下在相同的条件下,重复进行重复进行n次实验次实验,事件事件A的频率在某个常数的频率在某个常数p附近摆动附近摆动,随着随着n的的增大,摆动幅度越小,则称常数增大,摆动幅度越小,则称常数p为事为事件件A的概率的概率,记作记作 P(A)=p数学与生物信息学教研室Mathematics & Bioinformatics Group 必然事件的概率为必然事件的概率为1,即即P(U)=10P(A)1我

6、们用我们用P(A)表示表示事件事件A发生发生的概率,则的概率,则 不可能事件的概率为不可能事件的概率为0,即即 P(V)=0数学与生物信息学教研室Mathematics & Bioinformatics Group 三、三、概率的加法公式概率的加法公式10数学与生物信息学教研室Mathematics & Bioinformatics Group 概率的基本性质概率的基本性质数学与生物信息学教研室Mathematics & Bioinformatics Group 数学与生物信息学教研室Mathematics & Bioinformatics Group 四、条件概率四、条件概率13数学与生物信

7、息学教研室Mathematics & Bioinformatics Group 2.1 条件概率条件概率我们先来看一个例子我们先来看一个例子数学与生物信息学教研室Mathematics & Bioinformatics Group 例例:甲,乙两厂生产同类产品甲,乙两厂生产同类产品合格合格废品废品合计合计甲厂甲厂67370乙厂乙厂28230合计合计955100问:若已知取到的产品是合格品,产品是由甲厂生产的问:若已知取到的产品是合格品,产品是由甲厂生产的概率是多少?概率是多少?数学与生物信息学教研室Mathematics & Bioinformatics Group 事实上事实上,所求即为条件

8、概率所求即为条件概率.那么我们如何来定义条件概那么我们如何来定义条件概率率?数学与生物信息学教研室Mathematics & Bioinformatics Group 定义定义:对于两个随机事件对于两个随机事件A与与B,若若P(B)0,称称为事件为事件B发生的条件下,事件发生的条件下,事件A的条的条件概率。件概率。一般我们计算条件概率都采用这个公式。一般我们计算条件概率都采用这个公式。数学与生物信息学教研室Mathematics & Bioinformatics Group 例:一批产品中有例:一批产品中有N件正品,件正品,M件次品,件次品,无放回地抽取两次,每次取无放回地抽取两次,每次取1件

9、:件:(1)在第)在第1次取到正品的条件下,第次取到正品的条件下,第2次取到正品的概率;次取到正品的概率;2)在第在第1次取到次品的条件下,第次取到次品的条件下,第2次取次取到正品的概率。到正品的概率。(用条件概率公式计算用条件概率公式计算)数学与生物信息学教研室Mathematics & Bioinformatics Group 例例:某学院一年级学生共有某学院一年级学生共有100名名,其中男其中男生生(用事件用事件A表示表示)80人人,女生女生20人人;来自北来自北京的京的(用事件用事件B表示表示)有有20人人,其中男生其中男生12人人,女生女生8人人.免修英文的免修英文的(用事件用事件C

10、表示表示)40人人,其中男生其中男生32人人,女生女生8人人.求求(我们用条件概我们用条件概率公式计算率公式计算):数学与生物信息学教研室Mathematics & Bioinformatics Group 课堂练习课堂练习:10个球中有个球中有3个黑色个黑色,7个白色个白色,从中任意从中任意取两个取两个,求在已知其中一个是黑球的条求在已知其中一个是黑球的条件下件下,另一个也是黑球的概率另一个也是黑球的概率.数学与生物信息学教研室Mathematics & Bioinformatics Group 五、概率的乘法公式五、概率的乘法公式21数学与生物信息学教研室Mathematics & Bio

11、informatics Group 如果我们把条件概率如果我们把条件概率公式变形,就可以得公式变形,就可以得到概率的乘法公式。到概率的乘法公式。数学与生物信息学教研室Mathematics & Bioinformatics Group 定理:设定理:设P(A)0,P(B)0,则事件则事件A与与B之积之积AB的概率等的概率等于其中任一事件的概率乘以该事件发生的条件下另一事于其中任一事件的概率乘以该事件发生的条件下另一事件发生的概率,即:件发生的概率,即:数学与生物信息学教研室Mathematics & Bioinformatics Group 例例:已知已知100件产品中有件产品中有4件次品,无

12、件次品,无放回从中抽取放回从中抽取2次,每次抽取次,每次抽取1件,件,求下列事件的概率:求下列事件的概率:(1)第一次取到次品,第)第一次取到次品,第2次取到次取到正品;正品;(2)两次都取到正品;)两次都取到正品;(3)两次抽取中恰有)两次抽取中恰有1次取到次取到正品正品数学与生物信息学教研室Mathematics & Bioinformatics Group 10个考签中有个考签中有4个难签个难签,甲甲,乙乙,丙丙3人参加抽人参加抽签签(无放回无放回),甲先甲先,乙其次乙其次,丙最后丙最后.求下列概求下列概率率:(1)甲抽到难签甲抽到难签(2)甲甲,乙都抽到难签乙都抽到难签(3)甲没抽到难

13、签甲没抽到难签,乙抽到难签乙抽到难签(4)甲甲,乙乙,丙都抽到难签丙都抽到难签例例:数学与生物信息学教研室Mathematics & Bioinformatics Group 第二节全概率公式和贝叶斯公式全概率公式和贝叶斯公式26一、一、全概公式全概公式二、二、贝叶斯公式贝叶斯公式数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、全概公式全概公式27数学与生物信息学教研室Mathematics & Bioinformatics Group 把复杂事件分解为若干简单事件把复杂事件分解为若干简单事件的和,先计算各简单事件的概率,的和,先计算各简单事

14、件的概率,再利用加法公式计算复杂事件的再利用加法公式计算复杂事件的概率。将这种方法一般化,就是概率。将这种方法一般化,就是全概公式。全概公式。数学与生物信息学教研室Mathematics & Bioinformatics Group 全概公式全概公式 设事件组设事件组A1,A2,.An是样本空间的一个部是样本空间的一个部分分,则对任意事件则对任意事件B,有有:数学与生物信息学教研室Mathematics & Bioinformatics Group 例:市场上某种商品是由例:市场上某种商品是由3个厂家同时供个厂家同时供货。其供应量是第一个厂家为第二个厂家货。其供应量是第一个厂家为第二个厂家的的

15、2倍,第二,三两个厂家相等,而且各倍,第二,三两个厂家相等,而且各厂产品的次品率依次为:厂产品的次品率依次为:2,2和和4。求顾客任意选购一种该种商品是次品的概求顾客任意选购一种该种商品是次品的概率?率?数学与生物信息学教研室Mathematics & Bioinformatics Group 例:三人同时向一架飞机射击。设三人都例:三人同时向一架飞机射击。设三人都不射中的概率为不射中的概率为0.09,三人中只有一人射,三人中只有一人射中的概率为中的概率为0.36,三人中恰有两人射中的,三人中恰有两人射中的概率为概率为0.41,三人同时射中的概率为,三人同时射中的概率为0.14。又设无人射中,

16、飞机不会坠毁;只有一人又设无人射中,飞机不会坠毁;只有一人击中飞机坠毁的概率为击中飞机坠毁的概率为0.2;两人击中飞;两人击中飞机坠毁的概率为机坠毁的概率为0.6;三人射中飞机一定坠三人射中飞机一定坠毁。求三人同时向飞机射击一次飞机坠毁毁。求三人同时向飞机射击一次飞机坠毁的概率。的概率。数学与生物信息学教研室Mathematics & Bioinformatics Group 二、二、贝叶斯公式贝叶斯公式32数学与生物信息学教研室Mathematics & Bioinformatics Group 定理定理 设设A1,A2,.An为样本空间的一个有为样本空间的一个有限分割限分割,并且当其中一个

17、事件发生时,事件并且当其中一个事件发生时,事件B才发生,有才发生,有: 全概公式全概公式数学与生物信息学教研室Mathematics & Bioinformatics Group 贝叶斯公式在实际中有很多应用,它贝叶斯公式在实际中有很多应用,它可以帮助人们确定某结果(事件可以帮助人们确定某结果(事件 B)发生)发生的最可能原因的最可能原因.数学与生物信息学教研室Mathematics & Bioinformatics Group 例:市场上某种商品是由例:市场上某种商品是由3个厂家同时供个厂家同时供货。其供应量是第一个厂家为第二个厂家货。其供应量是第一个厂家为第二个厂家的的2倍,第二,三两个厂

18、家相等,而且各倍,第二,三两个厂家相等,而且各厂产品的次品率依次为:厂产品的次品率依次为:2,2和和4。顾客任意选购一种该种商品是次品顾客任意选购一种该种商品是次品,求次求次品来自第二厂的概率?品来自第二厂的概率?数学与生物信息学教研室Mathematics & Bioinformatics Group 例例:箱中有一号袋箱中有一号袋1个,二号袋个,二号袋2个,一号袋个,一号袋中装中装1个红球,个红球,2个黄球,每个二号袋中装个黄球,每个二号袋中装有有2个红球,个红球,1个黄球。现从箱中随机抽取个黄球。现从箱中随机抽取1袋,再从袋中随机抽取袋,再从袋中随机抽取1球,结果是红球。球,结果是红球。

19、求这个红球来自一号袋的概率。求这个红球来自一号袋的概率。数学与生物信息学教研室Mathematics & Bioinformatics Group 例例:某人乘火车,轮船,汽车某人乘火车,轮船,汽车,飞机来的概飞机来的概率分别为率分别为0.3,0.2,0.1,0.4。若他乘火。若他乘火车,轮船,汽车来,迟到的概率分别为车,轮船,汽车来,迟到的概率分别为0.2,0.3和和0.5。而乘飞机来则不会迟到。结。而乘飞机来则不会迟到。结果他迟到了,问他乘火车来的概率?果他迟到了,问他乘火车来的概率?数学与生物信息学教研室Mathematics & Bioinformatics Group 第三节第三节

20、随机变量及其概率分布随机变量及其概率分布38一、一、随机变量随机变量二、二、离散型随机变量的分布离散型随机变量的分布 1、概率分布概率分布 2、概率分布函数概率分布函数 3、常用的离散型随机变量的分布常用的离散型随机变量的分布三、三、连续型随机变量的分布连续型随机变量的分布 1、密度函数的概念密度函数的概念 2、常用的连续型随机变量的分布常用的连续型随机变量的分布数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、随机变量随机变量39数学与生物信息学教研室Mathematics & Bioinformatics Group 在实际问题中,随机试验

21、的结果可以用数在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念量来表示,由此就产生了随机变量的概念.数学与生物信息学教研室Mathematics & Bioinformatics Group 1、有些试验结果本身与数值有关(本身、有些试验结果本身与数值有关(本身就是一个数)就是一个数). 例如,掷一颗骰子面上出现的点数;例如,掷一颗骰子面上出现的点数; 七月份郑州的最高温度;七月份郑州的最高温度;每天从郑州下火车的人数;每天从郑州下火车的人数;昆虫的产卵数;昆虫的产卵数;数学与生物信息学教研室Mathematics & Bioinformatics Group 2、在有

22、些试验中,试验结果看来与数值无、在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各关,但我们可以引进一个变量来表示它的各种结果种结果.也就是说,也就是说,把试验结果数值化把试验结果数值化. 正如裁判员在运动正如裁判员在运动场上不叫运动员的场上不叫运动员的名字而叫号码一样,名字而叫号码一样,二者建立了一种对二者建立了一种对应关系应关系. 数学与生物信息学教研室Mathematics & Bioinformatics Group (1)它随试验结果的不同而取不同的值,)它随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值的范围,因而在试验之前只知道它可能取值的范围,

23、而不能预先肯定它将取哪个值而不能预先肯定它将取哪个值.(2)由于试验结果的出现具有一定的概)由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率定范围内的值也有一定的概率. 称这种定义在样本空间上的实值函数为称这种定义在样本空间上的实值函数为随随量量机机变变简记为简记为 r.v. 数学与生物信息学教研室Mathematics & Bioinformatics Group 例如,从某一学校随机选一例如,从某一学校随机选一学生,测量他的身高学生,测量他的身高. 我们可以把可能的我们可以把可能的身高看作随机变量身高看作随机变

24、量X,然后我们可以提出关于然后我们可以提出关于X的各种问题的各种问题. 如如 P(X1.7)=? P(X1.5)=?P(1.5X1.7)=?数学与生物信息学教研室Mathematics & Bioinformatics Group 这时这时,要么要么x1.7米,要么米,要么x 1.7米,米, 再去求再去求P(x 1.7米米)就没有什么意义了就没有什么意义了. 一旦我们实际选定了一个一旦我们实际选定了一个 学生并量了他的身高之后,学生并量了他的身高之后,我们就得到我们就得到X的一个具体的的一个具体的值,记作值,记作x.数学与生物信息学教研室Mathematics & Bioinformatics

25、 Group 有了随机变量有了随机变量,随机试验中的各种事件,随机试验中的各种事件,就可以通过随机变量的关系式表达出来就可以通过随机变量的关系式表达出来. 引入随机变量的意义引入随机变量的意义 如:单位时间内某电话交换台收到的呼如:单位时间内某电话交换台收到的呼叫次数用叫次数用X表示,它是一个随机变量表示,它是一个随机变量. 事件事件收到不少于收到不少于1次呼叫次呼叫 X 1 没有收到呼叫没有收到呼叫 X= 0 数学与生物信息学教研室Mathematics & Bioinformatics Group 可见,随机事件这个概念实际上是包可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内

26、容在随机变量这个更广的概念内. 也可以也可以说,说,随机事件是从静态的观点来研究随机现随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,象,而随机变量则是一种动态的观点,就象就象数学分析中常量与变量的区别那样数学分析中常量与变量的区别那样.数学与生物信息学教研室Mathematics & Bioinformatics Group 随机变量概念的产生是概率论发展随机变量概念的产生是概率论发展史上的重大事件史上的重大事件. 引入随机变量后,对引入随机变量后,对随机现象统计规律的研究,就由对事件随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及及事件概率的研究扩大

27、为对随机变量及其取值规律的研究其取值规律的研究.事件及事件及事件概率事件概率随机变量及其随机变量及其取值规律取值规律数学与生物信息学教研室Mathematics & Bioinformatics Group 这两种类型的随机变量因为都是随机变这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处;但因其取量,自然有很多相同或相似之处;但因其取值方式不同,又有其各自的特点值方式不同,又有其各自的特点.随随机机变变量量连续型随机变量连续型随机变量离散型随机变量离散型随机变量学习时请注意它们各自的特点和描述方法学习时请注意它们各自的特点和描述方法.数学与生物信息学教研室Mathematics

28、 & Bioinformatics Group 二、二、离散型随机变量的分布离散型随机变量的分布数学与生物信息学教研室Mathematics & Bioinformatics Group 设设X是是一一个个离离散散型型随随机机变变量量,它它可可能能取取的值是的值是 x1, x2 , . 为了描述随机变量为了描述随机变量 X ,我们不仅需,我们不仅需要知道随机变量要知道随机变量X的取值,而且还应知道的取值,而且还应知道X取每个值的概率取每个值的概率.数学与生物信息学教研室Mathematics & Bioinformatics Group 一般地,我们给出如下定义一般地,我们给出如下定义:其中其

29、中 (k=1,2, ) 满足:满足: k=1,2, (1)(2) 定定义义1 :设设xk(k=1,2, )是是离离散散型型随随机变量机变量X所取的一切可能值,称所取的一切可能值,称 k=1,2, 为为离离散散型型随随机机变变量量X的的概概率率函函数数或或分分布布律,也称概率分布律,也称概率分布.用这两条性质判断用这两条性质判断一个函数是否是一个函数是否是概率函数概率函数数学与生物信息学教研室Mathematics & Bioinformatics Group 表示方法表示方法(1)列表法:)列表法:(2)图示法)图示法(3)公式法)公式法X任取任取3 个个球球X为为取到的白球数取到的白球数X可

30、能取的值可能取的值是是0,1,20.10.30.6kPK012数学与生物信息学教研室Mathematics & Bioinformatics Group 举例举例 某篮球运动员投中篮圈概率是某篮球运动员投中篮圈概率是0.9,求他,求他两次独立投篮投中次数两次独立投篮投中次数X的概率分布的概率分布.解:解: X可取可取0、1、2为值为值 P(X =0)=(0.1)(0.1)=0.01 P(X =1)= 2(0.9)(0.1) =0.18 P(X =2)=(0.9)(0.9)=0.81 且且 P(X =0)+ P(X =1)+ P(X =2)=1数学与生物信息学教研室Mathematics & B

31、ioinformatics Group 常常表示为:常常表示为: 这就是这就是X的概率分布的概率分布.数学与生物信息学教研室Mathematics & Bioinformatics Group 对于离散型随机变量,如果知道了它的对于离散型随机变量,如果知道了它的概率函数概率函数,也就知道了该随机变量取值的概率也就知道了该随机变量取值的概率规律规律. 在这个意义上,我们说在这个意义上,我们说 这里,我们介绍了离散型随机变量及其这里,我们介绍了离散型随机变量及其概率分布概率分布.离散型随机变量由它的概率函数唯一确定离散型随机变量由它的概率函数唯一确定. 下面,我们将向大家介绍另一种类型下面,我们将

32、向大家介绍另一种类型的随机变量的随机变量-连续型随机变量的描述方法连续型随机变量的描述方法.数学与生物信息学教研室Mathematics & Bioinformatics Group 三、三、连续型随机变量的分布连续型随机变量的分布57数学与生物信息学教研室Mathematics & Bioinformatics Group 连续型随机变量连续型随机变量X所有可能取值充满所有可能取值充满一个区间一个区间, 对这种类型的随机变量对这种类型的随机变量, 不能不能象离散型随机变量那样象离散型随机变量那样, 以指定它取每以指定它取每个值概率的方式个值概率的方式, 去给出其概率分布去给出其概率分布, 而

33、是通过给出所谓而是通过给出所谓“概率密度函数概率密度函数”的方的方式式. 下面我们就来介绍对连续型随机变量下面我们就来介绍对连续型随机变量的描述方法的描述方法.数学与生物信息学教研室Mathematics & Bioinformatics Group ,使得对任意使得对任意 , 有有 对于随机变量对于随机变量 X ,如果存在非负可积函数如果存在非负可积函数f(x) , x 则称则称 X为连续型为连续型r.v,称称 f(x)为为 X 的概率密度函的概率密度函数,简称为概率密度或密度数,简称为概率密度或密度.1. 连续型连续型r.v及其密度函数的定义及其密度函数的定义数学与生物信息学教研室Math

34、ematics & Bioinformatics Group 2. 概率密度函数的性质概率密度函数的性质1 o2 o这两条性质是判定一个这两条性质是判定一个函数函数 f(x)是否为某是否为某r.vX的的概率密度函数的充要条件概率密度函数的充要条件. f (x)xo面积为面积为1数学与生物信息学教研室Mathematics & Bioinformatics Group 要注意的是,密度函数要注意的是,密度函数 f (x)在某点处在某点处a的高度,并不反映的高度,并不反映X取值的概率取值的概率. 但是,但是,这个高度越大,则这个高度越大,则X取取a附近的值的概率就附近的值的概率就越大越大. 也可以

35、说,在某点密度曲线的高度也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度反映了概率集中在该点附近的程度. f (x)xo数学与生物信息学教研室Mathematics & Bioinformatics Group 下面给出几个下面给出几个r.v的例子的例子. 由于连续型由于连续型 r.v唯一被它的唯一被它的密度函数密度函数所确所确定定. 所以,若已知密度函数,该连续型所以,若已知密度函数,该连续型 r.v的概率规律就得到了全面描述的概率规律就得到了全面描述. f (x)xo数学与生物信息学教研室Mathematics & Bioinformatics Group (1)若)若 r.v

36、X的概率密度为:的概率密度为:则称则称X服从区间服从区间( a, b)上的均匀分布,记作:上的均匀分布,记作:X U(a, b) 它的实际背景是:它的实际背景是: r.v X 取值在区间取值在区间(a, b) 上,并且取值在上,并且取值在(a, b)中任意小区间中任意小区间内的概率与这个小区间的长度成正比内的概率与这个小区间的长度成正比.则则 X 具有具有(a,b)上的上的均匀分布均匀分布.数学与生物信息学教研室Mathematics & Bioinformatics Group 区间区间( 0, 1)上的均匀分布上的均匀分布U(0,1)在在计算机模拟中起着重要的作用计算机模拟中起着重要的作用

37、. 实用中,用计算机程序可以在短时实用中,用计算机程序可以在短时间内产生大量服从间内产生大量服从 ( 0, 1)上均匀分布的随上均匀分布的随机数机数. 它是由一种迭代过程产生的它是由一种迭代过程产生的. 严格地说,计算机中产生的严格地说,计算机中产生的U (0,1) 随随机数并非完全随机,但很接近随机,故常机数并非完全随机,但很接近随机,故常称为称为伪随机数伪随机数.数学与生物信息学教研室Mathematics & Bioinformatics Group 如取如取n足够大,独立产生足够大,独立产生n个个U(0,1)随机数,则从用这随机数,则从用这 n 个数字画出的频率个数字画出的频率直方图就

38、可看出,它很接近于直方图就可看出,它很接近于( 0, 1)上上的均匀分布的均匀分布U(0,1).数学与生物信息学教研室Mathematics & Bioinformatics Group 则称则称 X 服从参数为服从参数为 的指数分布的指数分布. 指数分布常用于可靠性统计研究指数分布常用于可靠性统计研究中,如元件的寿命中,如元件的寿命.(2)若)若 r.v X具有概率密度具有概率密度常简记为常简记为 XE( ) .数学与生物信息学教研室Mathematics & Bioinformatics Group 至此,我们已初步介绍了两类重要的随至此,我们已初步介绍了两类重要的随机变量机变量: 离散型

39、离散型r.v和连续型和连续型r.v 能不能对它们给出一种统一的描述方能不能对它们给出一种统一的描述方法?法? 这就是下面要介绍的分布函数这就是下面要介绍的分布函数. f (x)xoxP(x)o对它们分别用概率函数和密度函数描述对它们分别用概率函数和密度函数描述 .数学与生物信息学教研室Mathematics & Bioinformatics Group 第四节第四节 随机变量的数字特征随机变量的数字特征68一、一、 数学期望数学期望二二 、方差和标准差方差和标准差数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、 数学期望数学期望69数学与生物

40、信息学教研室Mathematics & Bioinformatics Group 在前面的课程中,我们讨论了随机变量在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量及其分布,如果知道了随机变量X的概率分的概率分布,那么布,那么X的全部概率特征也就知道了的全部概率特征也就知道了. 然而,在实际问题中,概率分布一般然而,在实际问题中,概率分布一般是较难确定的是较难确定的. 而在一些实际应用中,人而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了只要知道它的某些数字特征就够了.数学与生物信息学教研室Mathe

41、matics & Bioinformatics Group 因此,在对随机变量的研究中,确定因此,在对随机变量的研究中,确定某些数字特征是重要的某些数字特征是重要的 .我们先介绍随机变量的数学期望我们先介绍随机变量的数学期望.在这些数字特征中,最常用的是在这些数字特征中,最常用的是期望期望和和方差方差数学与生物信息学教研室Mathematics & Bioinformatics Group 离散型随机变量的数学期望离散型随机变量的数学期望 1、概念的引入:、概念的引入: 某车间对工人的生产情况某车间对工人的生产情况进行考察进行考察. 车工小张每天生产车工小张每天生产的废品数的废品数X是一个随机

42、变量是一个随机变量. 如如何定义何定义X的平均值呢?的平均值呢? 数学与生物信息学教研室Mathematics & Bioinformatics Group 若统计若统计100天天, 例例1 某车间对工人的生产情况进行考察某车间对工人的生产情况进行考察. 车工车工小张每天生产的废品数小张每天生产的废品数X是一个随机变量是一个随机变量. 如如何定义何定义X的平均值呢?的平均值呢?32天没有出废品天没有出废品;30天每天出一件废品天每天出一件废品;17天每天出两件废品天每天出两件废品;21天每天出三件废品天每天出三件废品;可以得到这可以得到这100天中天中 每天的平均废品数为每天的平均废品数为这个

43、数能否作为这个数能否作为X的平均值呢?的平均值呢?数学与生物信息学教研室Mathematics & Bioinformatics Group 可以想象,若另外统计可以想象,若另外统计100天,车工小张不天,车工小张不出废品,出一件、二件、三件废品的天数与出废品,出一件、二件、三件废品的天数与前面的前面的100天一般不会完全相同,这另外天一般不会完全相同,这另外100天每天的平均废品数也不一定是天每天的平均废品数也不一定是1.27.n0天没有出废品天没有出废品;n1天每天出一件废品天每天出一件废品;n2天每天出两件废品天每天出两件废品;n3天每天出三件废品天每天出三件废品.可以得到可以得到n天中

44、每天的平均废品数为天中每天的平均废品数为(假定小张每天至多出假定小张每天至多出三件废品三件废品) 一般来说一般来说,若统计若统计n天天,数学与生物信息学教研室Mathematics & Bioinformatics Group 这是这是以频率为权的加权平均以频率为权的加权平均由频率和概率的关系由频率和概率的关系 不难想到,在求废品数不难想到,在求废品数X的平均值时,用的平均值时,用概率代替概率代替频率频率,得平均值为,得平均值为这是这是以概率为权的加权平均以概率为权的加权平均这样得到一个确定的数这样得到一个确定的数. 我们就用这个数作为我们就用这个数作为随机变量随机变量X的平均值的平均值 .这

45、样做是否合理呢?这样做是否合理呢?数学与生物信息学教研室Mathematics & Bioinformatics Group 则对则对X作一系列观察作一系列观察(试验试验),所得,所得X的试验值的试验值的平均值也是随机的的平均值也是随机的.由此引入离散型由此引入离散型r.vX的数学期望的定义如下的数学期望的定义如下: 对于一个随机变量,若它可能取的值是对于一个随机变量,若它可能取的值是X1,X2, , 相应的概率为相应的概率为 p1,p2, , 但是,如果试验次数很大,出现但是,如果试验次数很大,出现Xk的频率会的频率会接近于接近于pk,于是可期望试验值的平均值接近于是可期望试验值的平均值接近

46、数学与生物信息学教研室Mathematics & Bioinformatics Group 定义定义1 设设X是离散型随机变量,它的概率函数是离散型随机变量,它的概率函数是是: P(X=Xk)=pk , k=1,2,也就是说也就是说,离散型随机变量的数学期望是一个绝离散型随机变量的数学期望是一个绝对收敛的级数的和对收敛的级数的和.如果如果有限有限,定义定义X的数学期望的数学期望数学与生物信息学教研室Mathematics & Bioinformatics Group 连续型随机变量的数学期望连续型随机变量的数学期望 设设X是连续型随机变量,其密度函数为是连续型随机变量,其密度函数为f (x),

47、在数轴上取很密的分点在数轴上取很密的分点x0 x1x2 ,则则X落落在小区间在小区间xi, xi+1)的概率是的概率是小区间小区间xi, xi+1)阴影面积阴影面积近似为近似为数学与生物信息学教研室Mathematics & Bioinformatics Group 小区间小区间Xi, Xi+1) 由于由于xi与与xi+1很接近很接近, 所以区间所以区间xi, xi+1)中中的值可以用的值可以用xi来近似代替来近似代替.这正是这正是的渐近和式的渐近和式.阴影面积阴影面积近似为近似为近似近似,因此因此X与以概率与以概率取值取值xi的离散型的离散型r.v 该离散型该离散型r.v 的的数学期望数学期

48、望是是数学与生物信息学教研室Mathematics & Bioinformatics Group 由此启发我们引进如下定义由此启发我们引进如下定义.定义定义2 设设X是连续型随机变量,其密度函数是连续型随机变量,其密度函数 为为 f (x),如果如果有限有限,定义定义X的数学期望为的数学期望为也就是说也就是说,连续型随机变量的数学期望是一个绝连续型随机变量的数学期望是一个绝对收敛的积分对收敛的积分.数学与生物信息学教研室Mathematics & Bioinformatics Group 若若XU(a,b),即即X服从服从( a,b)上的均匀分布上的均匀分布,则则若若X服从服从若若X服从参数为

49、服从参数为由随机变量数学期望的定义,不难计算得:由随机变量数学期望的定义,不难计算得:数学与生物信息学教研室Mathematics & Bioinformatics Group 这意味着,若从该地区抽查很多个成这意味着,若从该地区抽查很多个成年男子,分别测量他们的身高,那么,这年男子,分别测量他们的身高,那么,这些身高的平均值近似是些身高的平均值近似是1.68. 已知某地区成年男子身高已知某地区成年男子身高X数学与生物信息学教研室Mathematics & Bioinformatics Group 数学期望的性质数学期望的性质 1. 设设C是常数,则是常数,则E(C)=C; 4. 设设X、Y独

50、立,则独立,则 E(XY)=E(X)E(Y); 2. 若若k是常数,则是常数,则E(kX)=kE(X); 3. E(X1+X2) = E(X1)+E(X2);(诸(诸Xi独立时)独立时)注意注意:由由E(XY)=E(X)E(Y)不一定能推出不一定能推出X,Y独立独立数学与生物信息学教研室Mathematics & Bioinformatics Group 这里,我们介绍了随机变量的数学期这里,我们介绍了随机变量的数学期望,它反映了随机变量取值的平均水平,望,它反映了随机变量取值的平均水平,是随机变量的一个重要的数字特征是随机变量的一个重要的数字特征.下面,我们将向大家介绍随机变量另一个下面,我

51、们将向大家介绍随机变量另一个重要的数字特征:重要的数字特征:方差方差数学与生物信息学教研室Mathematics & Bioinformatics Group 二二 、方差和标准差方差和标准差85数学与生物信息学教研室Mathematics & Bioinformatics Group 前面我们介绍了随机变量的数学期望,前面我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征机变量的一个重要的数字特征. 但是在一些场合,仅仅知道平均值是但是在一些场合,仅仅知道平均值是不够的不够的.数学与生物信息学教研室Mathemat

52、ics & Bioinformatics Group 例如,某零件的真实长度为例如,某零件的真实长度为a,现用甲、,现用甲、乙两台仪器各测量乙两台仪器各测量10次,将测量结果次,将测量结果X用坐用坐标上的点表示如图:标上的点表示如图: 若让你就上述结果评价一下两台仪器的优若让你就上述结果评价一下两台仪器的优劣,你认为哪台仪器好一些呢?劣,你认为哪台仪器好一些呢?乙仪器测量结果乙仪器测量结果 甲仪器测量结果甲仪器测量结果较好较好测量结果的测量结果的均值都是均值都是 a因为乙仪器的测量结果集中在均值附近因为乙仪器的测量结果集中在均值附近数学与生物信息学教研室Mathematics & Bioinf

53、ormatics Group 又如又如,甲、乙两门炮同时向一目标射击甲、乙两门炮同时向一目标射击10发炮发炮弹,其落点距目标的位置如图:弹,其落点距目标的位置如图:你认为哪门炮射击效果好一些呢你认为哪门炮射击效果好一些呢?甲炮射击结果甲炮射击结果乙炮射击结果乙炮射击结果乙炮乙炮因为乙炮的弹着点较集中在中心附近因为乙炮的弹着点较集中在中心附近 . 中心中心中心中心数学与生物信息学教研室Mathematics & Bioinformatics Group 为此需要引进另一个数字特征为此需要引进另一个数字特征,用它用它来度量随机变量取值在其中心附近的离来度量随机变量取值在其中心附近的离散程度散程度.

54、这个数字特征就是我们下面要介绍的这个数字特征就是我们下面要介绍的方差方差数学与生物信息学教研室Mathematics & Bioinformatics Group 方差的定义:方差的定义: 采用平方是为了保证一切采用平方是为了保证一切差值差值X-E(X)都起正面的作用都起正面的作用 由于它与由于它与X具有相同的度量单位,在具有相同的度量单位,在实际问题中经常使用实际问题中经常使用. 方差的算术平方根方差的算术平方根 称为标准称为标准差差设设X是是一一个个随随机机变变量量,若若E(X-E(X)2,则则称称D(X)=EX-E(X)2 (1)为为X的方差的方差.数学与生物信息学教研室Mathemat

55、ics & Bioinformatics Group 若若X的取值比较分散,则方差较大的取值比较分散,则方差较大 .若方差若方差D(X)=0,则则r.v X 以概率以概率1取常数值取常数值 . 方差刻划了随机变量的取值对于其数学方差刻划了随机变量的取值对于其数学期望的离散程度期望的离散程度 .若若X的取值比较集中,则方差较小;的取值比较集中,则方差较小;D(X)=EX-E(X)2数学与生物信息学教研室Mathematics & Bioinformatics Group X为离散型,为离散型,P(X=xk)=pk 由定义知,方差是随机变量由定义知,方差是随机变量X的函数的函数g(X)=X-E(X

56、)2的的数学期望数学期望 .X为连续型,为连续型,Xf(x)数学与生物信息学教研室Mathematics & Bioinformatics Group 计算方差的一个简化公式:计算方差的一个简化公式: D(X)=E(X2)-E(X)2 展开展开证:证:D(X)=EX-E(X)2=EX2-2XE(X)+E(X)2=E(X2)-2E(X)2+E(X)2=E(X2)-E(X)2利用期望利用期望性质性质请自己用此公式计算常见分布的方差请自己用此公式计算常见分布的方差.数学与生物信息学教研室Mathematics & Bioinformatics Group 方差的性质:方差的性质: 1. 设设C是常数

57、是常数,则则D(C)=0; 2. 若若C是常数是常数,则则D(CX)=C2 D(X); 3. 若若X1与与X2 独立,则独立,则 D(X1+X2)= D(X1)+D(X2);可推广为:若可推广为:若X1,X2,Xn相互相互独立独立,则则X1 与与X2不一定独立时不一定独立时,D(X1 +X2 )=?请思考请思考数学与生物信息学教研室Mathematics & Bioinformatics Group 4. D(X)=0 P(X= C)=1, 这里这里C=E(X)P(X= x)下面我们用一例说明方差性质的应用下面我们用一例说明方差性质的应用 .数学与生物信息学教研室Mathematics & B

58、ioinformatics Group 例例 二项分布的方差二项分布的方差设设XB(n,p), 则则X表示表示n重贝努里试验中的重贝努里试验中的“成功成功” 次数次数 . 若设若设i=1,2,n 故故 D(Xi)= E(Xi2)-E(Xi)2E(Xi)=P(Xi=1)= p, E(Xi2)= p, 则则 是是n次试验中次试验中“成功成功” 的次数的次数= p- p2= p(1- p)数学与生物信息学教研室Mathematics & Bioinformatics Group 于是于是i=1,2,n D(Xi)= E(Xi2)-E(Xi)2 = p- p2= p(1- p)由于由于X1,X2,Xn

59、相互相互独立独立= np(1- p)数学与生物信息学教研室Mathematics & Bioinformatics Group 这里,我们介绍了随机变量的方差这里,我们介绍了随机变量的方差. 它是刻划随机变量取值在其中心附近离它是刻划随机变量取值在其中心附近离散程度的一个数字特征散程度的一个数字特征 .数学与生物信息学教研室Mathematics & Bioinformatics Group 第五节第五节 大数定律与中心极限定理大数定律与中心极限定理99一、一、大数定大数定理理 1、切比雪夫不等式切比雪夫不等式 2、切比雪夫大数定理切比雪夫大数定理 3、贝努利大数定理贝努利大数定理二、二、中心

60、极限定理中心极限定理数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、大数定大数定理理1001、切比雪夫不等式切比雪夫不等式若随机变量有数学期望和方差,则对于任意给定的正数,下列不等式成立: 数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、大数定大数定理理1012、切比雪夫大数定理切比雪夫大数定理设 是由两两独立的随机变量所构成的序列,每一随机变量都有有限的方差,并且有公共上界,即存在某一常数 ,使得:则对任意的 恒有:数学与生物信息学教研室Mathematics & Bioinformati

61、cs Group 一、一、大数定大数定理理1023、贝努利大数定理贝努利大数定理 设m是n次贝努利试验中事件 出现的次数, 是事件 在每次试验中出现的概率,则对任意的 ,恒有:数学与生物信息学教研室Mathematics & Bioinformatics Group 二、二、中心极限定理中心极限定理103 设 是两两相互独立的随机变量序列,且具有相同有限的数学期望和方差:则随机变量:的分布函数 对任意x 满足数学与生物信息学教研室Mathematics & Bioinformatics Group 第六节第六节 数理统计简介数理统计简介104一、一、几个基本概念几个基本概念 1、总体与样本总体

62、与样本 2、统计量统计量二、二、参数估计参数估计 1、点估计点估计 2、区间估计区间估计三、三、假设检验假设检验 1、运用概率性质的反证法运用概率性质的反证法 2、小概率事件的实际不可能原理小概率事件的实际不可能原理 3、显著性水平和临界值显著性水平和临界值数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、几个基本概念几个基本概念1051、总体与样本总体与样本研究对象的全体称为总体总体,从总体中抽取的部分代表成为样本样本。数学与生物信息学教研室Mathematics & Bioinformatics Group 一、一、几个基本概念几个基本概念

63、1062、统计量统计量样本的函数称为统计量统计量数学与生物信息学教研室Mathematics & Bioinformatics Group 二、二、参数估计参数估计1071、点估计点估计 由样本所确定的统计量作为总体未知参数的估计值的方法称为参数的点估计点估计数学与生物信息学教研室Mathematics & Bioinformatics Group 二、二、参数估计参数估计1082、区间估计区间估计设 是总体的未知参数, 和 是由样本确定的两个统计量,对于给定的(01),满足:则称随机区间(1,2)是参数的置信度为 的置信区间,1,2为置信区间的下限和上限, 为置信度.数学与生物信息学教研室M

64、athematics & Bioinformatics Group 三、三、假设检验假设检验1091、运用概率性质的反证法运用概率性质的反证法 为了检验一个假设是否成立先假定这个假设是成立的,然后看由此会产生什么结果,如果导致了一个不合理现象的出现,就说原假设是不成立的,因而要拒绝原假设;如果没有不合理现象出现,则不能拒绝假设,此时称原假设是相容的.这种基本思想方法称为概率性质的反证法,它与纯数学的反证法是不同的.数学与生物信息学教研室Mathematics & Bioinformatics Group 三、三、假设检验假设检验1102、小概率事件的实际不可能原理小概率事件的实际不可能原理 概

65、率很小的事件,在一次试验中几乎是不会发生的.如果根据假设条件计算出某事件发生的概率很小,而在一次试验中,该事件竟然发生了,则可以认为所作的假设不正确,从而拒绝所作的假设,这就是小概率事件实际不可能原理,简标小概率原小概率原理理.数学与生物信息学教研室Mathematics & Bioinformatics Group 三、三、假设检验假设检验1113、显著性水平和临界值显著性水平和临界值 根据上述原理建立起来的检验方法标为显著性检验.我们可以给定一个临界概率,把概率不超过这个临界概率的事件当做“小概率事件”,通常把这个临界概率取为0.05,又称其为显著性水平。 当显著性水平确定后,选定一个适当的统计量,计算出统计量在某一范围内的概率,如果根据样本值计算出统计量的值落在上述范围内,则拒绝原假设,若计算出的统计量的值不落在此范围内,则不能拒绝原假设。数学与生物信息学教研室Mathematics & Bioinformatics Group 112Any Questions?

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号