第3章实验数据分析理论分布与抽样分布ppt课件

上传人:资****亨 文档编号:145854450 上传时间:2020-09-23 格式:PPT 页数:107 大小:938.50KB
返回 下载 相关 举报
第3章实验数据分析理论分布与抽样分布ppt课件_第1页
第1页 / 共107页
第3章实验数据分析理论分布与抽样分布ppt课件_第2页
第2页 / 共107页
第3章实验数据分析理论分布与抽样分布ppt课件_第3页
第3页 / 共107页
第3章实验数据分析理论分布与抽样分布ppt课件_第4页
第4页 / 共107页
第3章实验数据分析理论分布与抽样分布ppt课件_第5页
第5页 / 共107页
点击查看更多>>
资源描述

《第3章实验数据分析理论分布与抽样分布ppt课件》由会员分享,可在线阅读,更多相关《第3章实验数据分析理论分布与抽样分布ppt课件(107页珍藏版)》请在金锄头文库上搜索。

1、.,第三章 理论分布与抽样分布,理解统计分析的基本原理,正确掌握和应用统计分析方法, 概率论中最基本的两个概念 事件 概率 常用的几种随机变量的概率分布正态分布、二项分布、波松分布以及样本平均数的抽样分布和t分布。,下一张,主 页,退 出,上一张,.,1 事件与概率,1.1 事 件 1.1.1 必然现象与随机现象 在自然界与生产实践和科学试验中,人们会观察到各种各样的现象,把它们归纳起来,大体上分为两大类:,下一张,主 页,退 出,上一张,.,必然现象:可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,必然发生的(或必然不发生)。这类现象称为必然现象(inevitabl

2、e phenomena)或确定性现象(definite phenomena)。 随机现象:另一类是事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同。这类在个别试验中其结果呈现偶然性、不确定性现象,称为随机现象(random phenomena )或不确定性现 象(indefinite phenomena)。,下一张,主 页,退 出,上一张,.,随机现象或不确定性现象,有如下特点: 在一定的条件实现时,有多种可能的结果发生,事前人们不能预言将出现哪种结果; 对一次或少数几次观察或试验而言,其结果呈现偶然性、不确定性; 但在相同条件下进行大量重复试验时,其试验结果却呈现

3、出某种固有的、特定的规律性频率的稳定性,通常称之为随机现象的统计规律性。,下一张,主 页,退 出,上一张,.,1.1.2 随机试验与随机事件 1 随机试验 通常我们把根据某一研究目的 , 在一定条件下对自然现象所进行的观察或试验统称为试验(trial)。,下一张,主 页,退 出,上一张,.,当一个试验如果满足下述三个特性 , 则 称 其 为 一个 随机试验(random trial),简称试验。 (1)试验可以在相同条件下多次重复进行; (2)每次试验的可能结果不止一个 ,并且事先知道会有哪些可能的结果; (3)每次试验总是恰好出现这些可能结果中的一个 ,但在一次试验之前却不能肯定这次试验会出

4、现哪一个结果。,下一张,主 页,退 出,上一张,.,2 随机事件 随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,称为随机事件(random event),简称 事 件(event),通常用A、B、C等来表示。 (1)基本事件 我 们 把 不 能 再 分的事件称为基本事件(elementary event) , 也 称为 样本点(sample point)。,下一张,主 页,退 出,上一张,.,例如,从编号为1、2、3、10 的十个篮球中随机抽取1个篮球,有10种不同的可能结果: “ 取 得 一 个 编 号 是 1” 、 “ 取得一个编号是2”、“取得一个编号是10”,这10个事

5、件都是不可能再分的事件,它们都是基本事件。 由若干个基本事件组合而成的事件称为 复合事件 (compound event)。如 “取得一个编号是 2的倍数”是一个复合事件,它由 “ 取得一个编号是2 ”、 “ 是4”、“是6、“是8”、“是10” 5个基本事件组合而成。,下一张,主 页,退 出,上一张,.,(2)必然事件 把在一定条件下必然会发生的事件称为必然事件(certain event),用oumige表示。 例如,一个大气压下,水加热到100C,水会沸腾;种瓜得瓜、种豆得豆,下一张,主 页,退 出,上一张,(3)不可能事件 在一定条件下不可能发生的事件称为不可能事件(impossibl

6、e event),用fai表示。例如,在满足一定孵化条件下,从石头孵化出小鸡,就是一个不可能事件。 必然事件与不可能事件实际上是确定性现象,它们不是随机事件, 但 是 为了方便起见,我们把它们看作为两个特殊的随机事件。,.,1.2 概 率 1.2.1 概率统计定义 研究随机试验,仅知道可能发生哪些随机事件是不够的,还需了解各种随机事件发生的可能性大小,以揭示这些事件的内在的统计规律性,从而指导实践。 这就要求有一个能够表示事件发生可能性大小的数量指标,这个指标应该是事件本身所固有的,且不随人的主观意志而改变,人们称之为概率(probability)。事件A的概率记为P(A)。,下一张,主 页,

7、退 出,上一张,概率:表示随机事件发生可能性大小的数量指标,.,概率的统计定义: 在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值 p , 那么就把 p称为随机事件A的概率。,下一张,主 页,退 出,上一张,如此定义的概率称为统计概率(statistics probability),或者称后验概率(posterior probability)。,.,表3-1 抛掷一枚硬币发生正面朝上的试验记录,下一张,主 页,退 出,上一张,例如 为了确定抛掷一枚硬币出现正面朝上

8、这个事件的概率 ,历史上有人作过成千上万次抛掷硬币的试验。在表31中列出了他们的试验记录。,.,从表3-1可看出,随着实验次数的增多,正面朝上这个事件发生的频率越来越稳定地接近0.5,我们就把0.5作为这个事件的概率。 在一般情况下,随机事件的概率p是不可能准确得到的。通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。 即 P(A)=pm/n (n充分大)(3-1),下一张,主 页,退 出,上一张,.,1.2.2 概率的性质 (1)对于任何事件A,有0P(A)1; (2)必然事件的概率为1,即P()=1; (3)不可能事件的概率为0,即P()=0。,.,2 概率分布,事件的概

9、率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probability distribution)。为了深入研究随机试验 ,我 们 先引入随机变量(random variable)的概念。,下一张,主 页,退 出,上一张,.,2.1 随机变量,下一张,主 页,退 出,上一张,2004年奶粉事件“大头娃”,描述随机事件的变量称为随机变量。 作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值,则试验结果可用变量x来表示。 随机变量的取值在一次试验前不能确定,具有随

10、机性。 【例】 对10种品牌袋装奶粉进行质量检测,其可能结果是“0种合格”、 “1种合格”、“2种合格”、“”、“10种袋装奶粉都合格”。若用x表示袋装奶粉合格品牌数,则x的取值为0、1、2、10。,.,【例】 食品加工中高温杀菌可能结果只有两种,即“全部杀死细菌”与“未能全部杀死细菌”。 若用变量x表示试验的两种结果,则可令x=0表示“未能全部杀死细菌”,x=1表示“全部杀死细菌”。 【例】 测定关中地区不同小麦品种的蛋白质含量,其蛋白质含量在9.3-13.5之间,如用x表示测定结果,那么x值可以是这个范围内的任何实数。,下一张,主 页,退 出,上一张,.,离 散 型 随 机 变 量:如果表

11、示试验结果的变量x,其可能取值为可数个 ,且 以各种确定的概率取这些不同的值 , 则 称 x 为 离 散 型 随 机 变 量 ( discrete random variable); 连续 型 随 机 变 量:如果表示试验结果的变量x ,其可能取值为某范围内的任何数值 ,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为 连续 型 随 机 变 量 ( continuous random variable)。,下一张,主 页,退 出,上一张,试验结果和取此结果的概率可以一一列出。,不能列出试验结果和取此结果的概率,只能给出一定范围和在此范围内取值的概率。,.,2.2 离散型随机变量的

12、概率分布 要了解离散型随机变量x的统计规律,就必须 知 道它的一切可能值xi及取每种可能值的概率pi。 如果我们将离散型随机变量x的一切可能取值xi ( i=1, 2 , ),及其对应的概率pi,记作 P(x=xi)=pi i=1,2, (33) 则称 (33)式为离散型随机变量x的概率分布或分布。常用 分 布 列 (distribution series)来表示:,下一张,主 页,退 出,上一张,.,x1 x2 xn . p1 p2 pn 从分布列可以一目了然看出随机变量X的可能取值及取这些值的概率。 离散型随机变量的概率分布具有pi0和pi=1这两个基本性质。 2.3 连续型随机变量的概率

13、分布 连续型随机变量 (如身高、体重等)的概率分布不能用分布列来表示, 因为其可能取值是不可数的,不能一一列出。改用随机变量x在某个区间内取值的概率P(axb)来表示。 下面通过频率分布密度曲线予以说明。,下一张,主 页,退 出,上一张,.,图41为数据资料的频率分布直方图 ,图中纵座标取频率与组距的比值 。可以设想 ,如果样本取得越来越大(n+),组分得越来越细(i0),某一范围内的频率将趋近于一个稳定值 概率。这时 , 频率分布直方图各个直方上端中点的连线 频率分布折线将逐渐趋向于一条曲线。,下一张,主 页,退 出,上一张,.,当n+、i0时,频率分布折线的极限是一条稳定的函数曲线。 对于

14、样本是取自连续型随机变量的情况 ,这条函数曲线将是光滑的。 这条曲线排除了抽样和测量的误差 , 完 全 反映了数据 资料的变动规律。 这条曲线叫概率分布密度曲线,相应的函数叫 概率分布密度函数 ,简称分布密度。,下一张,主 页,退 出,上一张,.,(34) 式 为 连 续 型 随机变量 x 在 区间a,b)上取值概率的表达式。可见,连续型随机变量的概率由概率分布密度函数确定。,若变量X概率分布密度函数记为f(x),则x取值于区间a,b)的概率为图中阴影部分的面积,即 P(axb)= (3-4),.,连续型随机变量概率分布的性质: 1、分布密度函数总是大于或等于0,即f(x)0; 2、当随机变量

15、x取某一特定值时,其概率等于0;即 (c为任意实数) 所以,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个值(点)的概率。,下一张,主 页,退 出,上一张,连续型随机变量某一点的概率为0。,.,3、 随机变量x取值 在 -x+范围内,所以,下一张,主 页,退 出,上一张,(3-5),(35)式表示分布密度曲线与横轴所围成的区间全 部面积为1。,P(axb)=,4、随机变量X取a,b)区间值的概率为:,.,3 理论分布,3.1 二项分布 3.1.1 贝努利试验及其概率公式 贝努利试验:对于n次独立的试验 , 如果每次试验结果出现且只出现对立事件A与 之一, 在每次试验中

16、出现A的概率是常数p(0p1) , 因而出现对立事件 的概率是1-p=q,则 称 这一串重复的独立试验为n重贝努利试验,简称贝努利试验(Bernoulli trials )。,下一张,主 页,退 出,上一张,重要的离散型分布,只有两种可能结果的随机试验称为贝努利试验,食品抽样中,产品合格或不合格, 种子发芽或不发芽,施药后害虫死或活等等。,.,贝努利试验的概率公式,在贝努利试验中,事件A可能发生,也可能不发生,用随机变量x表示贝努利试验的两种结果,记A发生时取1,A不发生时取0。那么,贝努利试验的概率公式可以表示为:,也称为两点分布,(3-6),.,在n重贝努利试验中,事件 A 可能发生0,1,2,n次,现在我们来求事件 A 恰好发生k(0kn)次的概率Pn(k)。事件A在n次试验中正好发生k次共有 种情况。由贝努利试验的独立性可知,A在k次实验中发生,而在其余n-k次试验中不发生的概率为,下一张,主 页,退 出,上一张,3.1.2 二项分

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号