概率概率分布和抽样分布

上传人:ap****ve 文档编号:117071962 上传时间:2019-11-18 格式:PPT 页数:170 大小:3.30MB
返回 下载 相关 举报
概率概率分布和抽样分布_第1页
第1页 / 共170页
概率概率分布和抽样分布_第2页
第2页 / 共170页
概率概率分布和抽样分布_第3页
第3页 / 共170页
概率概率分布和抽样分布_第4页
第4页 / 共170页
概率概率分布和抽样分布_第5页
第5页 / 共170页
点击查看更多>>
资源描述

《概率概率分布和抽样分布》由会员分享,可在线阅读,更多相关《概率概率分布和抽样分布(170页珍藏版)》请在金锄头文库上搜索。

1、统计学 STATISTICS 1 第第 3 3 章章 概率、概率分布与抽样分布概率、概率分布与抽样分布 统计学 STATISTICS 2 第第 3 3 章章 概率、概率分布与抽样分布概率、概率分布与抽样分布 3.1 3.1 事件及其概率事件及其概率 3.2 3.2 随机变量及其概率分布随机变量及其概率分布 3.3 3.3 常用的抽样方法常用的抽样方法 3.4 3.4 抽样分布抽样分布 3.5 3.5 中心极限定理的应用中心极限定理的应用 统计学 STATISTICS 3 3.1 3.1 事件及其概率事件及其概率 3.1.1 试验、事件和样本空间 3.1.2 事件的概率 3.1.3 概率的性质和

2、运算法则 3.1.4 条件概率与事件的独立性 3.1.5 全概公式与逆概公式 统计学 STATISTICS 4 试验、事件和样本空间 统计学 STATISTICS 5 试 验 (experiment) 1. 对试验对象进行一次观察或测量的过程 掷一颗骰子,观察其出现的点数 从一副52张扑克牌中抽取一张,并观察其结果 (纸牌的数字或花色) 2. 试验的特点 可以在相同的条件下重复进行 每次试验的可能结果可能不止一个,但试验的 所有可能结果在试验之前是确切知道的 在试验结束之前,不能确定该次试验的确切结 果 具有这3个特点的试 验称为随机试验 统计学 STATISTICS 6 必然现象与随机现象

3、必然现象(确定性现象) 变化结果是事先可以确定的,一定的条件必然 导致某一结果 这种关系通常可以用公式或定律来表示 随机现象(偶然现象、不确定现象) 在一定条件下可能发生也可能不发生的现象 个别观察的结果完全是偶然的、随机会而定 大量观察的结果会呈现出某种规律性 (随机性中寓含着规律性) 统计规律性 十五的夜 晚能看见 月亮? 十五的月 亮比初十 圆! 统计学 STATISTICS 7 事件 (event) 1. 事件:试验的每一个可能结果(任何样本点 集合) 如:掷一颗骰子出现的点数为3 通常用大写字母A,B,C,表示 2. 随机事件(random event):每次试验可 能出现也可能不出

4、现的事件 掷一颗骰子可能出现的点数 随机试验的结果 称为事件 随机变量 统计学 STATISTICS 8 事件 (event) 1. 简单事件(simple event) :不能被分解 成其他事件组合的基本事件 掷一颗骰子出现点数3(小于3) 2. 必然事件(certain event):每次试验一定 出现的事件,用表示 掷一颗骰子出现的点数小于7 3. 不可能事件(impossible event):每次试 验一定不出现的事件,用表示 掷一颗骰子出现的点数大于6 统计学 STATISTICS 9 样本空间与样本点 1. 样本空间(sample Space) 一个试验中所有可能结果的集合,用表

5、示 例如:在掷一颗骰子的试验中,样本空间 表示为:1,2,3,4,5,6 在投掷硬币的试验中,正面,反面 2. 样本点( sample point) 样本空间中每一个特定的试验结果 用符号表示 统计学 STATISTICS 10 事件的概率 统计学 STATISTICS 11 概率 用来度量随机事件发生的可能性大小的数值 必然事件的概率为1,表示为P ( )=1 不可能事件发生的可能性是零,P( )=0 随机事件A的概率介于0和1之间02020,npnp 5 5时,时, 近似效果良好近似效果良好 统计学 STATISTICS 88 二项分布 泊松分布 可见,当n充分大,p又很小时,可用泊松 分

6、布来近似二项分布! 统计学 STATISTICS 89 泊松分布的背景及应用 二十世纪初卢瑟福和盖克两位科学家在观察 与分析放射性物质放出的 粒子个数的情况时, 他们做了2608次观察(每次时间为7.5秒)发现放 射性物质在规定的一段时间内, 其放射的粒子数 X服从泊松分布. 统计学 STATISTICS 90 电话呼唤次数交通事故次数 商场接待的顾客数 地震火山爆发特大洪水 在生物学、医学、工业统计、保险科学及 公用事业的排队等问题中 , 泊松分布是常见的. 例如地震、火山爆发、特大洪水、交换台的电 话呼唤次数等, 都服从泊松分布. 统计学 STATISTICS 91 由泊松定理,n重贝努里

7、试验中稀有事件 出现的次数近似地服从泊松分布。 我们把在每次试验中出现概率很小的事 件称作稀有事件。如地震、火山爆发、特大 洪水、意外事故等等 统计学 STATISTICS 92 某一地区,一个人患某种疾病的概率为0.01,设 各人患病与否相互独立.现随机抽取200人,求其 中至少4人患这种病的概率. 解 以X记200人中患此病的人数, 所求概率为 可查泊松分布表 则XB(200,0.01). 利用泊松定理, 统计学 STATISTICS 93 超几何分布 1. 采用不重复抽样,各次试验并不独立,成功 的概率也互不相等 2. 总体元素的数目N很小,或样本量n相对于N 来说较大时,样本中“成功”

8、的次数则服从超 几何概率分布 3. 概率分布函数为 其中,n表示试验次数;N表示总体中元素个数;M表示总 体中代表成功的元素的个数 ;l=min(M,n) 统计学 STATISTICS 94 超几何分布 (例题分析) 【例例】假定有假定有1010支股票,其中有支股票,其中有3 3支购买后可以获利,另外支购买后可以获利,另外7 7 支购买后将会亏损。如果你打算从支购买后将会亏损。如果你打算从1010支股票中选择支股票中选择4 4支购买支购买 ,但你并不知道哪,但你并不知道哪3 3支是获利的,哪支是获利的,哪7 7支是亏损的。求:支是亏损的。求: (1)(1)有有3 3支能获利的股票都被你选中的概

9、率有多大?支能获利的股票都被你选中的概率有多大? (2)3(2)3支可获利的股票中有支可获利的股票中有2 2支被你选中的概率有多大?支被你选中的概率有多大? 解:解:设设N N= =1010,MM=3=3,n n=4=4 统计学 STATISTICS 95 Jacob Bernoulli Born: 27 Dec 1654 in Basel, Switzerland Died: 16 Aug 1705 in Basel, Switzerland 伯努利资料 伯努利试验 统计学 STATISTICS 96 泊松资料 Born: 21 June 1781 in Pithiviers, France

10、 Died: 25 April 1840 in Sceaux (near Paris), France Simon Poisson 泊松分布 统计学 STATISTICS 97 概率密度函数与连续随机变量 统计学 STATISTICS 98 连续型随机变量 1. 连续型随机变量可以取某一区间或整个 实数轴上的任意一个值 2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率 5. 用概率密度函数的形式和分布函数的形 式来描述 统计学 STATISTICS 99 连续型随机变量与概率密度 则称X是连续型随机变量,f(X)称为X的概率密度

11、函 数,简称概率密度。 注意f(x)不是概 率 设X是随机变量,如果存在定义在整个实数轴上的函数 f(x),满足条件 统计学 STATISTICS 100 概率密度函数的性质 1) 2) 1 这两条性质是判定一 个函数 f(x)是否为某 个随机变量X的概率 密度函数的充要条件 3) X落入区间a,b内的概率 统计学 STATISTICS 101 连续型随机变量的期望和方差 1. 连续型随机变量的数学期望 2. 方差 统计学 STATISTICS 102 正态分布 统计学 STATISTICS 103 正态分布 (normal distribution) 1. 由C.F.高斯(Carl Frie

12、drich Gauss,1777 1855)作为描述误差相对频数分布的模型 而提出 2. 描述连续型随机变量的最重要的分布 3. 许多现象都可以由正态分布来描述 4. 可用于近似离散型随机变量的分布 例如: 二项分布当n越来越大,越近似服从 正态分布 5. 经典统计推断的基础 统计学 STATISTICS 104 = 正态随机变量X的均值 = 正态随机变量X的方差 = 3.1415926; e = 2.71828 x = 随机变量的取值 (- x ) 则称X服从参数为 、 的正态分布,记作 XN( , ) 正态分布 统计学 STATISTICS 105 正态分布函数的性质 1.图形是关于x=对

13、称钟形曲线,且峰值在x= 处 2.均值和标准差一旦确定,分布的具体形式也惟一确 定,不同参数正态分布构成一个完整的“正态分布族” 3.均值可取实数轴上的任意数值,决定正态曲线的具 体位置;标准差决定曲线的“陡峭”或“扁平”程度。 越大,正态曲线扁平;越小,正态曲线越高陡峭 4.当X的取值向横轴左右两个方向无限延伸时,曲线的 两个尾端也无限渐近横轴,理论上永远不会与之相交 5.正态随机变量在特定区间上的取值概率由正态曲线下 的面积给出,而且其曲线下的总面积等于1 统计学 STATISTICS 106 正态概率密度函数的几何特征 统计学 STATISTICS 107 相同而不同的正态曲线 2 x

14、f(x) 相同而不同的正态曲线 f(x)较小 较大 x 正态概率密度函数的几何特征 统计学 STATISTICS 108 标准正态分布 (standardize the normal distribution) 3.3. 标准正态分布标准正态分布的概率密度函数的概率密度函数 1.随机变量具有均值为0,标准差为1的正态分布 2.任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布 4.4. 标准正态分布标准正态分布的分布函数的分布函数 标准正态曲线 -a 0 a (z) z (a) 统计学 STATISTICS 109 正态分布 (例题分析) 【例例】定某公司职员每周的加班津贴服从均

15、值为定某公司职员每周的加班津贴服从均值为5050元、标准元、标准 差为差为1010元的正态分布,那么全公司中有多少比例的职员每周元的正态分布,那么全公司中有多少比例的职员每周 的加班津贴会超过的加班津贴会超过7070元,又有多少比例的职员每周的加班津元,又有多少比例的职员每周的加班津 贴在贴在4040元到元到6060元之间呢?元之间呢? 解:解:设设 =5=50 0, =10=10,X XN N(50,10(50,10 2 2 ) ) 统计学 STATISTICS 110 数据正态性的评估方法 推断统计中用样本信息对总体进行推断,多 数情况下都是以总体近似服从正态分布这一假定 为前提。 检验数据是否服从正态分布的描述性方法主 要有: 画出数据的直方图或茎叶图,对比正态分布的图形 求出样本数据的四分位差Qd和s,若数据近似服从正 态分布,则Qd/s1.3。 对数据作正态概率图。若数据近似服从正态分布,则 数据点将落在近似一条直线上。 统计学 STATISTICS 111 均匀分布 统计学 STATISTICS 112 均匀分布 (uniform distribution) 1. 若随机变量X的概率密度函数为 2. 称X在 a ,b上服从均匀分布,记为 XUa,b 2. 数学期望和方差 对于随机变量只在区间 a,b内取值,其概率分 布常用均匀分布来描述 统计学 STATIST

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号