lec11 正态分布 样本分布讲义教材

上传人:yulij****0329 文档编号:141404201 上传时间:2020-08-07 格式:PPTX 页数:40 大小:538.76KB
返回 下载 相关 举报
lec11 正态分布 样本分布讲义教材_第1页
第1页 / 共40页
lec11 正态分布 样本分布讲义教材_第2页
第2页 / 共40页
lec11 正态分布 样本分布讲义教材_第3页
第3页 / 共40页
lec11 正态分布 样本分布讲义教材_第4页
第4页 / 共40页
lec11 正态分布 样本分布讲义教材_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《lec11 正态分布 样本分布讲义教材》由会员分享,可在线阅读,更多相关《lec11 正态分布 样本分布讲义教材(40页珍藏版)》请在金锄头文库上搜索。

1、正态分布样本分布,第十一讲,大纲,正态分布 性质、计算与应用 样本分布 总体与样本 参数、样本统计量与估计 样本分布及其观察,正态分布,统计学中最常用、最重要的分布,Carl Friedrich Gauss 1777-1855 正态分布也被称为“高斯分布”。高斯在1809年第一个建立了两参数的指数函数,来描述天文观测中的误差分布 1924年,英国统计学家Karl Pearson 偶然发现,De Moivre在1733年就已经写出了正态分布的概率密度的数学表达式,形状特点,钟型,对称 正态分布的曲线是钟形,故有时又称为“钟形曲线”,它反映了这样一种极普通的情况:天下形形色色的事物中,“两头小,中

2、间大”的居多,如人的身高,太高太矮的都不多,而居于中间者占多数 均值=中位数=众数 随机变量值域无限,正态分布与颐和园玉带桥,它们的形状极其相像,05级经济学系刘振楠提供的拟合结果 蓝色的曲线为一条正态分布曲线,正态分布的重要性,正态分布在数理统计学中占有极重要的地位 描述许多随机的活动和连续现象 统计推断基础 现今仍在常用的许多统计方法,就是建立在“所研究的量具有或近似地具有正态分布”这个假定的基础上,而经验和理论(概率论中“中心极限定理”)都表明这个假定的现实性 现实世界许多现象看来是杂乱无章的,如不同的人有不同的身高、体重。大批生产的产品,其质量指标各有差异。看来毫无规则,但它们在总体上

3、服从正态分布。这一点,显示在纷乱中有一种秩序存在,正态分布概率密度函数与概率,密度函数 p = 3.14159; e = 2.71828 s =总体的标准差 m = 总体均值 x 的定义域为(, + ) 正态分布的概率:,正态分布概率密度曲线,概率密度曲线的性质,图形以直线x = 为对称轴呈钟形对称曲线,并且f (x)在x = 处达到最大值 在x = 处有拐点 当x 时,曲线以x轴为渐进线 参数m 和s 变化对分布图形的影响 如果 固定,改变 的值,则f (x)的图形沿着x轴平行移动,但不改变形状 如果 固定, 大时,曲线平缓, 小时,曲线陡峭 f (x)图形的形状完全由 决定,而位置完全由

4、决定,正态分布的标准化,一般正态分布:XN(m ,s2) 记它的密度函数和分布函数为f(x)和F(x) 正态分布:ZN(1 ,0) 记它的密度函数和分布函数为f(x)和F(x) 一般正态分布与标准正态分布的关系:,示例,证明,对于XN(m ,s 2),有 令 ,则有 即,运用Excel计算正态分布的概率,正态分布函数NORMDIST 用于计算给定均值和标准差的正态分布的累积函数 语法结构为:NORMDIST(x, mean, standard_dev, cumulative) cumulative 为 是否返回累积分布函数 标准正态分布函数 NORMSDIST 用于计算标准正态分布的累积函数,

5、该分布的均值为 0,标准差为 1 语法结构为:NORMSDIST(z): 。 其中:z为需要计算其分布的数值。,续,正态分布函数的反函数:NORMINV 根据已知概率等参数确定正态分布随机变量值。 其语法结构为:NORMINV(probability, mean, standard_dev) 标准正态分布函数的反函数NORMSINV 根据概率确定标准正态分布随机变量的取值。 其语法结构为:NORMSINV(probability),练习,设ZN(1 ,0) ,求 Pr(Z -0.09) Pr(|Z|1.96) Pr(2.15 Z 6.7) 设XN(1, 4),求 P (0 X 1.6) 已知X

6、N(2 ,s 2),且 P( 2 X 4 ) = 0.3,求 P ( X 0 ) 自学查正态分布表,例:已知分布求概率,一种自动包装机向袋中装糖果,标准是每袋64g。但因随机误差,每袋的具体重量有波动,根据以往的资料显示,一袋糖果的重量服从均值为64g,标准差为1.5g的正态分布。问随机抽出一袋糖果,其重量超过65g的概率为多少? 重量不足62g的概率为多少?,例:已知概率求x值,某企业对生产中某关键工序调查后发现,工人们完成该工序的时间(以分钟计)近似服从正态分布N(20, 32)。问: 从该工序生产工人中任选一人,其完成该工序时间少于17分钟的概率是多少? 要求以95%的概率保证该工序生产

7、时间不多于25分钟,这一要求能否满足? 为鼓励先进,拟奖励该工序生产时间用得最少的10%的工人,奖励标准应定在什么时间范围内?,例,假设某种汽车电池的寿命服从正态分布,平均数为800天,标准差为100天。现随机抽取一个汽车电池,其寿命小于500天的概率有多大?大于1000天的概率有多大?介于700天至900天的概率有多大?如果该公司想制定一个保质期,在保质期内可以免费更换电池,公司最多可以承担1%的免费更换,保质期应该定在多长?,样本分布,总体与样本 参数、样本统计量与估计 样本分布及其观察,什么是总体,描述统计中的总体定义 被观察对象的全体,我们所感兴趣的全体 总体分布 表征总体的分组变量的

8、次数分布,与总体均值、方差联系在一起 例:某班学生按性别分组,用随机变量表示总体,现在我们从班上任意抽取一名学生,令随机变量X 表示该名学生的性别,有 随机变量X 的概率分布于是为: 发现:随机变量X 的概率分布与它所对应的总体的次数分布完全一致,概率分布与总体分布,我们可以用一个随机变量来表示一个总体,这个随机变量的概率分布就是该总体分布,样本,从总体中按照随机原则抽出的个体组成的小群体 设X1, X2, Xn是一组相互独立与X具有相同分布的随机变量,称(X1, X2, Xn)为来自总体X的简单随机样本,简称样本,n为样本容量 X1, X2, Xn为样本单位或样本点 样本观察值或观察结果(x

9、1, x2, xn)称为样本值,总体与样本,我们可以用一个随机变量X来描述一个总体 因为它们具有相同的概率分布 以及相同的数字特征,如期望和方差 我们可以用一组相互独立与总体X具有相同分布的随机变量(X1, X2, Xn)来描述一个样本 按照随机原则从总体X中抽取的每一个样本点一定与总体X具有相同分布,参数、样本统计量与估计,参数:与总体有关的数字特征 总体的均值m 与方差s 总体原点距、中心距等 样本统计量:根据样本值构造出的一些特定的量,是样本的函数,用它对总体参数进行估计时,又称作估计量 样本均值 = ,用来估计m; 样本方差 = ,用来估计s2 样本矩用于估计总体矩,样本分布,样本分布

10、 样本统计量的概率分布 样本统计量是随样本不同而变化的量,是随机变量,有一定的概率分布。 例:已知一个盒子里放了8个球,每个球的重量分别为1g,2g,8g。现从中简单随机(即放回重复抽取)抽取2个球,求样本平均重量 的概率分布。,Xbar的概率分布,总体与样本均值分布图,n = 2,n = 3,样本均值分布的性质,样本均值的期望等总体均值: 因为来自总体的简单随机样本X1, X2, , Xn相互独立,并与总体具有相同的分布,则 所以有 样本均值的方差等于总体方差除以样本容量 含义:样本容量越大,样本均值越稳定,正态总体样本均值分布的性质,如果总体服从正态分布XN(m,s 2),则其样本均值Xb

11、ar,服从参数为(m,s 2/n) 的正态分布,即: 并有,样本均值性质的Excel模拟,模拟工具:随机数发生器 从均值为3,标准差为5的正态总体中分别抽取样本容量为4,10,40的样本,每种样本容量的抽取各重复2000次 观察不同样本容量下的样本均值的描述统计结果 样本均值 样本方差,Xbar的描述统计结果,例,股市中随机选取16支股票。假定该日股市波动幅度服从以均值为1.5,标准差为2的正态分布。试问所选取的16支股票的平均价格上涨的概率是多少? 令 为16支股票的平均波动幅度 则 =1- normdist( 0, 1.5%, 0.5%, true) = 99.87%, 所选取的16支股票

12、的平均价格上涨的概率是99.87%,Stata模拟,从l=3的指数分布总体中分别抽取样本容量为4,25,400的样本,每种样本容量的抽取各重复20000次 prog simu rndexp 4 3 /rnd用于生成各种分布中的随机数 qui sum xe /rndexp产生的随机数记作xe end simulate simu m=r(mean), reps(20000) hist m,normal,分布图,l=3的均匀分布总体,n=4的样本均值分布,n=25的 样本均值分布,n=100的 样本均值分布,作业1,5.12 5.13 设由自动线加工的某种零件的内径 X (mm) N ( ,1)。已知销售每个零件的利润T (元)与销售零件的内径 X 有如下的关系: 问平均直径 为何值时, 销售一个零件的平均利润最大?,作业2,请你运用散点图工具分别作一下均值和标准差为 (0, 1) 以及 (-5, 42) 的正态分布的概率密度图以及概率分布图,并回答以下问题: 在这两个分布中,X落在以均值为中心,一个标准差为半径的区间中的概率分别为多少?请写出你所输入的Excel函数形式。你从计算的结果中得到了什么启示? 请你在这两个分布中,分别找到一个以均值为中心的对称区间,保证X落在该区间的概率为99%。请写出你所输入的Excel函数形式。你从计算出的这两个区间中发现了什么规律?,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号