lec11 正态分布 样本分布

上传人:油条 文档编号:48833393 上传时间:2018-07-21 格式:PPTX 页数:40 大小:334.64KB
返回 下载 相关 举报
lec11 正态分布  样本分布_第1页
第1页 / 共40页
lec11 正态分布  样本分布_第2页
第2页 / 共40页
lec11 正态分布  样本分布_第3页
第3页 / 共40页
lec11 正态分布  样本分布_第4页
第4页 / 共40页
lec11 正态分布  样本分布_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《lec11 正态分布 样本分布》由会员分享,可在线阅读,更多相关《lec11 正态分布 样本分布(40页珍藏版)》请在金锄头文库上搜索。

1、正态分布 样本分布第十一讲大纲 正态分布 性质、计算与应用 样本分布 总体与样本 参数、样本统计量与估计 样本分布及其观察正态分布 统计学中最常用、最重要的分布正态分布发现的历史 对正态分布的认识始于对测量误差的研究,因 此最初被称为 “law of errors” 几个重要人物 Abraham De Moivre 1667-1754 1733年私下里出版 了一本小册子,Doctrine of Chance。他第一次提到 ,独立的离散随机变量可以近似地用一个指数函数 来描述 Marquis de Laplace 1749-1827 长期对测量误差的 性态进行研究,他证明了,几乎所有独立同分布的

2、 随机变量都会随着样本的增加迅速收敛于一个指数 分布,即正态分布 Carl Friedrich Gauss 1777-1855 正态分布也被称 为“高斯分布”。高斯在1809年第一个建立了 两参数的指数函数,来描述天文观测中的误差 分布 1924年,英国统计学家Karl Pearson 偶然发现, De Moivre在1733年就已经写出了正态分布的概 率密度的数学表达式形状特点 钟型,对称 正态分布的曲线是钟形,故有时又称为“钟形 曲线”,它反映了这样一种极普通的情况:天 下形形色色的事物中,“两头小,中间大”的 居多,如人的身高,太高太矮的都不多,而居 于中间者占多数 均值=中位数=众数

3、随机变量值域无限 正态分布与颐和园玉带桥 它们的形状极其相像05级经济学系刘振楠提供的拟合结果 蓝色的曲线为一条正态分布曲线正态分布的重要性 正态分布在数理统计学中占有极重要的地位 描述许多随机的活动和连续现象 统计推断基础 现今仍在常用的许多统计方法,就是建立在“所研 究的量具有或近似地具有正态分布”这个假定的基 础上,而经验和理论(概率论中“中心极限定理” )都表明这个假定的现实性 现实世界许多现象看来是杂乱无章的,如不同的人 有不同的身高、体重。大批生产的产品,其质量指 标各有差异。看来毫无规则,但它们在总体上服从 正态分布。这一点,显示在纷乱中有一种秩序存在正态分布概率密度函数与概率

4、密度函数 p = 3.14159; e = 2.71828 =总体的标准差 = 总体均值 x 的定义域为(, + ) 正态分布的概率: 正态分布概率密度曲线概率密度曲线的性质 图形以直线x = 为对称轴呈钟形对称曲线,并 且f (x)在x = 处达到最大值 在x = 处有拐点 当x 时,曲线以x轴为渐进线 参数 和 变化对分布图形的影响 如果 固定,改变 的值,则f (x)的图形沿着x轴平 行移动,但不改变形状 如果 固定, 大时,曲线平缓, 小时,曲线陡 峭 f (x)图形的形状完全由 决定,而位置完全由 决定正态分布的标准化 一般正态分布:XN( ,2) 记它的密度函数和分布函数为f(x)

5、和F(x) 正态分布:ZN(1 ,0) 记它的密度函数和分布函数为f(x)和F(x) 一般正态分布与标准正态分布的关系:示例证明 对于XN( , 2),有 令 ,则有 即运用Excel计算正态分布的概率 正态分布函数NORMDIST 用于计算给定均值和标准差的正态分布的累积函数 语法结构为:NORMDIST(x, mean, standard_dev, cumulative) cumulative 为 是否返回累积分布函数 标准正态分布函数 NORMSDIST 用于计算标准正态分布的累积函数,该分布的均值 为 0,标准差为 1 语法结构为:NORMSDIST(z): 。 其中:z为需要计算其分

6、布的数值。 续 正态分布函数的反函数:NORMINV 根据已知概率等参数确定正态分布随机变量 值。 其语法结构为:NORMINV(probability, mean, standard_dev) 标准正态分布函数的反函数NORMSINV 根据概率确定标准正态分布随机变量的取值。 其语法结构为:NORMSINV(probability)练习 设ZN(1 ,0) ,求 Pr(Z -0.09) Pr(|Z|1.96) Pr(2.15 Z 6.7) 设XN(1, 4),求 P (0 X 1.6) 已知XN(2 , 2),且 P( 2 X 4 ) = 0.3, 求 P ( X 0 ) 自学查正态分布表例

7、:已知分布求概率 一种自动包装机向袋中装糖果,标准是每 袋64g。但因随机误差,每袋的具体重量有 波动,根据以往的资料显示,一袋糖果的 重量服从均值为64g,标准差为1.5g的正态 分布。问随机抽出一袋糖果,其重量超过 65g的概率为多少? 重量不足62g的概率为多 少?例:已知概率求x值 某企业对生产中某关键工序调查后发现, 工人们完成该工序的时间(以分钟计)近 似服从正态分布N(20, 32)。问: 从该工序生产工人中任选一人,其完成该工序 时间少于17分钟的概率是多少? 要求以95%的概率保证该工序生产时间不多于 25分钟,这一要求能否满足? 为鼓励先进,拟奖励该工序生产时间用得最少 的

8、10%的工人,奖励标准应定在什么时间范围 内?例 假设某种汽车电池的寿命服从正态分布, 平均数为800天,标准差为100天。现随机 抽取一个汽车电池,其寿命小于500天的概 率有多大?大于1000天的概率有多大?介 于700天至900天的概率有多大?如果该公 司想制定一个保质期,在保质期内可以免 费更换电池,公司最多可以承担1%的免费 更换,保质期应该定在多长?样本分布 总体与样本 参数、样本统计量与估计 样本分布及其观察什么是总体 描述统计中的总体定义 被观察对象的全体,我们所感兴趣的全体 总体分布 表征总体的分组变量的次数分布,与总体均 值、方差联系在一起 例:某班学生按性别分组按性别分组

9、人数(频数 )人数比重(频率)%男生3060 女生2040 合计50100用随机变量表示总体 现在我们从班上任意抽取一名学生,令随机变 量X 表示该名学生的性别,有 随机变量X 的概率分布于是为: 发现:随机变量X 的概率分布与它所对应的总 体的次数分布完全一致X12 pi0.60.4概率分布与总体分布 我们可以用一个随机变量来表示一个总体 ,这个随机变量的概率分布就是该总体分 布 总体分布表征总体的随机变量X 的概率分布 分布频率概率 均值期望 方差方差样本 从总体中按照随机原则抽出的个体组成的 小群体 设X1, X2, Xn是一组相互独立与X具有相同 分布的随机变量,称(X1, X2, X

10、n)为来自总 体X的简单随机样本,简称样本,n为样本 容量 X1, X2, Xn为样本单位或样本点 样本观察值或观察结果(x1, x2, xn)称为样本值总体与样本 我们可以用一个随机变量X来描述一个总体 因为它们具有相同的概率分布 以及相同的数字特征,如期望和方差 我们可以用一组相互独立与总体X具有相同 分布的随机变量(X1, X2, Xn)来描述一个样 本 按照随机原则从总体X中抽取的每一个样本点 一定与总体X具有相同分布参数、样本统计量与估计 参数:与总体有关的数字特征 总体的均值 与方差 总体原点距、中心距等 样本统计量:根据样本值构造出的一些特 定的量,是样本的函数,用它对总体参数

11、进行估计时,又称作估计量 样本均值 = ,用来估计; 样本方差 = ,用来估计2 样本矩用于估计总体矩样本分布 样本分布 样本统计量的概率分布 样本统计量是随样本不同而变化的量,是随机 变量,有一定的概率分布。 例:已知一个盒子里放了8个球,每个球的 重量分别为1g,2g,8g。现从中简单随 机(即放回重复抽取)抽取2个球,求样本 平均重量 的概率分布。两个球的 平均重量第二个球的重量 12345678第一个球 的重 量111.522.533.544.521.522.533.544.55322.533.544.555.542.533.544.555.56533.544.555.566.563.

12、544.555.566.57744.555.566.577.584.555.566.577.58Xbar的概率分布11.522.533.544.5p1/64 2/64 3/64 4/64 5/64 6/64 7/64 8/6455.566.577.58 p7/64 6/64 5/64 4/64 3/64 2/64 1/64总体与样本均值分布图n = 2n = 3样本均值分布的性质 样本均值的期望等总体均值: 因为来自总体的简单随机样本X1, X2, , Xn相互 独立,并与总体具有相同的分布,则 所以有 样本均值的方差等于总体方差除以样本容量 含义:样本容量越大,样本均值越稳定正态总体样本均值

13、分布的性质 如果总体服从正态分布XN(, 2),则其样 本均值Xbar,服从参数为(, 2/n) 的正态分 布,即: 并有样本均值性质的Excel模拟 模拟工具:随机数发生器 从均值为3,标准差为5的正态总体中分别 抽取样本容量为4,10,40的样本,每种样 本容量的抽取各重复2000次 观察不同样本容量下的样本均值的描述统 计结果 样本均值 样本方差Xbar的描述统计结果样本容量n41040 均值2.987733 3.038573 标准误差 这里的n为2550.054672 0.035098 中值3.019952 3.075469 模式#N/A#N/A 标准偏差S2.444986 1.569

14、619 方差5.977957 2.463705 峰值0.215253 -0.08111 偏斜度0.005460.000619 区域19.95369 10.13068 最小值-6.21058 -1.94074 最大值13.74311 8.189938例 股市中随机选取16支股票。假定该日股市波动 幅度服从以均值为1.5,标准差为2的正态 分布。试问所选取的16支股票的平均价格上涨 的概率是多少? 令 为16支股票的平均波动幅度 则 =1- normdist( 0, 1.5%, 0.5%, true)= 99.87%, 所选取的16支股票的平均价格上涨的概率是99.87%Stata模拟 从l=3的

15、指数分布总体中分别抽取样本容量 为4,25,400的样本,每种样本容量的抽 取各重复20000次 prog simu rndexp 4 3 /rnd用于生成各种分布中的随机数 qui sum xe /rndexp产生的随机数记作xe end simulate simu m=r(mean), reps(20000) hist m,normal分布图l=3的均匀分布 总体n=4的样本均值分布n=25的 样本均值分布n=100的 样本均值分布作业1 5.12 5.13 设由自动线加工的某种零件的内径 X (mm) N ( ,1)。已知销售每个零件的利润T (元)与 销售零件的内径 X 有如下的关系:问平均直径 为何值时, 销售一个零件 的平均利润最大?作业2 请你运用散点图工具分别作一下均值和标准差 为 (0, 1) 以及 (-5, 42) 的正态分布的概率密度图 以及概率分

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号