概率论与数理统计实践----正态分布

上传人:ji****n 文档编号:48160726 上传时间:2018-07-11 格式:PDF 页数:7 大小:355.91KB
返回 下载 相关 举报
概率论与数理统计实践----正态分布_第1页
第1页 / 共7页
概率论与数理统计实践----正态分布_第2页
第2页 / 共7页
概率论与数理统计实践----正态分布_第3页
第3页 / 共7页
概率论与数理统计实践----正态分布_第4页
第4页 / 共7页
概率论与数理统计实践----正态分布_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《概率论与数理统计实践----正态分布》由会员分享,可在线阅读,更多相关《概率论与数理统计实践----正态分布(7页珍藏版)》请在金锄头文库上搜索。

1、正态分布的性质及实际应用举例正态分布的性质及实际应用举例 正态分布定义:正态分布定义: 定义1:设连续型随机变量的密度函数(也叫概率密度函数)为: 式中, 为正态总体的平均值; 为正态总体的标准差; x 为正态总体中随机抽样的样本值。其中 、 是常数且 0,则称随机变量 服从参数为 、 的正态分布,记作 N(,). 定义2:在(1)式中,如果 = 0,且 =1,这个分布被称为标准正态分布,这时分布简化为: (2)正态分布的分布函数 定义3:分布函数是指随机变量X 小于或等于x 的概率,用密度函数表示为: 标准正态分布的分布函数习惯上记为 ,它仅仅是指 = 0, =1时的值,表示为: 正态分布的

2、性质:正态分布的性质: 正态分布的变量的频数分布由 、 完全决定。 集中性:正态曲线的高峰位于正中央,即均数所在的位置。 对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。 均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。 正态分布有两个参数,即均数 和标准差 ,可记作 N(,):均数 决定正态曲线的中心位置;标准差 决定正态曲线的陡峭或扁平程度。 越小,曲线越陡峭; 越大,曲线越扁平。 u 变换:为了便于描述和应用,常将正态变量作数据转换。 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 X= 为对称轴,左右完全对称。正态分布的均数、中位数、众

3、数相同,均等于 。 描述正态分布资料数据分布的离散程度, 越大, 数据分布越分散, 越小, 数据分布越集中。 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高。 应用综述应用综述 : 1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。 2. 制定参考值范围 (1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。 (2)百分位数法 常用于偏态分布的指标。表 3-1 中两种方法的单双侧界值都应熟练掌握。 3. 质量控制: 为了控制实验中的测量 (或实验) 误差, 常以 作为上、

4、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。 4. 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。 许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。 频数分布频数分布 例 1.10 某地 1993 年抽样调查了 100 名 18 岁男大学生身高(cm),其均数=172.70cm, 标准差 s=4.01cm, 估计该地 18 岁男大学生身高在 168cm 以下者占该地18 岁男大学生总数的百分数;分

5、别求 X+-1s、X+-1.96s、X+-2.58s 范围内 18 岁男大学生占该地 18 岁男大学生总数的实际百分数,并与理论百分数比较。 本例,、 未知但样本含量n较大,按式(3.1)用样本均数 X 和标准差S分别代替 和 ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到 0.07,两者相交处为 0.1210=12.10%。该地 18 岁男大学生身高在 168cm 以下者,约占总数 12.10%。其它计算结果见表 3。 表 3 100 名 18 岁男大学生身高的实际分布与理论分布 分布 x+-s 身高范围(cm

6、) 实际分布人数 实际分布百分数(%) 理论分布(%) X+-1s 168.69176.71 67 67.00 68.27 X +-1.96s 164.84180.56 95 95.00 95.00 X+-2.58s 162.35183.05 99 99.00 99.00 医学参考值医学参考值 某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。 医学参考值范围亦称医学正常值范围。它是

7、指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如 80%,90%,95%和 99%,常用 95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值, 又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有: (1)正态分布法:适用于正态或近似正态分布的资料。 双侧界值:X+-u(u

8、)S 单侧上界:X+u(u)S,或单侧下界:X-u(u)S (2)对数正态分布法:适用于对数正态分布资料。 双侧界值: lg-1X(lgx)+-u(u)S(lgx); 单侧上界: lg-1X(lgx)+u(u)S(lgx),或单侧下界:lg-1X(lgx)-u(u)S(lgx)。 常用u值可根据要求由表 4 查出。 (3)百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。 双侧界值:P2.5 和P97.5;单侧上界:P95,或单侧下界:P5。 表 4 常用u值表 参考值范围(%) 单侧 双侧 80 0.842 1.282 90 1.282 1.645 95 1.645 1.9

9、60 99 2.326 2.576 统计的理论基础统计的理论基础 如 t 分布、F 分布、分布都是在正态分布的基础上推导出来的,u 检验也是以正态分布为基础的。此外,t 分布、二项分布、Poisson 分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。 概率论中最重要的分布概率论中最重要的分布 正态分布有极其广泛的实际背景, 生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想

10、气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t 分布、F 分布等。 主要内涵主要内涵 在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓住其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下: 整体论整体论 正态分布启示我们,要用整体的观点来看事物。“系统的整体

11、观念或总体观念是系统概念的精髓。” 正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变态的事物,不是真实的事物本身。 重点论重点论 正态分布曲线及面积分布图非常清晰的展示了重

12、点, 那就是基区占 68.27%, 是主体,要重点抓,此外 95%,99%则展示了正态的全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要矛盾,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,出于效率的追求, 我们更应该抓住重点。在正态分布中, 基区占了主体和重点。 如果我们结合 20/80法则,我们更可以大胆的把正区也可以看做是重点。 发展论发展论 联系和发展是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分布看做是任何一个

13、系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常态,变异是非常态。 总之,正态分布论是科学的世界观,也是科学的方法论,是我们认识

14、和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。 教育统计学教育统计学统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为: 考生成绩分布情况直方图, 基本呈正态曲线状, 属于好, 如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。 生产与科学实验中很多随机变量的概率

15、分布都可以近似地用正态分布来描述。从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇。现在许多教育专家(如上海顾泠沅 、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。 通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在

16、横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适。 正态分布的实例应用 正态分布的实例应用 正态分布在钢索误差理论中的应用(1) 索长制作误差的正态分布随机模型对于钢索的制作 误差,每个误差都是一个随机变量,而且每一个制作误差都是实际存在并且相互独立的,每 一个误差对于误差总体分布都影响大。 这些现象正好符合林德伯格提出的正态分布随机变量 的性质,所以本文采用正态分布的随机模型来描述一般误差的随机分布。首先,假设每段索 的测量值个数为n 个,根据这个测量结果建立误差的正态分布模型。 设每一段索的误差分 布值i 是一个关于索长的分段函数 根据概率统计的方法可以得出这些误差的均值为2,方差为:。这个模型是一个服从N(, 2 ) 分布的误差分布模型。根据正态分布随机数的形成方法, 可以形

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号