《社会统计学卢淑华第五章正态分布常用统计分布和极限定理》由会员分享,可在线阅读,更多相关《社会统计学卢淑华第五章正态分布常用统计分布和极限定理(35页珍藏版)》请在金锄头文库上搜索。
1、第五讲正态分布、常用统计分布和极限定理第一节 正态分布一、中心极限定理对于任何变量,不管其分布如何,如果把它们几个加在一起,当n 大于一定数之后,那么其和的分布必然接近正态分布。二、正态分布(常态分布、高斯分布)1、分布密度曲线特征:1)曲线是单峰,有一个最高点2)曲线在高峰处有一个对称轴。在轴的左右两边是对称的。(对称轴x=)3)曲线无论是向左或向右延伸,都会愈来愈接近横轴,但不会和横轴相交,以横轴为渐进线。2、正态分布的众值、中位值和均值三者是重叠的。 x 3、正态分布的概率密度22 212 x e(和为两个变量) 一定: 增大,图形右移;减小,图形左不变, 值改变: 越小,图形越尖瘦。4
2、、两个参数 不 对曲线形态的影响2移。但形状不变。2的影响增大,图形右移;减小,图形左移。但形状不变。的影响越小,图形越尖瘦E x xdx (数学期望)D 5、不的含义x 2 xdx (标准差)三、正态曲线下的面积我们把正太曲线看做是一种极限的直方图。它的组距甚小,以至中心值顶点的连线已是一条平滑的曲线。而正太曲线下的面积,实际就是由这无数个小直方形拼接而成的。每小块面积=长宽= xi xi P xi xi 面积的概率分析2 xi2 xi 因此任意两点 x1 x2 曲线下的概率,就是把从x1到x2点所有这些小块面积加起来: x2i x1当 xi 0 ,任意两点之间的概率为x2x1取值区间的概率
3、值任意两点x1x2间的概率为:x2x1正态分布的几个典型取值区间的概率值: , 之间:0.6827 2, 2 之间:0.9545 3, 3 之间:0.9973(为组距) z z x ex 第二节标准正态分布 x z一、标准分Z值:Z x 2概率密度: 122当 0 , 1 时 e22212 因此,标准正态分布可以看作一般正态分布的一个特例。当 0 , 1 时,记做 N 0,1一般正态分布记做 N , 2 ,标准分以均值基点,以标准差为度量例某地家庭平均娱乐费支出为120元,标准差为5元,如果某家庭的娱乐费支出为130元,标准分为多少?二、正态分布N , 2 和标准正态分布N 0,1面积乊间的对
4、应关系二者分布图的区别只在于对称轴不同,前者以为轴,后者以0为轴。几个典型取值区间P1 z 1 0.6827P 2 z 2 0.9546P 3 z 3 0.9973例:例1:相同而不同。学习成绩:甲位于一班,乙位于二班。一班平均成绩80分,二班平均成绩60分,甲成绩80分,乙成绩80分。相同,为10,比较二者在班上的成绩。例二: 相同而不同:如果 1 2 601 10 , 2 20 ,比较甲、乙的成绩。z t d第三节标准正态分布表的使用一、查表方法:附表4,1、3、5、7列z的不同取值,2、4、6、8列给出的是对应式的面积zet2212图示例:1、已知 服从标准正态分布 N 0,1 ,求1)
5、P 1.32)P 1.3 3)P1.3 2.32、 满足N 0,1 ,P 0.05 ,求 值。3、 满足 N 50,52 ,求 P 61 2将其称为自由度为K的X2分布,记做X2(k)第四节常用统计分布一、X2分布(卡方分布)1、设随机变量 1,2, k 相互独立,且都服从N(0,1),其平方和:x 2 12 22 k2的分布密度为:22 k 20k x k 21 e k1 k 2x当 x 0当 x 0卡方分布图分布图形:偏左侧分布,随自由度的增加,图形渐趋对称。x i 1 k量:仍然服从自由度为k的 X2 的平方分布。卡方分布性质性质1如果随机变量 1 , 2 , k 相互独立,2i 122
6、2性质2:从自由度为K1与K2的X2 分布,则其和服从自由度为K1 + K2的X2分布。如果随机变量 和 独立,并且分别服例题已知:k=10,a=0.05,求X2 0.05( 10)=?已知:k=9,a=0.025,求满足p(X2 X2 1-a )=a中的X2 1-a 1k k 12 2z k 二、t分布(学生分布)的分布密度为:称之为:自由度为k的t分布1、设随机变量 与 独立,且 服从标准正态分布, 服从自由度为K的X2的分布,则随机变 k量 t k 1 2 k 2 t z t分布图2、性质:t分布的分布曲线是关于z=0对称的,当k= 时,t分布将趋于标准正态分布(当k30时,分布曲线就差
7、不多相同了)。正态分布是其极限分布。3、查表,对不同自由度k及不同的数(0 1)给出满足等式t的t值例题已知:k=10,a=0.05,求t0.05(10)=则随机变量 F k 的分布密度为: k1 k 2 k1 k 2 k1 k 22 2 zk1z k 2 zk 2三:F分布,k1为第一自由度(分子), k2为第二自由度(分母)。1、设随机变量 与 独立,且都服从X2分布,自由度分别为k1及k2。 k12F z k12k1 122 k1 k 22 2 0当 Z 0当 z 0F k1 , k2 dxxFFp F2、F分布的性质:为非对称分布。3、查附表,对不同自由度( k1 ,k2 )及不同的数
8、(0 1),给出了满足等式F的F值另一性质已知:a=0.05,求:F0.95(10 15)1F k2 , k1 F1 k1 , k2 第五节大数定理不中心极限定理1、大数定理:研究在什么条件下,随机事件可以转化为不可能事件或必然事件,即阐明大量随机现象平均结果稳定性的一系列定理。2、中心极限定理:研究在什么条件下,随机变量之和的分布可以近似为正态分布,称中心极限定理。一、切贝谢夫丌等式:定义:如果随机变量 ,有数学期望 E 和 D 方差,则不论 的分布如何,对于任何数 ,都可以断言, 和 E 的绝对离差大于等于 的概率,不超过 D 2 ,即D 2P E D 2或 P E 1 limp p 1二
9、、贝努里大数定理1、定义:设m是n次独立观察中事件A出现的次数,而p是事件A在每次观察中出现的概率。那么,对于任何一个正数 ,有 m nn2、含义:在相同条件下进行多次观察时,随机事件的频率 m n 有接近其概率的趋势。意义:为用抽样成数来估计总体成数p奠定了理论基础。p 1有: lim n三、切贝谢夫大数定理 3、实际:意义可以用抽样的均值 做为总体均n1、定义:设随机变量 1 , 2 是相互独立服从 同 一 分 布 , 并 且 有 数 学 期 望 E i 及 方差 Di 2 ,那么对于任何一个正数 ,n n 为 1 , 2 n个随即变量的平均值2、含义:当实验次数n足够大时,n个随机变量的平均值 n 与单个随机变量的数学期望 的差可以任意的小,这个事实以接近于1的很大概率来说是正确的,即 n 趋近于数学期望 量,不管其分布如何,只要 D lim P n x 2t e d四、中心极限定理1、表述方式:设 1 , 2, k 为独立同分布的随机变2i i存在,则对x有xtn22 n 12、中心极限定理的意义1)对随机变量 的原有分布不做要求,因此,从理论上说明了正态分布的重要性2)它为样本容量的确定和大样本(n大于等于50)情况下的统计推论提供了理论依据。3)在社会调查中使用价值广。4)在抽样调查中有着重要意义。