第3讲_统计量及其性质

上传人:小** 文档编号:47494125 上传时间:2018-07-02 格式:PDF 页数:90 大小:661.52KB
返回 下载 相关 举报
第3讲_统计量及其性质_第1页
第1页 / 共90页
第3讲_统计量及其性质_第2页
第2页 / 共90页
第3讲_统计量及其性质_第3页
第3页 / 共90页
第3讲_统计量及其性质_第4页
第4页 / 共90页
第3讲_统计量及其性质_第5页
第5页 / 共90页
点击查看更多>>
资源描述

《第3讲_统计量及其性质》由会员分享,可在线阅读,更多相关《第3讲_统计量及其性质(90页珍藏版)》请在金锄头文库上搜索。

1、第第3 3 讲 统计量及其性质讲 统计量及其性质3.1 统计量及其分布统计量及其分布3.2 概率分布的数字特征概率分布的数字特征3.3 统计量的大样本性质统计量的大样本性质3.1 3.1 统计量及其分布统计量及其分布数理统计的任务是根据样本的离散数理统计的任务是根据样本的离散取值情况推断总体的情况,因此有取值情况推断总体的情况,因此有必要由这些样本观察值给出总体的必要由这些样本观察值给出总体的某种统计指标,以此判断总体的性某种统计指标,以此判断总体的性质,这个过程就是信息加工过程。质,这个过程就是信息加工过程。数据数据研究对象总体研究对象总体指标指标变换变换运算运算单分子酶反应两种可能机制单分

2、子酶反应两种可能机制所有的实验性质都包含在观测到的所有的实验性质都包含在观测到的荧光物质的时间轨道上。但从图中荧光物质的时间轨道上。但从图中可看出,荧光的变化是可看出,荧光的变化是极极其其不规则不规则的,的,不不可可能直接能直接分分析析其取值其取值规律规律。因此,因此,只能只能对数据对数据进行相应进行相应的统计的统计分分析析,从中,从中提提取取稳定稳定的统计信息。的统计信息。 化学反应on-time(亮)状态的直方图。 两个指数分布的卷积。拟合的很好,说明中间产物存在。微管上的蛋白运动微管上的蛋白运动统计量统计量 统计量是任统计量是任意意的样本的样本函函数,数,而而只只有有当当统计量统计量自身

3、带自身带有总体的有总体的信息时信息时才才是是真正真正有有意义意义的。的。 统计量必统计量必须须给出某种信息,但给出某种信息,但表达式却不能表达式却不能出出现未知参现未知参数。数。例: 设例: 设为来自为来自总体总体的样本。其中,的样本。其中, 已知已知,未知未知,则哪则哪些些为为统计量统计量?)x,x,(xn21L), N(22() ini1n1i2 in1ii n1Xmin4).Xn13).X2).X1).X= +几种重要的统计量几种重要的统计量样本样本均均值值 =n1iiXn1X() =n1i2 i2XX1n1S样本样本方差方差样本标样本标准差准差() =n1i2 iXX1n1S() =n

4、1ik ikXXn1M几种重要的统计量几种重要的统计量样本样本 k 阶阶中中心矩心矩样本样本 k 阶原点矩阶原点矩() =n1ik ik0Xn1A极极值统计量值统计量几种重要的统计量几种重要的统计量(1)(n)xx极差极差统计量统计量(1)(n)nxxR=几种重要的统计量几种重要的统计量假设假设为来自为来自总体总体的的一组一组样本,样本,则按照则按照样本观测值样本观测值的大的大小排序小排序可可定义顺序定义顺序统计量统计量:)x,x,(xn21LX)x,x,(xX(n)(2)(1)Lt=正确理解统计量正确理解统计量样本样本均均值是值是人们采用最多人们采用最多的的一一种种描述描述数据的数据的方法方

5、法, 它反映了一它反映了一组组数据数据整整体上的体上的一一些信息,些信息,然而然而它容易掩盖一它容易掩盖一些些极端极端的情况,所的情况,所以有时以有时候候样本样本均均值值不一定合不一定合理 。理 。思考:甲同学听说思考:甲同学听说有个有个身高身高 1.75 1.75 米米的的成年人成年人在在平平均均水深水深为为 1 1 米米的的小小河河中中淹死淹死了了,他觉得他觉得不不可可思思议议,这这件事件事情是情是否否是是一一个个玩笑玩笑?正确解释统计数据正确解释统计数据某某高高速公路速公路上的上的交通事故交通事故有有关关数据数据:速度速度 km / h数量数量小小于于 70大大于于 18070 1801

6、2323某某同学同学由此由此得得出出结论结论说:说:统计的统计的数据数据显示显示,在,在高高速公路速公路上,上,汽车汽车行行驶速度越驶速度越高高,也也就就越安全越安全。实实际际上,上,绝绝大大多多数的数的汽车汽车行行驶速度驶速度都在都在70 18070 180,因此,因此发生事故发生事故的的次次数数也也就就多多。正确解释统计数据正确解释统计数据常用统计函数常用统计函数均均值值:mean(x);标标准差:准差:std(x);中中位位数数:median(x);方差:方差:var(x)样本分样本分位位数数:pertile(x,p);样本样本极差:极差:range(x);统计量的观测值统计量的观测值抽

7、抽样样之前之前样本样本是是未知未知的的n 维随机维随机变量。变量。抽抽样样一一旦完旦完成成,就,就会会得得到样本观测值到样本观测值,此时统计量就此时统计量就会会有有确确定定的观测值。的观测值。n1X,X L) x,x,x (n21L统计量统计量相当相当于于一一个个函函数数曲线曲线,可,可定义它定义它的的各各种数种数学学运算,运算,例例如如:sin(x) = cos(x);但是,样本观测值但是,样本观测值则相当则相当于于函函数数上的某上的某一一个特个特定点定点的取值,的取值,例例如如:sin(1), cos(2), exp(1.2)评价统计量优劣的标准评价统计量优劣的标准所所选择选择的统计量的统

8、计量优劣优劣的标的标准准要看要看这个统计量是这个统计量是否否能反映能反映需需要研究要研究的的问题问题,其,其次次必必须须保证保证这个指标这个指标有有稳定稳定性,性,即即在在长期使长期使用用过程中过程中其概率分布其概率分布不能不能有有太太大的大的方差方差。例例如如,用用体体重评价肥胖重评价肥胖就就容易容易受受到到外界外界的的干扰;干扰;而用而用肥胖肥胖指数指数描描述述就就比较比较稳定稳定。换。换句话句话说说,统计,统计量的取值量的取值服服从从一一个个很好很好的的单单中中心心分布时分布时说说明该明该统计量统计量比较比较合合适适。统计量的概率分布统计量的概率分布样本的观测值是样本的观测值是确确定定的

9、,的,并无随机并无随机性,性,即即统计量统计量每次每次的观测值是的观测值是确确定定的。但是,统计量的的。但是,统计量的优劣优劣应应从从长期长期应用应用时时它它的统计性质的统计性质来来判断,这就判断,这就需需要给出统计量的概率分布。要给出统计量的概率分布。已知总体统计量的分布已知总体统计量的分布假设容假设容量量为为 n 随机随机样本样本来自正来自正态态总体总体,则:则:n1X,XL ()2, N1)(nXX 1)S(n(2).n,NXn1X (1).22n1ii 222n1ii = =练习题练习题1重复生重复生成成 100 组容组容量量为为 100 的的正正态态分布分布随机随机数,分数,分别别计

10、算计算每每组组随机随机数的数的平平均均值,值,共共得得到到100个个平平均均值。值。然然后后选择选择不同不同的的 u 进行进行线线性变换,性变换,并并绘制盒形绘制盒形图图;练习题练习题2重复生重复生成成 100 组容组容量量为为 100 的的正正态态分布分布随机随机数,分数,分别别计算计算每每组组随机随机数的数的平平均均值以及中值以及中位位数,数,共共得得到到100个个均均值值和和中中位位数,分数,分别别绘制盒形绘制盒形图图并比较并比较两两种的分布。种的分布。t t 分布分布假设假设变量变量 X 服服从从正正态态分布分布,且且样本样本方差为方差为,则则有有:()2,N2S1)t(nnSXT=若

11、若随机随机变量变量分分别别服服从从正正态态分布分布和和,分分别别为它们为它们的样本的样本方差方差,且且:21X,X ()2 11,N()2 22,N2 22 1S,S2nn1)S(n1)S(nS212 222 112 +=()()2)nt(nn1n1SYXT11 2121+=则:则:练习题练习题3重复生重复生成成 100 组容组容量量为为 100 的的正正态态分布分布随机随机数,分数,分别别计算计算100组组随机随机数的数的平平均均值以及标值以及标准差准差,分分别构造别构造 U 变换变换和和 T 变换,变换,再再绘制盒形绘制盒形图图并比较并比较两者两者的分布。的分布。2 分布分布服服从从自自由

12、由度度为为 n 的的分布。分布。2 n2 12XX+=L2(n)2假设假设是是来自来自标标准正准正态态分分布布的的容容量量为为n的样本,的样本,则则n1X,XL()0,1NF F 分布分布若若随机随机变量变量分分别别服服从从正正态态分布分布和和,分分别别为它们为它们的样本的样本方差方差,则则有有:21X,X ()2 11,N()2 22,N()1n1,nFSSF212 22 22 12 1=2 22 1S,S未知总体统计量的分布未知总体统计量的分布现假设现假设某种某种药药物物A A经经过过试试验其有验其有效效率率约约为为0.60.6,请请问问,是,是否否同意同意审批审批该该药药物上物上市市?如

13、如果果要要完完成成审批审批,申请者还申请者还需需要要怎怎样的数据样的数据支持支持?注注意意到到该该药品药品的的真真实有实有效效率率未知未知,从从而而依依据据观测样本观测样本计算计算得得到的有到的有效效率必率必然然存存在在不不确确定定性。性。为了正为了正确确的的决策决策需需要要度度量观测数据量观测数据(有有效效率率)波动波动的的范围范围,即即统计量的分布。统计量的分布。假设总体的统计量的分布假设总体的统计量的分布现假设现假设前前述述药药物物A A的有的有效效率率为为0.60.6,是是否否能能判断判断该该批药品批药品是是否否达达标标?类类似似的,的,若若某某药药物物B B有有效效率率为为0.60.

14、6,则则可可借助借助对对照照药药物物B B判断判断A A的有的有效效性。性。从从而而将将未知未知总体总体转转化化为已知为已知总体。总体。3.2 3.2 分布的数字特征分布的数字特征随机随机变量的取值变量的取值虽虽然不然不可可预预测,测,却却服服从从一定一定的分布的分布规律规律,这种,这种规律规律性性往往往往对对应应于于某种某种稳定稳定的数字特征,的数字特征,从从而能而能通通过过一定一定的统计量的统计量来来近似近似。离散型的数学期望离散型的数学期望设设离散离散型型随机随机变量变量 X 的分布的分布律为:律为:1,2,.kpxX Pkk=如如果级果级数数是是一一个有个有限限值,值,则则称称该该级级

15、数数为为 X 的数的数学学期期望望,记作记作:=1kkkpx=1kkkpxEX连续型的数学期望连续型的数学期望绝绝对对收敛收敛时,时,称称此此积积分的值分的值为为随机随机变量变量X的数的数学学期期望望,记作记作:设设连续型连续型随机随机变量变量 X 的概率的概率密密度度为为f(x),则当则当积积分分=f(x)dxxEXEX数数学学期期望望的的几何几何意义意义是是它它的的重重心心!Me数学期望的几何意义数学期望的几何意义数学期望的线性性质数学期望的线性性质(1). 假设假设 X,Y 为为两两个个随机随机变量,变量,则:则:bE(Y)kE(X)bY)E(kX+=+(2). 假设假设相相互独立互独立,则:则:n1X,X L() = n1kkn1kkXEXEq p P0 1Xpp1q0E(X)=+=二点分布二点分布二项分布的期望二项分布的期望引入引入相相互独立互独立的以的以 p 为参为参数的数的两两点点分布分布,则则服服从从参参数数为为的的二项二项分布,从分布,从而而有有:n1X,X Ln1XXX+=Lnp)E(X)E(X)XXE(XE(X)n1n21 =+=+=LLp)(n,正态分布正态分布()dtet21dxe21xxf(x)dxEX2t2)(

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 宣传企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号