《数理统计》(浙大四版)--样本及抽样分布

上传人:宝路 文档编号:48247838 上传时间:2018-07-12 格式:PPT 页数:67 大小:2.23MB
返回 下载 相关 举报
《数理统计》(浙大四版)--样本及抽样分布_第1页
第1页 / 共67页
《数理统计》(浙大四版)--样本及抽样分布_第2页
第2页 / 共67页
《数理统计》(浙大四版)--样本及抽样分布_第3页
第3页 / 共67页
《数理统计》(浙大四版)--样本及抽样分布_第4页
第4页 / 共67页
《数理统计》(浙大四版)--样本及抽样分布_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《《数理统计》(浙大四版)--样本及抽样分布》由会员分享,可在线阅读,更多相关《《数理统计》(浙大四版)--样本及抽样分布(67页珍藏版)》请在金锄头文库上搜索。

1、主讲:黄新仁课程简介 概率论的特点是什么?概率论的特点是什么?假定随机变量的概率分布已知,以此来讨论其各种假定随机变量的概率分布已知,以此来讨论其各种特性。特性。一、数理统计学的任务一、数理统计学的任务如:概率、期望、方差、协方差、相关系数等。如:概率、期望、方差、协方差、相关系数等。 实际中,如何确定随机变量的概率分布未知或数字实际中,如何确定随机变量的概率分布未知或数字特征?特征?【例】确定某灯泡厂年产灯泡的次品率。灯泡的质量通常用其寿命来衡量,若规定寿命不足3000小时为次品,那么确定该厂年产灯泡的次品率可归结为求灯泡寿命X这个随机变量的概率分布函数F(x),因为当F(x)已知时,P(x

2、3000)=F(3000)即为所求。 F F( (x x) )如何求?如何求?测量所有灯泡,确定次品率。测量所有灯泡,确定次品率。不可行!不可行!破坏性破坏性不经济不经济课程简介 F F( (x x) )如何求?如何求?抽测一部分灯泡抽测一部分灯泡如何由部分来推断整体?如何由部分来推断整体?数理统计的主要任务:数理统计的主要任务:上一页上一页下一页下一页返回返回研究怎样以有效的方式收集、整理和分析带有随机性的数据,对所考察的问题作出推断和预测,为决策和行动提供依据和建议.课程简介二、课程内容及学时分配第六章:样本及抽样分布理论第七章:参数估计第八章:假设检验第九章:方差分析与回归分析(9学时)

3、(9学时)(12学时)(12学时)三、预备知识概率论、数学分析、线性代数课程简介四、数理统计发展简史四、数理统计发展简史上一页上一页下一页下一页返回返回英国是数理统计的发源地和研究中心,从第二次世界大战开始,美国也发展得很快,并且在生物、农业、医学、社会、经济、工业和科技等方面得到愈来愈广泛的应用,如教学评价、调查统计、经济评估、销售预测、质量控制、天气预报、地震预报、疾病分析、产量估计等。课程简介 发展历史短;发展历史短; 应用性很强;应用性很强; 涉及领域广。涉及领域广。(一)古典时期(19世纪前) 高斯等:误差理论,正态分布,最小二乘法 与国家实施的统治有关,l 描述性统计学数理统计学的

4、萌芽期 收集数据、简单计算、作图表等;Status(国家)Statista(政治家)Statistics(统计学)课程简介课程简介这一时期的主要理论与成就: 伯努利(瑞士,1654-1705)系统论证了大数定律; 贝叶斯(英国,1702-1763)提出了归纳推理理论,后被发展为一种统计推断方法; 棣莫佛(法国,1667-1754)发现了正态分布的密度函数,为大样本理论奠定基础; 高斯(法国,1667-1754)、勒让德(法国,1752-1883)在误差理论中引进正态分布,并用最小二乘法进行计算;(二)近代时期(19世纪末至二战结束)概率论的发展,工农业生产迫切需要,促使数理统计的主要分 支建立

5、,是数理统计的形成时期. 皮尔逊(英国,1857-1936)1889年,提出了矩估计理论; 戈塞特(英国,1876-1937)1908年,发现了t分布和t检验法; 费希尔(英国,1890-1962)1912年,推广了t检验法,发展了显著性检验及方差分析;假设检验、回归分析、方差分析等有决定其面貌的内容和理论, 数理统计成为应用广泛、方法独特的一门数学学科. 课程简介(三)现代时期(二战以后) 瓦你德(美籍罗马尼亚,1902-1950)致力于用数学方法使统计学精确化、严密化. 计算机及其软件的应用,如EXCEL、MATLAB、SAS、SPSS推动了数理统计在理论研究和应用方面不断地向纵深发展,并

6、 产生一些新的分支和边缘性的新学科,如最优设计和非参数统 计推断等。课程简介课程简介五、统计学的两大学派社会统计学(3)确定组限:各组区间端点为a0, a1=a0+, a2=a0+2, , ak=a0+k, 形成如下的分组区间(a0, a1 , (a1, a2, , (ak-1, ak,对这对这8484个数据个数据( (样本样本) )进行整理进行整理, ,具体步骤如下具体步骤如下: :其中a0 略小于最小观测值, ak 略大于最大观测值.(4)统计样本数据落入每个区间的个数频数fi,并计算出频率fi / n.6.2 直方图与箱线图【解】 取区间a0,ak=124.5,159.5,组距d=(15

7、9.5-124.5)/7=5,确定组限,数出落在各区间内的数据的频数,计算出相应频 率,得到下表:于是得到频率直方图如下:6.2 直方图与箱线图于是得到频率直方图如下:当n 很大时,频率直方图的外轮廓曲线接近于总体X的概率密度曲线。正态总体0.01190.04760.11910.39290.28570.1071 0.0357估计:51.2%的人最大头颅宽度落在区间134.5,144.5之间等。6.2 直方图与箱线图6.2 直方图与箱线图二、箱线图(Box-plot )箱线图也叫“盒式图”或“箱形图”,是一种用作显示一组数据分散情况资料的统计图,因其形状类似箱子而得名,它被应用于各种领域,常见于

8、品质管理。最适宜提供有关数据的位置和分散的参考,尤其在不同的母体数据时更可表现其差异。 6.2 直方图与箱线图1、样本分位数【定义】于是有6.2 直方图与箱线图【例2】【解】6.2 直方图与箱线图2、箱线图的做法数据集的性质:6.2 直方图与箱线图【例3】【解】6.2 直方图与箱线图【例4】6.2 直方图与箱线图【解】箱线图如下图:6.1 随机样本6.2 箱线图和直方图6.3 抽样分布上一页上一页下一页下一页返回返回6.1 随机样本6.2 箱线图和直方图6.3 抽样分布6.3 抽样分布一、基本概念 1、统计量的定义【定义1】 设 X1, X2, , Xn 为取自某总体的样本,若样本的函数g =

9、 g(X1, X2, , Xn)中不含有任何未知参数,则称g是一个统计量,g(x1, x2, , xn)称为统计值。 、经验分布函数F Fn n( (x x) )如:是统计量(值)不是统计量(值) 当, 2 未知时,x1, x1/2.几个常用统计量的定义(1)样本均值(2)样本方差其观察值设 X1, X2, , Xn 为取自某总体的样本,x1, x2, , xn是其观察值其观察值6.3 抽样分布(3)样本标准差(4)样本k 阶原点矩其观察值(5)样本k阶中心矩样本均值样本方差一阶原点矩二阶中心矩其观察值6.3 抽样分布由以上定义得下述结论:由第五章关于依概率收敛的序列的性质知矩估计法的理论6.

10、3 抽样分布3.经验分布函数6.3 抽样分布【例1】一般地,6.3 抽样分布格里汶科定理6.3 抽样分布有很多统计推断是基于正态分布的假设的,以标准正态变量为基石而构造的三个著名统计量在实际中有广泛的应用,它们被称为统计中的“三大分布” 。统计量的分布叫做“抽样分布” 。6.3 抽样分布二、常见的分布1、2 分布(卡方分布)【定义2】 设 X1, X2, Xn, 是来自总体N(0,1)的样本 ,则称统计量 2 2 = = X12+ X22 + +Xn2 (1)服从自由度为n 的 2 2分布,记为 2 2 2 2( (n n) ) 。指(1)中右端包含的独立变量的个数。 2 2( (n n) )

11、 分布的概率密度为:6.3 抽样分布2 分布的性质性质1:设 来自正态总体则性质2:设则有分布的可加性.性质3:若 ,则有6.3 抽样分布2 分布分位数(点)分位数 2(2(n n) ) 可以从附表4 中查到。【定义3】 对给定的正数 (01),称满足条件 的 2 2( (n n) ) 是自由度为n卡方分布的上 分位数(点).如:如:请同学们求解:请同学们求解:28.84531.4106.3 抽样分布附表2-1根据正态分布的对称性知附表2-2【例2】6.3 抽样分布附表2-3附表4只详列到 n=45 为止.附表2-4附表2-5【例3】6.3 抽样分布例如利用上面公式,而查详表可得费舍尔(R.A

12、.Fisher)证明:6.3 抽样分布【定义4】 对给定的正数 (01),称满足条件 的 1-1-2 2( (n n) ) 是自由度为卡方分布的下1- 分位数(点).思考思考?6.3 抽样分布2、t 分布 【定义5】 设随机变量X 与Y 独立,且X N(0,1), Y 2 2( (n n) ), , 则称的分布为自由度为n 的t 分布,记为t t(n) 。 t 分布的密度函数为: t分布是英国统计学家戈塞特(Gosset)于1908年在一篇以“学生”(student)为笔名的论文中首先提到的,因此又称为学生分布。它在小样本实验分析中有重要 应用。 6.3 抽样分布2.当n充分大时,其图形类 似

13、于标准正态变量概率密 度的图形.6.3 抽样分布t 分布分位数(点)【定义6】对给定的正数 (01),若满足条件 则称 为t分布的上 分位数(点).附表2-6附表2-7【例3】6.3 抽样分布请同学们求解:请同学们求解:1.7531若:若:问问?求满足求满足的的6.3 抽样分布3、F 分布【定义7】设X 2 2( (mm) ), Y 2 2( (n n), ), X1与X2独立,则称 是自由度为m与n的 F分布,记为F F(m, n) 。yf(y)on1=10,n2=25n1=10,n2=56.3 抽样分布【定义8】 对给定 (01) ,称满足条件P(F F(m,n) =) = 的F(m,n)

14、 是自由度为m 与 n 的F 分布的上 分位数。F分布分位数(点)【例4】6.3 抽样分布定理1 设 x1, x2, xn 是来自N(, 2) 的样本,则有(上讲中已证明)(利用正交变换证明,请参看其他教材)(利用正交变换证明,请参看其他教材)推论6.3 抽样分布定理2 设 x1, x2, xn 是来自N(, 2) 的样本,则有证明:由定理1及其推论知与 相互独立.从而由t分布的生成定义 知6.3 抽样分布定理3 设 x1, x2, xm 和y1, y2, yn分别来自两个相互独立的正态总体N(a1, 12) 和N(a2, 22) ,则有,则有证明:由定理1知由于两个总体相互独立,所以 独立于是故有结论成立(一般正态变量的标准化).6.3 抽样分布定理4 设 x1, x2, xm 和y1, y2, yn分别来自两个相互独立的正态总体N(a1, 2) 和N(a2, 2) ,则有,则有证明:由定理3知又由定理1知且 相互独立,于是6.3 抽样分布定理4 设 x1, x2, xm 和y1, y2, yn分别来自两个相互独立的正态总体N(a1, 2) 和N(a2, 2) ,则有,则有证明:(续)于是由t分布的生成定义 知结论成立.相互独立6.3 抽样分布定理5 设 x1, x2, xn 是来自N(1, 12) 的样本,y1, y2, yn 是来自N(2, 22) 的样本,且此两样本相

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号