《数理统计》(浙大四版)-第6章-样本及抽样分布

上传人:平*** 文档编号:24939064 上传时间:2017-12-09 格式:PPT 页数:67 大小:2.23MB
返回 下载 相关 举报
《数理统计》(浙大四版)-第6章-样本及抽样分布_第1页
第1页 / 共67页
《数理统计》(浙大四版)-第6章-样本及抽样分布_第2页
第2页 / 共67页
《数理统计》(浙大四版)-第6章-样本及抽样分布_第3页
第3页 / 共67页
《数理统计》(浙大四版)-第6章-样本及抽样分布_第4页
第4页 / 共67页
《数理统计》(浙大四版)-第6章-样本及抽样分布_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《《数理统计》(浙大四版)-第6章-样本及抽样分布》由会员分享,可在线阅读,更多相关《《数理统计》(浙大四版)-第6章-样本及抽样分布(67页珍藏版)》请在金锄头文库上搜索。

1、高等学校数学专业课程,数理统计,数学教研室,主讲:黄新仁,课程简介,概率论的特点是什么?,假定随机变量的概率分布已知,以此来讨论其各种特性。,一、数理统计学的任务,如:概率、期望、方差、协方差、相关系数等。,实际中,如何确定随机变量的概率分布未知或数字特征?,【例】确定某灯泡厂年产灯泡的次品率。灯泡的质量通常用其寿命来衡量,若规定寿命不足3000小时为次品,那么确定该厂年产灯泡的次品率可归结为求灯泡寿命X这个随机变量的概率分布函数F(x),因为当F(x)已知时,P(x3000)=F(3000)即为所求。,F(x)如何求?,测量所有灯泡,确定次品率。,不可行!,破坏性,不经济,课程简介,F(x)

2、如何求?,抽测一部分灯泡,如何由部分来推断整体?,上一页,下一页,返回,研究怎样以有效的方式收集、整理和分析带有随机性的数据,对所考察的问题作出推断和预测,为决策和行动提供依据和建议.,课程简介,二、课程内容及学时分配,第六章:样本及抽样分布理论,第七章:参数估计,第八章:假设检验,第九章:方差分析与回归分析,(9学时),(9学时),(12学时),(12学时),三、预备知识,概率论、数学分析、线性代数,课程简介,四、数理统计发展简史,上一页,下一页,返回,英国是数理统计的发源地和研究中心,从第二次世界大战开始,美国也发展得很快,并且在生物、农业、医学、社会、经济、工业和科技等方面得到愈来愈广泛

3、的应用,如教学评价、调查统计、经济评估、销售预测、质量控制、天气预报、地震预报、疾病分析、产量估计等。,课程简介,发展历史短;,应用性很强;,涉及领域广。,(一)古典时期,(19世纪前),高斯等:误差理论,正态分布,最小二乘法,与国家实施的统治有关,,描述性统计学数理统计学的萌芽期,收集数据、简单计算、作图表等;,Status(国家),Statista(政治家),课程简介,课程简介,这一时期的主要理论与成就:,伯努利(瑞士,1654-1705),系统论证了大数定律;,贝叶斯(英国,1702-1763),提出了归纳推理理论,后被发展为一种统计推断方法;,棣莫佛(法国,1667-1754),发现了

4、正态分布的密度函数,为大样本理论奠定基础;,高斯(法国,1667-1754)、勒让德(法国,1752-1883),在误差理论中引进正态分布,并用最小二乘法进行计算;,(二)近代时期,(19世纪末至二战结束),概率论的发展,工农业生产迫切需要,促使数理统计的主要分支建立,是数理统计的形成时期.,皮尔逊(英国,1857-1936),1889年,提出了矩估计理论;,戈塞特(英国,1876-1937),1908年,发现了t分布和t检验法;,费希尔(英国,1890-1962),1912年,推广了t检验法,发展了显著性检验及方差分析;,假设检验、回归分析、方差分析等有决定其面貌的内容和理论,数理统计成为应

5、用广泛、方法独特的一门数学学科.,课程简介,(三)现代时期,(二战以后),瓦你德(美籍罗马尼亚,1902-1950),致力于用数学方法使统计学精确化、严密化.,.,计算机及其软件的应用,如EXCEL、MATLAB、SAS、SPSS推动了数理统计在理论研究和应用方面不断地向纵深发展,并产生一些新的分支和边缘性的新学科,如最优设计和非参数统计推断等。,课程简介,课程简介,五、统计学的两大学派社会统计学&数理统计学,社会统计学派始于19世纪末,首创人物是德国的克尼斯。德国统计学家恩格尔提出的“恩格尔系数” ,英国经济学家斯通等人研究的国民收入和国内生产总值的核算方法等,都是伟大的贡献,高等学校数学专

6、业课程数理统计,样本及抽样分布,第六章,数学教研室,本章目录,6.1 随机样本6.2 箱线图和直方图6.3 抽样分布,上一页,下一页,返回,6.1 随机样本6.2 箱线图和直方图6.3 抽样分布,【定义1】研究的问题所涉及的对象的全体称为总体, 总体中的每个成员称为个体.,一、总体与个体,例如:灯泡厂年产的所有灯泡是总体,每一个灯泡是个体。,【问】人们关心的是灯泡(即总体或个体)本身吗?,关心的是灯泡的某个数量指标寿命!,【定义2】研究对象的某项指标的全体称为总体,而把每个成员的指标称为个体.,上一页,下一页,返回,6.1 随机样本,1、总体与个体的概念,又如:研究2000名学生的年龄, 学生

7、年龄的全体就构成一个总体, 每个学生的年龄就是个体.,有限总体总体所包含的个体数量是有限。 无限总体总体所包含的个体数量是无限的。,对一个总体,如果我们用X 表示它的数量指标,那么对不同的个体X 取不同的值。因此,如果随机地抽取个体,则X的值也就随着抽取的个体的不同而不同.,X 的分布称为总体的分布,X 是一个随机变量,,总体的特性是由总体的分布来刻画。因此, 常把总体和总体分布视为同义语,即以后常将X 称为总体X。,有概率分布,上一页,下一页,返回,6.1 随机样本,该总体叫(0-1)分布总体,类似还有:正态(分布)总体、指数分布总体等。,2. 总体分布,【定义3】从总体中抽取的一部分样品称

8、为样本,样本中个体的个数称为样本容量,样本的观察值称为样本值。,二、样本,例如,从一批灯泡中抽取了n个灯泡,测其寿命分别记为X1,X2,Xn, 其观察值分别为x1,x2,xn,则(X1,X2,Xn)是样本,n是样本容量,(x1,x2,xn)是样本值。,上一页,下一页,返回,6.1 随机样本,【定义4】若样本X1,X2,Xn间相互独立,且与总体X具有相同的分布,则成其为简单随机样本,简称样本。,对于有限总体,采取有放回抽样。,但是使用不方便。,当个体总数比样本容量大得多时,在实际中可采用不放回抽样,对于无限总体,总是采用无放回抽样。,三、样本的分布,假设总体X具有概率密度f(x), X1,X2

9、,Xn 为来自总体X的样本,于是它们的联合概率密度为,设总体X具有分布函数F(x), 则样本联合分布函数为,上一页,下一页,返回,6.1 随机样本,本章目录,6.1 随机样本6.2 箱线图和直方图6.3 抽样分布,上一页,下一页,返回,6.1 随机样本6.2 箱线图和直方图6.3 抽样分布,6.2 直方图与箱线图,一、直方图(histogram),横坐标表示数据,纵坐标有三种表示方法:频数、频率、频率/组距。三种直方图的差别仅在于纵轴刻度的选择,直方图形状本身并无变化。,直方图又称柱状图,它是表示数据变化情况的一种主要工具。用直方图可以解析出数据的规则性,比较直观地看出数据特性的分布状态,便于

10、判断其总体质量分布情况。,【例1】,6.2 直方图与箱线图,(1)对样本分组:组数通常在520个;,(2)确定组距:组距 = (最大观测值 最小观测值)/组数;,(3)确定组限:各组区间端点为a0, a1=a0+, a2=a0+2, , ak=a0+k, 形成如下的分组区间(a0, a1 , (a1, a2, , (ak-1, ak,,对这84个数据(样本)进行整理,具体步骤如下:,其中a0 略小于最小观测值, ak 略大于最大观测值.,(4)统计样本数据落入每个区间的个数频数fi,并计算出频率fi / n.,6.2 直方图与箱线图,【解】,取区间a0,ak=124.5,159.5,组距d=(

11、159.5-124.5)/7=5,确定组限,数出落在各区间内的数据的频数,计算出相应频率,得到下表:,于是得到频率直方图如下:,6.2 直方图与箱线图,于是得到频率直方图如下:,当n 很大时,频率直方图的外轮廓曲线接近于总体X的概率密度曲线。,估计:51.2%的人最大头颅宽度落在区间134.5,144.5之间等。,6.2 直方图与箱线图,6.2 直方图与箱线图,二、箱线图(Box-plot ),箱线图也叫“盒式图”或“箱形图”,是一种用作显示一组数据分散情况资料的统计图,因其形状类似箱子而得名,它被应用于各种领域,常见于品质管理。 最适宜提供有关数据的位置和分散的参考,尤其在不同的母体数据时更

12、可表现其差异。,6.2 直方图与箱线图,1、样本分位数,【定义】,于是有,6.2 直方图与箱线图,【例2】,【解】,6.2 直方图与箱线图,2、箱线图的做法,数据集的性质:,6.2 直方图与箱线图,【例3】,【解】,6.2 直方图与箱线图,【例4】,6.2 直方图与箱线图,【解】,箱线图如下图:,本章目录,6.1 随机样本6.2 箱线图和直方图6.3 抽样分布,上一页,下一页,返回,6.1 随机样本6.2 箱线图和直方图6.3 抽样分布,6.3 抽样分布,一、基本概念,1、统计量的定义,、经验分布函数Fn(x),如:,是统计量(值),不是统计量(值),当, 2 未知时,x1, x1/,2.几个

13、常用统计量的定义,(1)样本均值,(2)样本方差,其观察值,设 X1, X2, , Xn 为取自某总体的样本,x1, x2, , xn是其观察值,其观察值,6.3 抽样分布,(3)样本标准差,(4)样本k 阶原点矩,其观察值,(5)样本k阶中心矩,一阶原点矩,二阶中心矩,其观察值,6.3 抽样分布,由以上定义得下述结论:,由第五章关于依概率收敛的序列的性质知,矩估计法的理论,6.3 抽样分布,3.经验分布函数,6.3 抽样分布,【例1】,一般地,,6.3 抽样分布,格里汶科定理,6.3 抽样分布,有很多统计推断是基于正态分布的假设的,以标准正态变量为基石而构造的三个著名统计量在实际中有广泛的应

14、用,它们被称为统计中的“三大分布” 。,统计量的分布叫做“抽样分布” 。,6.3 抽样分布,二、常见的分布,1、2 分布(卡方分布),【定义2】 设 X1, X2, Xn, 是来自总体N(0,1)的样本 ,则称统计量 2 = X12+ X22 + +Xn2 (1)服从自由度为n 的2分布,记为 2 2(n) 。,2(n) 分布的概率密度为:,6.3 抽样分布,2 分布的性质,性质3:若 ,则有,6.3 抽样分布,2 分布分位数(点),分位数 2(n) 可以从附表4 中查到。,【定义3】 对给定的正数 (01),称满足条件 的2(n) 是自由度为n卡方分布的上 分位数(点).,如:,请同学们求解

15、:,28.845,31.410,6.3 抽样分布,附表2-1,根据正态分布的对称性知,附表2-2,【例2】,6.3 抽样分布,附表2-3,附表4只详列到 n=45 为止.,附表2-4,附表2-5,【例3】,6.3 抽样分布,例如,利用上面公式,而查详表可得,费舍尔(R.A.Fisher)证明:,6.3 抽样分布,【定义4】 对给定的正数 (01),称满足条件 的1-2(n) 是自由度为卡方分布的下1- 分位数(点).,6.3 抽样分布,2、t 分布,t 分布的密度函数为:,t分布是英国统计学家戈塞特(Gosset)于1908年在一篇以“学生”(student)为笔名的论文中首先提到的,因此又称为学生分布。它在小样本实验分析中有重要应用。,6.3 抽样分布,2.当n充分大时,其图形类似于标准正态变量概率密度的图形.,6.3 抽样分布,t 分布分位数(点),【定义6】对给定的正数 (01),若满足条件 则称 为t分布的上 分位数(点).,附表2-6,附表2-7,【例3】,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号