61(总体和样本)(讲)

上传人:cl****1 文档编号:588998614 上传时间:2024-09-09 格式:PPT 页数:32 大小:213KB
返回 下载 相关 举报
61(总体和样本)(讲)_第1页
第1页 / 共32页
61(总体和样本)(讲)_第2页
第2页 / 共32页
61(总体和样本)(讲)_第3页
第3页 / 共32页
61(总体和样本)(讲)_第4页
第4页 / 共32页
61(总体和样本)(讲)_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《61(总体和样本)(讲)》由会员分享,可在线阅读,更多相关《61(总体和样本)(讲)(32页珍藏版)》请在金锄头文库上搜索。

1、第第6章章 数理统计基础数理统计基础6.1 总体和样本总体和样本6.2 统计量与抽样分布统计量与抽样分布第第6章章 数理统计基础数理统计基础 前前五五章章我我们们学学习习了了概概率率论论的的基基本本知知识识,从从本本章章开开始始将将学学习习数数理理统统计计的的基基本本知知识识、理理论论和和方方法法数数理理统统计计是是以以对对随随机机现现象象观观测测所所取取得得的的资资料料(数数据据)为为出出发发点点,以以概概率率论论为为基基础础来来研研究究随随机机现现象象的一门学科的一门学科 概概率率论论中中,往往往往是是在在已已知知随随机机变变量量分分布布的的条条件件下下,去去研研究究它它的的性性质质、特特

2、点点和和规规律律性性,比比如如求求随随机机变变量量取取某某些些特特定定值值的的概概率率、求求随随机机变变量量的的数数字字特征、研究多个随机变量之间的关系等特征、研究多个随机变量之间的关系等第第6章章 数理统计基础数理统计基础 在在数数理理统统计计中中,我我们们所所研研究究的的随随机机变变量量的的分分布布往往往往是是未未知知的的,通通过过对对随随机机变变量量进进行行多多次次独独立立重重复复的的试试验验和和观观测测,获获取取数数据据,利利用用实实际际观观测测数数据据研研究究随随机机变变量量的的分分布布,对对其其分分布布函函数数、数数字字特特征征等进行估计和推断等进行估计和推断 本本章章作作为为数数

3、理理统统计计基基础础,学学习习总总体体、样样本本、统统计计量量与与抽抽样样分分布布等等有有关关概概念念,以以及及有有关关正正态态总总体体的重要的抽样分布定理的重要的抽样分布定理第第6章章 数理统计基础数理统计基础 【数理统计简史数理统计简史】 相相对对于于其其它它许许多多数数学学分分支支而而言言,数数理理统统计计是是一一个个比比较较年年轻轻的的数数学学分分支支多多数数人人认认为为20世世纪纪40年年代代克克拉拉美美(H.Carmer)的的著著作作统统计计学学的的数数学学方方法法,使使得得1945年年以以前前25年年间间英英、美美统统计计学学家家在在统统计计学学方方面面的的工工作作与与法法、俄俄

4、数数学学家家在在概概率率论论方方面面的的工工作作结结合合起起来来,从从而而形形成成数数理理统统计计这这门门学学科科数数理理统统计计有有很很多多分分支支,但但其其基基本本内内容容为为采采集集样样本本和和统统计计推推断断两两大大部部分分发发展展到到今今天天的的现现代代数数理理统统计学,已经历了各种历史变迁计学,已经历了各种历史变迁 1. 近代统计学时期近代统计学时期 18世世纪纪末末到到19世世纪纪,是是近近代代统统计计学学时时期期这这一一时时期期的的重重大大成成就就是是大大数数定定律律和和概概率率论论被被引引入入统统计计学学之之后后最最小小二二乘乘法法、误误差差理理论论和和正正态态分分布布理理论

5、论等等相相继继成成为为统统计计学学的的重重要要内内容容这这一一时时期期有有两两大大学派:数理统计学派和社会统计学派学派:数理统计学派和社会统计学派【数理统计简史数理统计简史】【数理统计简史数理统计简史】 数数理理统统计计学学派派始始于于19世世纪纪中中叶叶,代代表表人人物物是是比比利利时时的的凯凯特特莱莱(A.Quetelet,1796-1874),著著有有概概率率论论书书简简社社会会物物理理学学等等,他他主主张张用用研研究究自自然然科科学学的的方方法法研研究究社社会会现现象象,正正式式把把概概率率论论引引入入统统计计学学,并并最最先先用用大大数数定定律律证证明明了了社社会会生生活活中中随随机

6、机现现象象的的规规律律性性,提提出出了了误误差差理理论论凯凯特特莱莱的的贡贡献献,使使统统计计学学的的发发展展进进入入个个了了一一个个新新的的阶阶段段 社社会会统统计计学学派派始始于于19世世纪纪末末,首首创创人人物物是是德德国国的的克克尼尼斯斯(K. G. A. Knies),他他认认为为统统计计学学是是一一个个社社会会科科学学,是是研研究究社社会会现现象象变变动动原原因因和和规规律律性性的的实实质质性性科科学学各各国国专专家家学学者者在在社社会会经经济济统统计计指指标标的的设设定定与与计计算算、指指数数的的编编制制、统统计计调调查查的的组组织织和和实实施施、经经济济社社会会发发展展评评价价

7、和和预预测测等等方方面面取取得得了了一一 系系 列列 的的 重重 要要 成成 果果 德德 国国 统统 计计 学学 家家 恩恩 格格 尔尔(C.L.E.Engel,1821-1896)提提出出的的“恩恩格格尔尔”系系数数,美美国国经经济济学学家家库库兹兹涅涅茨茨和和英英国国经经济济学学家家斯斯通通等等人人研研究究的的国国民民收收入入和和国国内内生生产产总总值值的的核核算算方方法等,都是伟大的贡献法等,都是伟大的贡献【数理统计简史数理统计简史】 18世世纪纪到到19世世纪纪初初期期,高高斯斯从从描描述述天天文文观观测测的的误误差差而而引引进进正正态态分分布布,并并使使用用最最小小二二乘乘法法作作为

8、为估估计计方方法法,是是近近代代数数理理统统计计学学发发展展初初期期的的重重大大事事件件,对社会发展有很大的影响对社会发展有很大的影响【数理统计简史数理统计简史】用用正正态态分分布布描描述述观观测测数数据据的的应应用用是是如如此此普普遍遍,以以至至 在在 19世世 纪纪 相相 当当 长长 的的 时时 期期 内内 , 包包 括括 高高 尔尔 顿顿(Galton)在在内内的的一一些些学学者者,认认为为这这个个分分布布可可用用于于描描述述几几乎乎是是一一切切常常见见的的数数据据直直到到现现在在,有有关关正正态态分分布布的的统统计计方方法法,仍仍占占据据着着常常用用统统计计方方法法中中很很重重要要的的

9、一一部部分分最最小小二二乘乘法法方方面面的的工工作作,在在20世世纪纪初初以以来来,经经过过一一些些学学者者的的发发展展,如如今今成成了了数数理统计学中的主要方法理统计学中的主要方法【数理统计简史数理统计简史】 2. 现代统计学时期现代统计学时期 从从19世世纪纪末末到到现现在在,是是现现代代统统计计学学时时期期这这一一时时期期的的显显著著特特点点是是数数理理统统计计学学由由于于同同自自然然科科学学、工工程程技技术术科科学学紧紧密密结结合合并并被被广广泛泛应应用用于于各各个个领领域域而而获获得得迅迅速速发发展展各各种种新新的的统统计计理理论论和和方方法法、尤尤其是推断统计理论与方法得以大量涌现

10、其是推断统计理论与方法得以大量涌现【数理统计简史数理统计简史】 例例如如英英国国统统计计学学家家卡卡尔尔.皮皮尔尔逊逊(K.Pearson,1857-1936)的的 2分分布布理理论论,统统计计学学家家戈戈赛赛特特(W.S.Gosset,1876-1937)的的小小样样本本t分分布布理理论论,统统计计学学家家费费歇歇尔尔(R.A.Fisher,1890-1962)的的F分分布布理理论论和和试试验验设设计计方方法法,波波兰兰统统计计学学家家尼尼曼曼( J.Neyman) 和和 英英 国国 统统 计计 学学 家家 皮皮 尔尔 逊逊(E.S.Pearson,1895-1980)的的置置信信区区间间理

11、理论论和和假假设设检检验验理理论论,以以及及非非参参数数统统计计法法、序序贯贯抽抽样样法法、多多元元统统计计分分析析法法、时时间间序序列列跟跟踪踪预预测测法法都都应应运运而而生,并逐步成为现代统计学的主要内容生,并逐步成为现代统计学的主要内容【数理统计简史数理统计简史】 现现代代统统计计学学时时期期是是数数理理统统计计发发展展的的辉辉煌煌时时期期,数数理理统统计计不不仅仅在在理理论论上上取取得得重重大大进进展展,其其方方法法在在生生物物、农农业业、医医学学、社社会会、经经济济、工工业业和和科科技技等等方方面面得得到到愈愈来来愈愈广广泛泛的的应应用用另另外外,计计算算机机的的应应用用对对统统计计

12、学学的的产产生生了了巨巨大大的的影影响响,需需要要大大量量计计算算的统计方法,有了计算机,这一切都不成问题的统计方法,有了计算机,这一切都不成问题【数理统计简史数理统计简史】第第6章章 数理统计基础数理统计基础 【质量控制问题质量控制问题】 某某食食盐盐厂厂用用包包装装机机包包装装的的食食盐盐,每每袋袋重重量量500g,通通常常在在包包装装机机正正常常的的情情况况下下,袋袋装装食食盐盐的的重重量量X服服从从正正态态分分布布,均均值值为为500g,标标准准差差为为25g为为进进行行生生产产质质量量控控制制,他他们们每每天天从从当当天天的的产产品品中中随随机机抽抽出出30袋袋进进行行严严格格称称重

13、重,以以检检验验包包装装机机工工作作是是否否正常某日,该厂随机抽取正常某日,该厂随机抽取30袋盐的重量分别为:袋盐的重量分别为: 从这些数据看,包装机的工作正常吗?从这些数据看,包装机的工作正常吗?475475500500485485454454504504439439492492501501463463461461464464494494512512451451434434511511513513490490521521514514449449467467499499484484508508478478479479499499529529480480 6.1 总体和样本总体和样本6.1.1

14、6.1.1 总体与个体总体与个体 总总体体或或母母体体指指我我们们研研究究对对象象的的全全体体构构成成的的集集合合,个体个体指总体中包含的指总体中包含的每个成员每个成员 例例如如,在在研研究究某某高高校校学学生生生生活活消消费费状状况况时时,该该校校全全体体学学生生就就是是一一个个总总体体,其其中中每每一一个个学学生生是是一一个个个个体体;在在人人口口普普查查中中,总总体体是是某某地地区区的的全全体体人人口,个体就是该地区的每一个人口,个体就是该地区的每一个人第第6章章 数理统计基础数理统计基础6.1.1 6.1.1 总体与个体总体与个体 我我们们研研究究总总体体时时,所所关关心心的的往往往往

15、是是总总体体某某方方面面的的特特性性,这这些些特特性性又又常常常常可可以以用用一一个个或或多多个个数数量量指标来反映指标来反映 例例如如,在在研研究究某某高高校校学学生生生生活活消消费费状状况况时时,关关心心的的可可能能是是学学生生们们每每月月的的生生活活消消费费额额,在在研研究究某某厂厂生生产产的的灯灯泡泡的的质质量量时时,关关心心的的可可能能是是这这些些灯灯泡泡的寿命和光亮度等的寿命和光亮度等 这这时时总总体体指指一一个个或或多多个个数数量量指指标标,这这些些数数量量指指标标对对我我们们来来说说是是不不了了解解或或者者说说是是未未知知的的,我我们们可可以用一个或多个随机变量来表示它们以用一

16、个或多个随机变量来表示它们 因因此此,总总体体可可以以是是一一维维随随机机变变量量,也也可可以以是是多多维随机变量维随机变量 例例如如,在在研研究究某某高高校校学学生生生生活活消消费费状状况况时时,可可以以用用X表表示示月月生生活活消消费费额额,在在研研究究某某厂厂生生产产的的灯灯泡泡的的质质量量时时,可可以以分分别别用用X,Y表表示示灯灯泡泡的的寿寿命命和和光光亮亮度度,那那么么,对对上上面面两两个个问问题题的的研研究究就就转转化化为为对对总体总体X和总体和总体(X,Y)的研究了的研究了 6.1.1 6.1.1 总体与个体总体与个体 根根据据总总体体中中包包含含个个体体的的数数量量,可可以以

17、将将总总体体分分为为有有限限总总体体和和无无限限总总体体,当当总总体体中中包包含含个个体体的的数数量量很大时,我们可以把有限总体看成是无限总体很大时,我们可以把有限总体看成是无限总体 例例如如,某某厂厂某某天天生生产产的的灯灯泡泡可可以以看看作作是是有有限限总总体体,而而该该厂厂生生产产的的全全部部灯灯泡泡就就可可以以看看作作为为无无限限总总体,因为它包含过去和将来生产的灯泡的全部体,因为它包含过去和将来生产的灯泡的全部6.1.1 6.1.1 总体与个体总体与个体6.1.2 6.1.2 样本与抽样样本与抽样 实实际际应应用用中中,为为了了研研究究总总体体的的特特性性,总总是是从从总总体体中中抽

18、抽出出部部分分个个体体进进行行观观察察和和试试验验,根根据据观观察察或或试验得到的数据推断总体的性质试验得到的数据推断总体的性质我们把从总体中抽出的部分个体称为我们把从总体中抽出的部分个体称为样本样本,把样本中包含个体的数量称为把样本中包含个体的数量称为样本容量样本容量,把对样本的观察或试验的过程称为把对样本的观察或试验的过程称为抽样抽样,把把观观察察或或试试验验得得到到的的数数据据称称为为样样本本观观测测值值(观观测测数据),简称数据),简称样本值样本值 例例如如,在在质质量量检检验验中中,随随机机抽抽出出n件件产产品品,测测得得的的数数据据x1,x2,.,xn,就就称称它它们们是是样样本本

19、观观测测值值 在在抽抽样样前前,不不知知道道样样本本观观测测值值究究竟竟取取何何值值,应应该该把把它它们们看看作作为为随随机机变变量量,记记作作X1,X2,.,Xn,称其为,称其为容量为容量为n的的样本样本. (在在不不会会混混淆淆的的情情况况下下,有有时时我我们们也也将将观观测测数数据据x1,x2,.,xn称称为为样样本本,如如“质质量量控控制制问问题题”中中的的30个个数数据据,也也可可以以说说成成是是一一个个容容量量为为30的的样样本)本)6.1.26.1.2 样本与抽样样本与抽样 在在应应用用中中,我我们们从从总总体体中中抽抽出出的的个个体体必必须须具具有有代代表表性性,样样本本中中个

20、个体体之之间间要要具具有有相相互互独独立立性性,为为保保证证这两点,一般采用简单随机抽样这两点,一般采用简单随机抽样 定定义义6.1 一一种种抽抽样样方方法法若若满满足足下下面面两两点点,称称其其为为简单随机抽样简单随机抽样: (1) 总体中每个个体被抽到的机会是均等的;总体中每个个体被抽到的机会是均等的; (2) 样本中的个体相互独立样本中的个体相互独立 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本 如如果果没没有有特特殊殊说说明明,以以后后所所说说样样本本均均指指简简单单随随机机样样本本6.1.26.1.2 样本与抽样样本与抽样 设设X1,X2,.,Xn

21、是是从从总总体体X中中抽抽出出的的简简单单随随机机样本,由定义可知,样本,由定义可知,X1,X2,.,Xn有下面两个特性:有下面两个特性: (1) 代代表表性性:X1,X2,.,Xn均均与与X同同分分布布,即即若若X F(x),则对每一个,则对每一个Xi都有都有Xi F(xi),i = 1,2,n (2) 独立性:独立性:X1,X2,.,Xn相互独立相互独立.由由这这两两个个特特性性可可知知,若若X的的分分布布函函数数为为F(x),则则X1,X2,.,Xn的联合分布函数为的联合分布函数为 F(x1,x2,xn) = F(x1)F(x2)F(xn)若若X具具有有概概率率密密度度为为f(x),则则

22、X1,X2,.,Xn的的联联合合概率密度为概率密度为 f(x1,x2,xn) = f(x1) f(x2)f(xn)6.1.26.1.2 样本与抽样样本与抽样往往是未知或不完往往是未知或不完全知道的,是需要全知道的,是需要通过样本来进行研通过样本来进行研究和推断的究和推断的【例例6.1】设设总总体体X服服从从均均值值为为1/2的的指指数数分分布布,X1,X2,X3,X4为为来来自自X的的样样本本,求求X1,X2,X3,X4的联合概率密度和联合分布函数的联合概率密度和联合分布函数 解:解:X的概率密度为的概率密度为其分布函数为其分布函数为则则X1,X2,X3,X4的联合概率密度为:的联合概率密度为

23、:6.1.26.1.2 样本与抽样样本与抽样6.1.26.1.2 样本与抽样样本与抽样由于由于X的分布函数为的分布函数为X1,X2,X3,X4的联合分布函数为的联合分布函数为 【例例6.2】已知总体已知总体X的分布为的分布为PX = i = 1/4,i = 0,1,2,3,抽抽 取取 n=36的的 简简 单单 随随 机机 样样 本本X1,X2,.,X36,求求 大于大于50.4小于小于64.8的概率的概率 解:解:总体总体X的均值和方差分别为的均值和方差分别为 6.1.26.1.2 样本与抽样样本与抽样由由于于X1,X2,.,X36均均与与总总体体X同同分分布布,且且相相互互独立,所以,独立,

24、所以,Y的均值和方差分别为的均值和方差分别为 又又因因为为n = 36较较大大,依依中中心心极极限限定定理理, 近近似似服从正态分布服从正态分布 ,所以,所以 6.1.26.1.2 样本与抽样样本与抽样 6.16.1 总体和样本总体和样本 6.1.3 6.1.3 直方图与经验分布函数直方图与经验分布函数 如如前前所所述述,数数理理统统计计所所研研究究的的实实际际问问题题(总总体体)的的分分布布一一般般来来说说是是未未知知的的,需需要要通通过过样样本本来来推推断断但但如如果果对对总总体体一一无无所所知知,那那么么,做做出出推推断断的的可可信信度度一一般般也也极极为为有有限限在在很很多多情情况况下

25、下,我我们们往往往往可可以以通通过过具具体体的的应应用用背背景景或或以以往往的的经经验验,再再通通过过观观察察样样本本观观测测值值的的分分布布情情况况,对对总总体体的的分分布布形形式式有有个个大大致致了了解解观观察察样样本本观观测测值值的的分分布布规规律律,了了解解总总体体X的的概概率率密密度度和和分分布布函函数数,常常用用直直方方图图和和经验分布函数经验分布函数.1. 直方图直方图 直直方方图图是是对对一一组组数数据据x1,x2,.,xn的的分分布布情情况的图形描述况的图形描述 将将数数据据的的取取值值范范围围分分成成若若干干区区间间(一一般般是是等等间间隔隔的的),在在等等间间隔隔的的情情

26、况况,每每个个区区间间的的长长度度称称为为组组距距考考察察这这些些数数据据落落入入每每一一个个小小区区间间的的频频数数和和频频率率,在在每每一一个个区区间间上上画画一一个个矩矩形形,它它的的宽宽度度是是组距,高度可以是频数、频率组距,高度可以是频数、频率或频率或频率/组距,所得直方图分组距,所得直方图分别称为别称为频数直方图频数直方图、频率直频率直方图方图和和密度直方图密度直方图6.1.3 6.1.3 直方图与经验分布函数直方图与经验分布函数图图6-1 密度直方图密度直方图如如果果数数据据x1,x2,.,xn是是来来自自连连续续总总体体X的的样样本本观观测测值值,其其密密度度直直方方图图中中,

27、每每一一个个矩矩形形的的面面积积恰恰好好是是观观测测数数据据落落入入对对应应区区间间的的频频率率,这这种种密密度度直直方方图图可可以以用用来来估估计计总总体体的的概概率率密密度度(用用密密度度直直方方图图的的顶顶部部折折线线估估计计X的的概概率率密密度度曲曲线线)组组距距对对直直方方图图的的形形态态有有很很大大的的影影响响,组组距距太太小小或或太太大大,直直方图反映概率密度的形态就不够准确方图反映概率密度的形态就不够准确6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数 一一个个合合适适的的分分组组是是希希望望密密度度直

28、直方方图图的的形形态态接接近近总总体体的的概概率率密密度度函函数数的的形形态态手手工工计计算算常常取取组组数数等等于于 左左右右,一一些些统统计计软软件件会会根根据据样样本本容容量量和和样样本本的的取取值值范范围围自自动动确确定定一一个个合合适适的的分分组组方式,画出各种漂亮的直方图方式,画出各种漂亮的直方图 2. 经验分布函数经验分布函数 为为了了解解总总体体X的的分分布布形形式式,根根据据样样本本观观测测值值x1,x2,.,xn构构造造一一个个函函数数Fn(x)来来近近似似总总体体X的的分分布布函函数数,函函数数Fn(x)称称为为经经验验分分布布函函数数它它的的构构造造方方法法是是这这样样

29、的的,将将样样本本观观测测值值x1,x2,.,xn按按从小到大可排成从小到大可排成 ,定义,定义 6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数Fn(x)只只在在x = x(k),(k = 1,2,n)处处有有跃跃度度为为1/n的的间间断断点点,若若有有l个个观观测测值值相相同同,则则Fn(x)在在此此观观测测值值处处的的跃跃度度为为l/n对对于于固固定定的的x,Fn(x)即即表表示示事事件件X x在在n次次试试验验中中出出现现的的频频率率,即即 ,其中其中k为落在为落在(- ,x)中中xi的个数的个数 6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数 由由伯伯努努利利大大数数定定理理知知Fn(x)依依概概率率收收敛敛于于F(x)实实际际上上,Fn(x)还还一一致致地地收收敛敛于于F(x),所所谓谓的的格格里里文科定理指出了这一更深刻的结论,即文科定理指出了这一更深刻的结论,即 所所以以,当当n充充分分大大时时经经验验分分布布函函数数Fn(x)是是总总体体分分布函数布函数F(x)的一个良好的近似的一个良好的近似 6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 劳务/用工合同

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号