06统计量及其抽样分布

上传人:桔**** 文档编号:569828294 上传时间:2024-07-31 格式:PPT 页数:54 大小:692.50KB
返回 下载 相关 举报
06统计量及其抽样分布_第1页
第1页 / 共54页
06统计量及其抽样分布_第2页
第2页 / 共54页
06统计量及其抽样分布_第3页
第3页 / 共54页
06统计量及其抽样分布_第4页
第4页 / 共54页
06统计量及其抽样分布_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《06统计量及其抽样分布》由会员分享,可在线阅读,更多相关《06统计量及其抽样分布(54页珍藏版)》请在金锄头文库上搜索。

1、数理统计基础从历史的典籍中,人们不难发现许从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工记载,说明人们很早就开始了统计的工作作.但是当时的统计,只是对有关事实但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的指导下,作出超越这些数据范围之外的推断的推断.到了十九世纪末二十世纪初,随到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正着近代数学和概率论的发展,才真正诞生了数理统计学这门学科诞生了数理统计学这门学科.数理统

2、计学是一门应用性很强的学数理统计学是一门应用性很强的学科科.它是研究怎样以它是研究怎样以有效的方式有效的方式收集、收集、整理和分析整理和分析带有随机性的数据带有随机性的数据,以便对,以便对所考察的问题作出推断和预测,直至为所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议采取一定的决策和行动提供依据和建议.数理统计的特点是应用面广,分支数理统计的特点是应用面广,分支较多较多.社会的发展不断向统计提出新的社会的发展不断向统计提出新的问题问题.计算机的诞生与发展,为数据处理计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与提供了强有力的技术支持,数理统计与计算机的结

3、合是必然的发展趋势计算机的结合是必然的发展趋势.数理统计不同于一般的资料统计,它数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析资料的收集、整理和分析.由于大量随机现象必然呈现出它的规由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来规律性一定能清楚地呈现出来.只允许我们对随机现象进行次数不多的观只允许我们对随机现象进行次数不多的观察试验,也就是说察试验,也就是说,我

4、们获得的只是局部我们获得的只是局部观察资料观察资料.但客观上但客观上数理统计的任务就是研究怎样有效数理统计的任务就是研究怎样有效地收集、整理、分析所获得的地收集、整理、分析所获得的有限有限的资的资料,对所研究的问题料,对所研究的问题,尽可能地作出精尽可能地作出精确而可靠的结论确而可靠的结论.由于推断是基于抽样数据,抽样数由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息据又不能包括研究对象的全部信息.因而由此获得的结论必然包含不肯定性因而由此获得的结论必然包含不肯定性.在数理统计中,不是对所研究的对在数理统计中,不是对所研究的对象全体象全体(称为称为总体总体)进行观察,而是抽取进行观

5、察,而是抽取其中的部分其中的部分(称为称为样本样本)进行观察获得数进行观察获得数据(据(抽样抽样),并通过这些数据对总体进),并通过这些数据对总体进行推断行推断.下面我们以一例进行说明:下面我们以一例进行说明:某种子公司某种子公司A,栽种了几种类别的,栽种了几种类别的鲜鲜花,收获了大量的花籽,花,收获了大量的花籽,并把并把每每25粒花粒花籽扎成一小包出售籽扎成一小包出售.一个零售商批发了一个零售商批发了若干包,并向顾客保证:在每包若干包,并向顾客保证:在每包25粒花粒花籽中至少有籽中至少有22粒将能发芽,否则的话可粒将能发芽,否则的话可免费调换另一包免费调换另一包.每包要是有每包要是有3粒不粒

6、不发芽,马上免费退换!发芽,马上免费退换!每包每包25粒粒每包每包25粒中粒中至少有至少有22粒将粒将发芽发芽所有的包都所有的包都如此吗?如此吗?这这种种类类型型的的不不肯肯定定性性,即即不不知知道道种种子子公公司司出出售售的的小小包包中中可可接接受受的的比比例例,它它是是由由于于对对总总体体的的真真实实状状态态(天天然然状状态态)无无知所引起的不肯定性知所引起的不肯定性.零售商面临如下两种类型的不肯定性:零售商面临如下两种类型的不肯定性:(1)他他对对种种子子公公司司出出售售的的小小包包中中可可接接受受(即即至至少少有有22粒粒花花籽籽将将发发芽芽)的的包包数数所所占占比比例例是是不清楚的不

7、清楚的.这是第一类不肯定性这是第一类不肯定性.(2)由于种子公司出售的花籽的货单上,这类由于种子公司出售的花籽的货单上,这类花籽共有一百万包,而零售商只购买了花籽共有一百万包,而零售商只购买了200包,包,那些包是可那些包是可接受的呢?接受的呢?这就是尽管他知道了一百这就是尽管他知道了一百万包可接受的比例万包可接受的比例,但对他所购买的但对他所购买的200包,包,其中可接受的比例仍旧没其中可接受的比例仍旧没有有“把握把握”.从中购买从中购买200包包共共100万包万包因此他又面临着另一类不肯定性;因此他又面临着另一类不肯定性;零售商购买的零售商购买的200包仍有可能包仍有可能“碰巧碰巧”是从不

8、可接受的一万包中选取的是从不可接受的一万包中选取的.那些包是可那些包是可接受的呢?接受的呢?即使即使是是0.99,即种子,即种子公司出售的一百万包中公司出售的一百万包中有有99万包是可接受的,万包是可接受的,这样他就要损失一笔资金这样他就要损失一笔资金.从中购买从中购买200包包共共100万包万包这这一一类类不不肯肯定定性性是是由由于于“随随机机性性”所所引起的引起的.在已知在已知的条件下,这种不肯定性的条件下,这种不肯定性的程度已在概率论部分作过讨论的程度已在概率论部分作过讨论.下面我们回到第一类不肯定性:下面我们回到第一类不肯定性:零零售售商商对对种种子子公公司司出出售售的的小小包包中中可

9、可接接受受(即即至至少少有有22粒粒花花籽籽将将发发芽芽)的的包包数数所所占比例占比例是多少没有把握是多少没有把握.零售商能够根据试验的方法(请公司进零售商能够根据试验的方法(请公司进行发芽试验)来改善他的处境行发芽试验)来改善他的处境.根据试验他能作出天然根据试验他能作出天然状况状况是多少的决策是多少的决策.这就是抽取部分种籽进行发芽试验,通过这这就是抽取部分种籽进行发芽试验,通过这部分中发芽数所占比例(频率部分中发芽数所占比例(频率)来对来对的真的真值进行推断值进行推断.(1)怎样设计试验,决定观察的数目;怎样设计试验,决定观察的数目;(2)怎样利用试验观察的结果作出一个怎样利用试验观察的

10、结果作出一个“好好”的推断等的推断等.这都是数理统计所要研究的问题这都是数理统计所要研究的问题.虽虽然然他他不不能能精精确确地地和和肯肯定定地地确确定定,但但可可以以期期望望获获得得一一个个(在在某某种种意意义义下下)比比较较好的推断好的推断.这就涉及到这就涉及到第一个问题是怎样进行抽样,使抽得的第一个问题是怎样进行抽样,使抽得的样本更合理样本更合理,并有更好的代表性?这是抽样并有更好的代表性?这是抽样方法和试验设计问题:最简单易行的是进行方法和试验设计问题:最简单易行的是进行随机抽样随机抽样.第二个问题是怎样从取得的样本去推断第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?

11、总体?这种推断具有多大的可靠性?这是这是统计推断统计推断问题问题.本课程着重讨论第二个问题本课程着重讨论第二个问题,即最常用统即最常用统计推断方法计推断方法.概率论是数理统计的基础,而数理统概率论是数理统计的基础,而数理统计是概率论的重要应用计是概率论的重要应用.但它们是并列的但它们是并列的两个学科,并无从属关系两个学科,并无从属关系.可见,在数理统计中必然要用到概率论可见,在数理统计中必然要用到概率论的理论和方法的理论和方法.因为随机抽样的结果带有随因为随机抽样的结果带有随机性,不能不把它当作随机现象来处理机性,不能不把它当作随机现象来处理.由此也可以说,由此也可以说,统计方法具有统计方法具

12、有“部分推断整体部分推断整体”的特征的特征.在结束本节之前,我们需要强调说明一点:在结束本节之前,我们需要强调说明一点:因为我们是从一小部分样本观察值去因为我们是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断该全体对象(总体)情况,即由部分推断全体推断全体.这里使用的推理方法是这里使用的推理方法是“归纳归纳推理推理”.这种这种归纳推理归纳推理不同于数学中的不同于数学中的“演绎推理演绎推理”,它在作出结论时,是根据所观察到的它在作出结论时,是根据所观察到的大量个别情况,大量个别情况,“归纳归纳”起来所得,而不起来所得,而不是从一些假设、命题、已知的事实等出发,是从一些假设、命题、

13、已知的事实等出发,按一定的逻辑推理去得出来的按一定的逻辑推理去得出来的.例如,在几何学中要证明例如,在几何学中要证明“等腰三角等腰三角形底角相等形底角相等”只须从只须从“等腰等腰”这个前提出这个前提出发,运用几何公理,一步一步推出这个结发,运用几何公理,一步一步推出这个结论论.而一个习惯于统计思想的人,就可能而一个习惯于统计思想的人,就可能想出这样的方法:做很多大小形状不一的想出这样的方法:做很多大小形状不一的等腰三角形,实地测量其底角,看差距如等腰三角形,实地测量其底角,看差距如何,根据所得资料看看可否作出何,根据所得资料看看可否作出“底角相底角相等等”的结论的结论.这样做就是归纳式的方法这

14、样做就是归纳式的方法.现在要问:从局部观察要对总体下结论现在要问:从局部观察要对总体下结论有没有片面性呢?结论是否可靠?有没有片面性呢?结论是否可靠?显然这里不仅依赖于进行局部观察的显然这里不仅依赖于进行局部观察的“样本样本”是否具有总体的代表性,也依赖于对是否具有总体的代表性,也依赖于对从这些样本得到数据的合理加工、分析并得从这些样本得到数据的合理加工、分析并得出论断出论断.我们对每个经过合理手续选取的一个我们对每个经过合理手续选取的一个样品也应看到它所具有的两重性:样品也应看到它所具有的两重性:一方面它具有特殊性,因为它毕竟是一方面它具有特殊性,因为它毕竟是个别观察值,不能反映总体的全面性

15、质,个别观察值,不能反映总体的全面性质,有片面性有片面性.因而统计上往往不采用由一次抽取因而统计上往往不采用由一次抽取的样品来下结论的样品来下结论.在这个基础上再加上科学的推断方法,在这个基础上再加上科学的推断方法,对总体下的结论同样也是可靠的对总体下的结论同样也是可靠的.另一方面也要看到另一方面也要看到“普遍性即存在于特普遍性即存在于特殊性之中殊性之中”,即每个样品的情况又必然反映,即每个样品的情况又必然反映总体的一些普遍性总体的一些普遍性.当样品有一定数量时总体的普遍性是可当样品有一定数量时总体的普遍性是可以得到比较真实的反映的以得到比较真实的反映的.但此时还应记住毕竟是由但此时还应记住毕

16、竟是由“局部局部”推推断断“整体整体”,因而仍可能犯错误,结论往往,因而仍可能犯错误,结论往往又是在某个又是在某个“可靠性水平可靠性水平”之下得出的之下得出的.这种矛盾的特殊性与普遍性的辩证统一这种矛盾的特殊性与普遍性的辩证统一在统计学中贯穿始终,是我们应该记住的基在统计学中贯穿始终,是我们应该记住的基本思想本思想.第二节第二节样本及抽样分布样本及抽样分布统计量与经验分布函数统计量与经验分布函数统计三大抽样分布统计三大抽样分布几个重要的抽样分布定理几个重要的抽样分布定理课堂练习课堂练习小结小结布置作业布置作业由由样样本本值值去去推推断断总总体体情情况况,需需要要对对样样本本值值进进行行“加加工

17、工”,这这就就要要构构造造一一些些样样本本的的函函数数,它它把把样本中所含的(某一方面)的信息集中起来样本中所含的(某一方面)的信息集中起来.1.统计量统计量这种这种不含任何未知参数的样本的函数称为统不含任何未知参数的样本的函数称为统计量计量.它是完全由样本决定的量它是完全由样本决定的量.一、统计量与经验分布函数一、统计量与经验分布函数定义定义请注意请注意:几个常见统计量几个常见统计量样本平均值样本平均值它反映了它反映了总体均值总体均值的信息的信息样本方差样本方差它反映了总体它反映了总体方差的信息方差的信息样本标准差样本标准差它反映了总体它反映了总体k 阶矩的信息阶矩的信息样本样本k阶原点矩阶

18、原点矩样本样本k阶中心矩阶中心矩k=1,2,它反映了总体它反映了总体k 阶阶中心矩的信息中心矩的信息统计量的观察值统计量的观察值2.经验分布函数经验分布函数 二、统计三大抽样分布二、统计三大抽样分布记为记为分布分布1、定义定义:设设相互独立相互独立,都服从正态分布都服从正态分布N(0,1),则称随机变量:则称随机变量:所服从的分布为所服从的分布为自由度为自由度为 n的的 分布分布.分布是由正态分布派生出来的一种分布分布是由正态分布派生出来的一种分布. .分布的密度函数为分布的密度函数为来定义来定义.其中伽玛函数其中伽玛函数通过积分通过积分注注1.设设相互独立相互独立,都服从正态分布都服从正态分

19、布则则这个性质叫这个性质叫分布的可加性分布的可加性.3若若近似正态分布近似正态分布N(0,1).(应用中心极限定理可得应用中心极限定理可得)2设设且且X1,X2相互独立,相互独立,E(X)=n,D(X)=2n.概率密度函数为:概率密度函数为: 定定义义:设设XN(0,1), Y,且且X与与Y相相互互独立,则称变量独立,则称变量所服从的分布为所服从的分布为自由度为自由度为n的的t 分布分布.2、t 分布分布由定义可见,由定义可见,3、F分布分布F(n2,n1)定义定义:设设U 与与V 相互相互独立,则称随机变量独立,则称随机变量服从服从自由度为自由度为n1及及n2的的F分布分布,n1称为称为第自

20、第自由度由度,n2称为称为第二自由度第二自由度,记作,记作FF(n1,n2).即它的数学期望并不依赖于第一自由度即它的数学期望并不依赖于第一自由度n1.1.F分布的数学期望为分布的数学期望为:若若n22若若FF(n1,n2),F的概率密度为的概率密度为2.F分布的分位数分布的分位数三、几个重要的抽样分布定理三、几个重要的抽样分布定理当总体为当总体为正态分布正态分布时,给出几个重要的抽样分时,给出几个重要的抽样分布定理布定理.定理定理1(样本均值的分布样本均值的分布)设设X1,X2,Xn 是来自正态总体是来自正态总体的样本,的样本,是样本均值,则有是样本均值,则有n取不同值时样本取不同值时样本均

21、值均值的分布的分布请注意请注意:定理定理2(样本方差的分布样本方差的分布)设设X1,X2,Xn是来自正态总体是来自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有n取不同值时取不同值时的分布的分布定理定理3(样本均值的分布样本均值的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有定理定理4(两总体样本均值差、样本方差比的分布两总体样本均值差、样本方差比的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是来自是来自X的样本的样本,是取自是取自Y的样本的样本,这

22、两个样本的样本方差这两个样本的样本方差,则有则有Y1,Y2,样本均值,样本均值,分别是分别是四、例题四、例题例例1解解例例2解解五、小结五、小结布置作业布置作业在这一节中我们学习了统计量的概念在这一节中我们学习了统计量的概念,几几个重要的统计量及其分布个重要的统计量及其分布,即抽样分布即抽样分布.要求大要求大家熟练地掌握它们家熟练地掌握它们.常用的统计量常用的统计量样本平均值样本平均值样本方差样本方差样本标准差样本标准差样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩抽样分布抽样分布t 分布分布F分布分布抽样分布定理抽样分布定理样本均值的分布样本均值的分布样本方差、均值的分布样本方差、均值的分布两总体样本均值差、样本方差比的分布两总体样本均值差、样本方差比的分布

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号