中南大学数学院数理统计的基本概念课件

上传人:jiups****uk12 文档编号:57257850 上传时间:2018-10-20 格式:PPT 页数:33 大小:1.26MB
返回 下载 相关 举报
中南大学数学院数理统计的基本概念课件_第1页
第1页 / 共33页
中南大学数学院数理统计的基本概念课件_第2页
第2页 / 共33页
中南大学数学院数理统计的基本概念课件_第3页
第3页 / 共33页
中南大学数学院数理统计的基本概念课件_第4页
第4页 / 共33页
中南大学数学院数理统计的基本概念课件_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《中南大学数学院数理统计的基本概念课件》由会员分享,可在线阅读,更多相关《中南大学数学院数理统计的基本概念课件(33页珍藏版)》请在金锄头文库上搜索。

1、勤学好问必有所获,第五章 数理统计的概念,数理统计,数理统计,一、数理统计及其任务,数理统计是一门以概率论为基础的应用学科。 它是研究如何有效地收集、 整理、分析带有随机性的数据,以便对所考察的问题作出推断和预测,从而为决策提供依据。,数理统计的任务就是研究有效地收集数据,科学地整理与分析所获得的有限的资料,对所研究的问题, 尽可能地作出精确而可靠的结论。,数理统计研究问题的方式,不是对所研究对象的全体 ( 称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。,数理统计方法具有“部分推断整体”的特征。,二、数理统计研究问题的一般流程,我们这

2、门课所学的数理 统计实际上是统计推断 及其应用(方差分析与 回归分析)的一部分内 容。,为什么要用数理统计方法研究问题?随机现象有它的规律性,随机现象的特点注定了进行足够多次观察,其规律性才能清楚地呈现出来。但是,客观上只允许对随机现象进行有限次观察试验,只能获得局部观察资料.,总体与总体特征数,一、总体与总体标志,总体(Population),Def 在数理统计中,把研究对象的全体称为总体或母体,而把组成总体的每个单元称为总体单元。,总体中所包含的个体的个数称为总体的容量。,研究某批灯泡的质量,总体,个体,描述总体单元在某方面特性的名称称为总体指标; 每个总体单元对总体指标的响应称为指标值。

3、,在数理统计中,人们往往研究有关总体总是关注总体某一项或几项指标,为此,对这些指标进行随机的试验或观测,试验或观测结果获得这些指标的一部分或全部指标值,从而考察该数量指标的分布情况。这时,指标值的全体就象是总体。每个指标值就象是总体单元。,总体,指标值全集,指标,随机变量,总体可以用随机变量及其分布来表示,研究总体等价于研究表达总体的随机变量概率分布;在理论上可以把总体与概率分布等同起来,总体分布就是表达总体的随机变量的分布。,例如:研究某批灯泡的寿命时,关心的指标是寿命,那么,该总体就可以用随机变量X和其概率分布表示。,总体特征数,样本与统计量,一、样本,样本(Sample),Def 按一定

4、规则从总体中抽取一部分总体单元进行观测或试验,这一抽取过程称为“抽样”,所抽取的部分总体单元的整体称为总体的一个样本(子样)。 样本中所包含的总体单元称为样本单元,样本中样本单元的数目称为样本容量。,样本,样本实现,抽定,样本应满足的性质,(1) 代表性;(2) 随机性。,简单随机样本(Independence identical distribution),Def,例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中再抽第二件产品,则这样获得一个简单随机抽样。,实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样

5、。,样本分布,Def,注意:样本分布反映样本取不同实现的概率规律,其与总 体分布相联系,一般求算比较麻烦,但对于iid样本有下列 结果。,总体、样本、样本实现的关系,总体,样本实现,样本,推断,例5.1,例5.2,二、统计量,统计量(Statistic),下列那些量是统计量,它反映了总体k 阶矩的信息,几个常用的统计量,样本平均值,它反映了总体 均值的信息,样本方差,它反映了总体 方差的信息,样本标准差,样本k阶原点矩,样本k阶中心矩,统计三大分布,分布,这个分布是由Helmet于1875年提出,K.Pearson于1900年重新提出。理论推导可得概率密度函数为,(用中心极限定理证明),其概率

6、密度函数的图像如图所示,t分布(学生氏t分布),这个分布是由W.S.Gosset于1908年提出,该分布的提 出为小样本方法的建立奠定了概率基础。理论推导可 得概率密度函数为,F分布,这个分布是由R.A.Fisher于1918年提出,该分布的提出 为方差分析的建立奠定了概率基础。Snedcor于1934年 给出概率密度函数。,例5.4,抽样分布,抽样分布(Sampling Distribution ),确定抽样分布是数理统计的有一个基本问题,确定相应 统计量的分布是建立统计方法的基础。以统计量的精确 分布为基础的统计方法称为小样本方法;而以统计量的 极限分布为基础的统计方法称为大样本方法。,而

7、由性质3知 与 相互独立,例5.7,解:,为了研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。数据的简单处理是以一种直观明了方式加工数据,它包括两个方面:数据整理;计算样本特征值。,数据的整理与加工,数据整理:将数据分组 计算各组频数作频率分布表 作频率直方图,计算样本特征值:样本均值、样本方差等。,例5.8 为对某小麦杂交组合F2代的株高X进行研究,抽取 容量为100的样本,测试的原始数据记录如下(单位:厘米), 试根据以上数据,画出它的频率直方图,并以此说明随机 变量X的分布状况。,87 88 111 91

8、73 70 92 98 105 9499 91 98 110 98 97 90 83 92 8886 94 102 99 89 104 94 94 92 9687 94 92 86 102 88 75 90 90 8084 91 82 94 99 102 91 96 94 9485 88 80 83 81 69 95 80 97 9296 109 91 80 80 94 102 80 86 9190 83 84 91 87 95 76 90 91 77 103 89 88 85 95 92 104 92 95 8386 81 86 91 89 83 96 86 75 92,整理原始数据,加工为

9、分组资料,作出频率分布表,画直方图,提取样本分布特征的信息。步骤如下:,1.找数据最小值m=69,最大值M=111,极差为Mm=42; 2.数据分组,根据样本容量n的大小,决定分组数k; 3.确定组限和组中点值; 4.将数据分组,计算出各组频数,作频数、频率分布表;,5.作出频率直方图。 注意:分组的一般原则为30n40 5k640n60 6k860n100 8k10100n500 10k20本例取k=9,一般采取等距分组(也可以不等距分组),组距等于比极差除以组数略大的测量单位的整数倍。本例测量单位为1厘米,组距为,一般根据算式: 各组中点值加减1/2组距=组的上限或下限,组的上限与下限应比

10、数据多一位小数。本例取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比数据多一位小数),分组如下:,67.5,72.5) 72.5,77.5) 77.5,82.5) 82.5,87.5) 87.5,92.5) 92.5,97.5) 97.5,102.5) 102.5,107.5) 107.5,112.5) 组中值分别为:70,75,80,85,90,95,100,105,110,以样本值为横坐标,频率/组距为纵坐标;以分组区间 为底,以,为高作频率直方图,如图所示。 从频率直方图可看到: 靠近两个极端的数据出 现比较少,而中间附近 的数据比较多,即中间 大两头小的分布趋势(随 机变量分布状况的最粗 略的信息)。频率直方图 中的小矩形的面积近似 地反映了样本数据落在 某个区间内的可能性大小,故它可近似描述X的分布状况。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号