大学数理统计----第一节-随机样本(1)

上传人:suns****4568 文档编号:93085554 上传时间:2019-07-16 格式:PPT 页数:35 大小:2.13MB
返回 下载 相关 举报
大学数理统计----第一节-随机样本(1)_第1页
第1页 / 共35页
大学数理统计----第一节-随机样本(1)_第2页
第2页 / 共35页
大学数理统计----第一节-随机样本(1)_第3页
第3页 / 共35页
大学数理统计----第一节-随机样本(1)_第4页
第4页 / 共35页
大学数理统计----第一节-随机样本(1)_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《大学数理统计----第一节-随机样本(1)》由会员分享,可在线阅读,更多相关《大学数理统计----第一节-随机样本(1)(35页珍藏版)》请在金锄头文库上搜索。

1、数理统计,数学与计算机科学系 段彦玲,2,要求和学习方法: 要求同学们按时来上课、听课,遵守课堂纪律,保持安静,不影响大家听讲; 平时成绩占总成绩的30%. 学习中遇到问题解决方法: 发邮件、课前课后答疑、网上留言(357553155).,关于课程的学习,一、主动学习,自学能力培养。 二、要边学习、边研究,以学习的态度研究,以研究的态度学习。,4,定义:数理统计学是数学的一个分支,它研究怎样用有效的方法去收集、整理、分析带随机影响的数据,并在此基础上对所讨论的问题给出统计性的估计和推断。,5,数理统计学的内容(A),概括为两大类 用有效的方法去收集数据。 抽样理论和试验设计,有效地使用数据。中

2、心内容统计推断 它包括参数估计,假设检验,回归分析,方差分析,多元统计分析等等。,6,有效性的含义,上述有效性有两个含义: 可以建立一个在数学上便于处理的模型来描述所得的数据, 数据中要包含尽可能多的与所研究的问题有关的信息。,7,关于统计推断,由于统计推断中使用的仅仅是部分数据,且带有随机性,故所得结论只能做到尽可能而非绝对的精确可靠,而结论的正确性程度显然可以用概率来度量,因此概率论是数理统计的基础。 统计方法的具体使用并不需要很高深的数学知识,但不具备较多较深的数学知识,这些方法的理论依据就说不清楚。,对一批即将出国留学的学生进行调查,确定 学业完成后愿意回国者所占的比例。对于 “完成学

3、业后,你是否会回国“这一问题, 很多人不希望透露自己的真实想法。为了得 到正确的结论,我们将问题稍加调整,将 “完成学业后,你是否会回国“定位问题a, 另设问题b:“你的年龄是奇数”。将a、b 组成一组问题,让被调查者抛硬币决定回答 问题a或b,并且在问卷上不标示被调查者回 答的是问题a还是问题b。,假定有300人接受调查,结果有130个“是”。 因为被调查者回答问题a、b的概率各50%, 所以将各有约150人回答a或b问题。又被调 查者年龄是奇数的概率各是50%,所以150 个回答b问题的人中,约有75个“是”。那么 130个“是“的答案中,约有55个“是“是问题a 的答案,于是我们就可以得

4、到完成学业后愿 意回国者的比例约55/150即11/30。,为了探讨吸烟与患慢性支气管炎是否有关联,调查了339人. 情况如下表: 问:从这批数据能否断定患慢性支气管炎与吸烟有关?,第六章 数理统计的基本概念,第一节 随机样本,将研究对象的某项数量指标值的全体称为总体,,总体中的每个元素称为个体.,例如,,考察某大学一年级新生的体重情况,,年级新生体重值的全体就构成一个总体.,其中的每一个新生的体重为一个个体.,总体中所包含的个数称为总体的容量,,则该校一,容量为有限的,称为有限总体;,容量为无限的称为无限总体.,总体与,个体的关系,,即集合论中集合与元素的关系.,它是一个随机变量(或多维随机

5、变量),记为X .,又如:研究某批国产轿车每公里的耗油量时,总体X是这批轿车每公里的耗油量,而其中每辆轿车的耗油量就是个体。,样本,为对总体分布及其特性进行统计推断,,需按一定的,规则从总体中抽取若干个体进行观察,,该抽取过程称为抽样,,个体称为样本,,样本中所含个体数目称为样本的容量,为对总体进行合理的统计推断,,所抽取的部分,我们还需要在,故,样本是一个随机变量(或向量).,独立的抽样观察,,样本,定义6.1 设总体X是具有分布函数F的随机变量,若,一旦具体取定一组样本,,便得到样本的一次具体的,观察值,称其为样本值。,简单随机样本满足下面两个条件:,1.,代表性:,与所考察的总体具有相同

6、,的分布;,是与X具有同一分布且相互独立的,随机变量,则称,为从总体X得到,容量为n的简单随机样本,简称为样本。,样本,1.,代表性:,与所考察的总体具有相同,的分布;,2.,独立性:,是相互独立的随机变量.,注:,简单随机样本是一种非常理想化的样本.,际应用中,,对有限总体,,若采用有放回抽样就能得,到简单随机样本,,但有放回抽样使用起来不方便,,故实,故实际操作中通常采用不着是无放回抽样,,当所,样本,故实际操作中通常采用不着是无放回抽样,,当所,考察的总体很大时,,可近似把无放回抽样所得到的,样本看成是一个简单随机样本.,对无限总体,,因抽取一个个体不影响它的分布,,故,采用无放回抽样即

7、可得到的一个简单随机样本.,样本分布,由样本的独立性,,并称其为样本分布.,(1),其概率分布为,则,称其为离散样本密度.,(2),其概率密度为,样本分布,(1),其概率分布为,称其为离散样本密度.,(2),其概率密度为,则样本的概率密度为,称其为连续样本密度.,统计是从手中已有的资料 样本值,去推断总体的情况 总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,统计推断问题简述,分布进行推断,,此即为统计推断问题.,样本值的关系:,总体,推断,(个体)样本,样本值,样抽,总体、样本、,在实际应用中,,总体

8、的分布一般是未知的,,或虽然,知道总体分布所属的类型,,但其中包含有未知参数.,为对总体分布进行推断,,可对总体进行抽样研究,,统计推断问题简述,在实际应用中,,总体的分布一般是未知的,,或虽然,知道总体分布所属的类型,,但其中包含有未知参数.,为对总体分布进行推断,,可对总体进行抽样研究,,对总体的每次抽样,,均得到样本的一组确定的值,样本值,,统计推断就是利用通过大量抽样得到,的样本值,,反过来对总体分布的属的类型,,分布中所含的未知参数进行推断.,或总体,频数分布表和直方图,通过观察或试验得到的样本值,,一般是杂乱无章的,,需要进行整理才能从总体上呈现其统计规律性,,数分布表或直方图是两

9、种常用的整理方法.,1.,频数分布表:,若样本值较多时,,组,,分组的组数应与样本容量相适应.,分组太少,,难以反映出分布的特征,,分组太多,,则由于样本取,值的随机性而使分布显得杂乱.,频,可将其分成若干,则,分组数据统计表和频率直方图,其步骤如下:,(1),(2),并,例1 某工厂的劳资部门为了研究该厂工人的收入情况,首先收集了工人的工资资料,右表记录了该厂30名职工未经整理的工资数值。列出频数分布表,并作出直方图。,分组数据统计表和频数直方图,2.,频数直方图:,直方图是垂直条形图,条与条之间,无间隔,用横轴上的点表示组限,纵轴上的单位数表,的高度表示。,示频数。与一个组对应的频数,用以

10、组距为底的矩形,例2 某班50名学生概率考试成绩如下: 75 65 80 81 92 63 77 79 54 98 85 72 66 84 83 60 82 78 64 90 81 78 76 86 68 76 73 71 88 87 65 57 46 89 78 66 87 79 84 78 96 88 67 38 67 75 83 82 68 85 试作出其直方图.,定义 设( )为总体X的一个样本, 为不含任何未知参数的函数,则 称 为样本( )的一个统 计量。统计量是随机变量。,例如,,未知.,为总体的一个样,令,本,,统计量,但,不是该样本的统计量,,因其含有总体分布中的未知,参数,

11、常用统计量,1.,样本均值,2.,样本方差,3.,样本标准差,4.,样本(k阶)原点矩,5.,样本(k阶)中心矩,常用统计量,5.,样本(k阶)中心矩,注:,上述五种统计量可统称为矩统计量,,简称为样,它们都是样本的显函数,,它们的观察值仍分别,称为样本均值、样本方差、样本标准差、样本(k阶),原点矩、样本(k阶)中心矩.,6.,顺序统计量,将样本中的各分量按由小到大的,次序排列成,本矩,常用统计量,6.,顺序统计量,将样本中的各分量按由小到大的,次序排列成,特别地,,并称,为样本的极差.,称,例2,设我们获得了如下三个样本:,样本,样本,样本,明显可见它们的“分,散”程度是不同的:,这一直觉可以用样本方差来表示.,这三个样本的均,值都是 5,即,而样本容量,易得,例2,设我们获得了如下三个样本:,样本,样本,样本,易得,同理易得,由此可见,这与直觉是一致的.,由于样本方差的量纲与样品的量纲不一致,故常用,样本标准差表示分散程度,易求出,例2,设我们获得了如下三个样本:,样本,样本,样本,易求出,同样有,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号