01第一节数理统计的基本概念

上传人:宝路 文档编号:2491958 上传时间:2017-07-24 格式:DOC 页数:8 大小:360KB
返回 下载 相关 举报
01第一节数理统计的基本概念_第1页
第1页 / 共8页
01第一节数理统计的基本概念_第2页
第2页 / 共8页
01第一节数理统计的基本概念_第3页
第3页 / 共8页
01第一节数理统计的基本概念_第4页
第4页 / 共8页
01第一节数理统计的基本概念_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《01第一节数理统计的基本概念》由会员分享,可在线阅读,更多相关《01第一节数理统计的基本概念(8页珍藏版)》请在金锄头文库上搜索。

1、第五章 数理统计的基础知识从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于 19 世纪末 20 世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断.由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体( 或总体) 进行观察, 而只能抽取其中的部分( 或样本) 进行观察或试验以获得有限的数据.数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对

2、所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题, 本课程主要讲述统计推断的基本内容.第一节 数理统计的基本概念内容分布图示 引言 总体与总体分布 样本 例 1 样本分布 例 2 例 3 例 4 统计推断问题简述 *分组数据统计表和频率直方图 例 5 *经验分布函数 例 6 统计量 常用统计量 例 7 例 8 例 9 内容小结 课堂练习 习题 5-1 内容要点:一、总体与总体分布总体是具有一定共性的研究对象的全体, 其大小与范围随具体研究与考察的目的而确定. 例如 , 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总

3、体. 总体确定后, 我们称总体的每一个可观察值为 个体. 如前述总体 (一年级新生) 中的每一个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称为有限总体, 容量为无限的称为无限总体.数理统计中所关心的并非每个个体的所有性质, 而仅仅是它的某一项或某几项数量指标. 如前述总体(一年级新生) 中, 我们关心的是个体的体重, 进而也可考察该总体中每个个体的身高和数学高考成绩等数量指标.总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量 的值,于是, 一X个总体对应于一个随机变量 , 对总体的研究就相当于对一个随机变量 的研究, 的分X布就称为总体的分布

4、函数, 今后将不区分总体与相应的随机变量, 并引入如下定义:定义 统计学中称随机变量(或向量) 为总体, 并把随机变量(或向量)的分布称为总体分布.注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全体学生的血型, 试验的结果有 O 型、A 型、B 型、AB 型 4 种, 若分别以 1,2,3,4 依次记这 4种血型,则试验的结果就可以用数量来表示了;(ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型 (如正态分布、二项分布等), 但不知这些分布中所含的参数等( 如 等).数理统计的任务就是根据总体中部分p,2个体的数据资料对总体的未知分布进行统计

5、推断.二、样本与样本分布由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体 的一组数X值 ,其中每一 是从总体中抽取的某一个体的数量指标 的观察值.上述抽取),(21nx ix i过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一个随机变量(或向量).容量为 的样本可视为 维随机向量 ,一旦具体取定一nn),(21nX组样本,便得到样本的一次具体的观察值,),(21x称其为样本值.全体

6、样本值组成的集合称为样本空间.为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方法称为简单随机抽样, 它要求抽取的样本满足下面两个条件:1. 代表性: 与所考察的总体具有相同的分布;nX,212. 独立性: 是相互独立的随机变量 .由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的 个相互n独立的随机变量 表示. 显然, 简单随机样本是一种非常理想化的样本, 在实际n,21应用中要获得严格意义下的简单随机样本并不容易.对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总

7、体很大时, 无放回抽样与有放回抽样的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本. 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本.注: 今后假定所考虑的样本均为简单随机样本 , 简称为样本.设总体 的分布函数为 ,则简单随机样本 的联合分布函数为X)(xF),(21nXniixFx21),并称其为样本分布.特别地, 若总体 为连续型随机变量,其概率密度为 ,则样本的概率密度为)(fniixxf121),(分别称 与 为总体密度与样本密度.)(xf),21nxf若总体 为离散型随机变量,其概率分布为 , 取遍 所有可能取值, X

8、)(iiXPpxX则样本的概率分布为 ,)(,),( 12121 niin pxXxp分别称 与 为离散总体密度与离散样本密度.)(ix三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体 的一X个样本 对总体 的分布进行推断的问题为统计推断问题.nX,21总体、样本、样本值的关系:总体 推断(个体)样本 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含

9、着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断, 还需借助样本构造一些合适的统计量 , 即样本的函数, 下面将对相关统计量进行深入的讨论.四、分组数据统计表和频数直方图通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法.1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分

10、组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下:设 是样本的 个观察值.nx,21(i) 求出 中的最小者 和最大者 ; )1(x)(nx(ii) 选取常数 (略小于 )和 (略大于 ) ,并将区间 等分成 个小区间ab,bam(一般取 使 在 左右):mn10,matitti ,2,1),一般情况下,小区间不包括右端点.(iii) 求出组频数 ,组频率 ,以及inif),21(,nthii(iv) 在 上以 为高, 为宽作小矩形,其面

11、积恰为 ,所有小矩形合在一),ttii if起就构成了频率直方图五、经验分布函数样本的直方图可以形象地描述总体的概率分布的大致形态,而经验分布函数则可以用来描述总体分布函数的大致形状。定义 设总体 的一个容量为 n 的样本的样本值 可按大小次序排列成Xnx,21.)()2()1nx则不大于 的样本值的频率为 因而函数 ,)1()(kkx若 xk.,1,0)()()1()1(nkknxF若 若若与事件 在 n 次独立重复试验中的频率是相同的,我们称 为经验分布函数。xX )(xFn对于经验分布函数 , 格里汶科(Glivenko)在 1933 年证明了以下的结果: 对于任一)(x实数 x, 当

12、时 以概率 1 一致收敛于分布函数 , 即F)(.10|)(|suplimxFPnxn因此, 对于任一实数 x 当 n 充分大时 , 经验分布函数的任一个观察值 与总体分布)(xFn函数 只有微小的差别, 从而在实际中可当作 来使用. 这就是由样本推断总体其可)(x )(行性的最基本的理论依据.六、统计量为由样本推断总体,要构造一些合适的统计量, 再由这些统计量来推断未知总体. 这里, 样本的统计量即为样本的函数. 广义地讲, 统计量可以是样本的任一函数, 但由于构造统计量的目的是为推断未知总体的分布,故在构造统计量时, 就不应包含总体的未知参数, 为此引入下列定义.定义 设 为总体 的一个样

13、本, 称此样本的任一不含总体分布未知参),(21nX数的函数为该样本的统计量.七、样本的数字特征以下设 为总体 的一个样本.n,211. 样本均值 iiX12. 样本方差 niiS22)(3. 样本标准差 nii124. 样本(k 阶) 原点矩 ,1kXAniik5. 样本(k 阶) 中心矩 ,32,)(Bii注: 上述五种统计量可统称为矩统计量,简称为样本矩,它们都是样本的显示函数,它们的观察值仍分别称为样本均值、样本方差、样本标准差、样本( k 阶) 原点矩、样本(k 阶)中心矩.6. 顺序统计量 将样本中的各分量按由小到大的次序排列成 ,)()2()1( nXX则称 为样本的一组顺序统计

14、量, 称为样本的第 个顺序统计量. 特别地, )()2(1,nX i i称 与 分别为样本极小值与样本极大值, 并称 为样本的极差.)(n )1()(n例题选讲:例 1 (讲义例 1) 样本及观察值的表示方法:(1) 某食品厂用自动装罐机生产净重为 345 克的午餐肉罐头, 由于随机性, 每个罐头的净重都有差别. 现在从生产线上随机抽取 10 个罐头, 秤其净重, 得如下结果:344 336 345 342 340 338 344 343 344 343这是一个容量为 10 的样本的观察值, 它是来自该生产线罐头净重这一总体的一个样本的观察值.(2) 对 363 个零售商店调查周售额( 单位:

15、 元) 的结果如下: 1542103561 30,(0,(,(,0(商 店 数零 售 额 这是一个容量为 363 的样本的观察值, 对应的总体是所有零售店的周零售额. 不过这里没有给出每一个样品的具体的观察值, 而是给出了样本观察值所在的区间, 称为分组样本的观察值.这样一来当然会损失一些信息, 但是在样本量较大时, 这种经过整理的数据更能使人们对总体有一个大致的印象.例 2 (讲义例 2) 如果总体 为正态分布, 则称总体 为正态总体. 正态总体是统计应XX用中最常见的总体. 现设总体 服从正态分布 , 则其样本密度由下式给出:X)(2N.)(21exp121exp),( 2121 niinni i xxf 例 3 (讲义例 3) 如果总体 服从以 为参数的 分布, 则称总体 为)0(p0X总体,即0 .1,1XP不难算出其样本 的概率分布为),(21nX nnssnpiiiP)(

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号