ch1数理统计的基本概念

上传人:n**** 文档编号:88889634 上传时间:2019-05-12 格式:PDF 页数:18 大小:369.83KB
返回 下载 相关 举报
ch1数理统计的基本概念_第1页
第1页 / 共18页
ch1数理统计的基本概念_第2页
第2页 / 共18页
ch1数理统计的基本概念_第3页
第3页 / 共18页
ch1数理统计的基本概念_第4页
第4页 / 共18页
ch1数理统计的基本概念_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《ch1数理统计的基本概念》由会员分享,可在线阅读,更多相关《ch1数理统计的基本概念(18页珍藏版)》请在金锄头文库上搜索。

1、中国地质大学北京数学教研室 1 第一章 数理统计的基本概念 统计学是一门关于数据的收集、整理、分析和推断的科学. 数理统计的方法不同于一般的资料统计,它侧重于应用随机现 象本身的规律性来考虑资料的收集、整理和分析,来找出随机变 量的分布规律或数字特征. 数理统计的研究内容分为两类: (1)采集样本:研究如何更合理更有效地获得观察资料,包括 抽样技术;试验设计 (2) 统计推断: 研究如何利用一定的资料对问题作出尽可能精确、 可靠的结论,即伴随有一定概率的推断. 统计估计(参数推断):参数估计;非参数估计 统计检验(非参数推断): 参数性假设检验; 非参数性假设检验. 统计推断是数理统计的核心内

2、容,其中非参数性推断(估计和检验) 一般是大样本的. 1基 本 概 念 一. 样本与总体 下面通过几个例子来介绍抽样分布中常用的几个基本概念. 例 1. 一个植棉专业户要了解某批棉籽的发芽率是多少? 例2. 某灯泡厂声称, 该厂生产的灯泡的平均使用寿命大于3000 小时,经销部门要考察该厂的说法是否可信? 例 3. 医学专家要考察抽烟的人患气管炎的发病率是否高于不 抽烟的人? 研究对象的某项数量指标值的全体称为总体,记为 X、Y 等. 总体的每一个值称为个体. 在例 1 中:X pB , 1 (p发芽率) , ?p 例 2.X:灯泡的平均使用寿命,则X 2 ,N , ?3000 例 3. 1

3、X :抽烟的人全体, 1 p :抽烟的人患病的概率,则 1 X 1 , 1 pB 中国地质大学北京数学教研室 2 2 X :不抽烟的人全体, 2 p :不抽烟的人患病的概率,则 2 X 2 , 1 pB 问题归纳为: ? 21 pp ( 21, ,ppp 称为概率分布的参数) 。 为了研究上面的问题,需要从总体中抽取部分个体来研究, 然 后通过这部分个体所给出的信息,对总体进行推断。 总体中的部分个体称为样本,若抽取n个个体,则称样本容量 为n。从样本中抽取样本容量相同的各个样本,有的可能较好地反 映了总体的某些特征,有的则可能较差,这涉及到有关的抽样技 术问题,在所有样本中,性能最好的是所谓

4、的简单独立随机样本. 设, 21 XX , n X是取自总体X的一个容量为n的样本,若每个 样本 i X都与总体X同分布,且相互独立,则称, 21 XX , n X是一 个简单独立随机样本。 设 X 的分布函数为 F(x) ,则样本 X1, X2, , Xn的联合分布函 数为 1212 1 ( ,)()()()( ) n nni i F x xxF xF xF xF x 联合概率密度为 12 1 (,)() n ni i f xxxf x 二统计量及抽样分布 不含任何未知参数的样本的函数称为统计量,亦为随机变量。 对于一组样本的观测值便可以得到统计量的一次观测值。 设 , 21 XX , n

5、X为一个随机样本,常用的统计量有: 样本均值: 1 1 n i i XX n 中国地质大学北京数学教研室 3 样本方差: 2 222 11 11 11 nn ii ii SXXXnX nn 2 2 0 1 1 n i i SXX n 样本 k 阶(原点)矩 1 1 ,1, 2, n k ki i AXk n 样本 k 阶中心矩 1 1 () ,2,3, n k ki i BXXk n 顺序统计量:将样本的观察值按大小排列得到的统计量 (1)(2)( )n XXX 称 ( )k X为第 k 个顺序统计量。 为偶数, 为奇数, nXX nX M nn n ),( 2 1 , ) 1 2 () 2

6、( ) 2 1 ( * 称为样本中位数 )1( * XXD n )(称为样本极差 统计量的分布称为抽样分布。 下面介绍几个重要的抽样分布 设X为一个总体随机变量,X 2 ,N,, 21 XX, n X为 取自总体X的容量为n的一个简单随机样本。 (一) 样本均值X的概率分布 命题 1. , 21 XX , n X是n个相互独立的正态随机变量,且 2 , iii XN , 则 n i i X 1 n i n i ii N 11 2 , 中国地质大学北京数学教研室 4 命题 2. 设 2 ,XN ,则bXaY 22 ,bbaN 。 特别对于简单独立随机样本有: 结论1. i X n X 1 n N

7、 2 , n X X Z n 1, 0N (标准化) (二) 样本方差 2 S 的概率分布 设, 21 XX , n X是 n 个相互独立的标准正态随机变量 令 n i in XY 1 2 , 则 n Y的密度函数为: xkn 1 22 2 1 0 2 2 00 nx n xex n x 称 n Y服从自由度为n的 2 分布,记为 n Y )( 2 n 。 密度函数xkn的曲线图如下: 性质 1. 若 1 Y)( 1 2 n , 2 Y 2 2 n且 Y1与 Y2相互独立,则 21 YY 21 2 nn 性质 2. E )( 2 n =n,D )( 2 n =2n y x 中国地质大学北京数学

8、教研室 5 结论 2. 设, 21 XX , n X是取自总体X的简单随机样本,则 2 2 2 2 1 (1) 1 n i i XXnS n 且X与 2 S相互独立。 注: 上式自由度是“ 1n ” 的原因是, 0 1 XnX XX i i , 即存在一个约束条件,从而使平方和失去了一个自由度。 (三)t分布(student 分布) 设Z 1 , 0N Ym 2 ,且Z与Y相互独立。令 / Z T Y m 则T的密度函数为: 2 1 2 1 2 2 1 m m m x m m m xt 称T服从自由度为m的t分布,记为Tmt。 密度函数xtm的曲线图如下: 0 标准正态分布 y xtm1 xt

9、m 2 标准正态分布曲线 m m xt 中国地质大学北京数学教研室 6 结论 3. 设 21, X X , n X为取自总体X的一个简单独立随机样本, 则 S Xn 1nt 结论 4. 设X 2 1, N,Y 2 2, N,X与Y独立, 21, X X , 1 n X为取自总体X的一个简单随机样本, 21,Y Y , 2 n Y为取自总 体Y的一个简单随机样本,则 2 21 21 21 nn nn YX Z 1 , 0N 2 21 21 21 S nn nn YX T 2 21 nnt 其中 2 2 2 1 21 2 21 11 2 1 nn SnSn nn S (四)F分布 设 1 Y)(

10、1 2 n , 2 Y )( 2 2 n ,且 1 Y与 2 Y相互独立,令 1 1 2 2 Y n F Y n 则F的密度函数为 xf 1 12 12 12 - 1 2 22 12 12 2 12 2 0 22 00 n nn nn nn x nnx nn n xn x 称F服从自由度为),( 21 nn的F分布,记为 12 ( ,)FF n n . 中国地质大学北京数学教研室 7 F分布的密度曲线为: 性质: 若F 21,n nF,则 F 1 12, n nF 结论 5. 设总体Y 2 11, N,Z 2 22, N ,Y与Z独立, 21,Y Y , 1 n Y为取自总体Y的一个简单随机样

11、本, 21,Z Z , 2 n Z为取 自总体Z的一个简单独立随机样本, 11 1 2 2 1111 11 () 1 nn nii ii SYYYY nn 22 2 2 2 11 22 11 () 1 nn nii ii SZZZZ nn 则 2 1 2 2 2 2 2 1 n n S S F 1, 1 21 nnF 三直方图与经验分布函数 1. 直方图 若总体分布未知,要用样本对总体分布进行非参数推断,常用 方法是直方图和经验分布函数。 设 n XXX, 21 是总体 X 的一个样本,总体具有概率密度f, 如何用样本来推断f?具体做法如下: y x 中国地质大学北京数学教研室 8 y t f

12、 j j 0 1找出 (1)( ) 11 min,max ini i ni n XXXX ,取a略 小 于, ) 1( X b略 大 于 )(n X ; 0 2将a,b分成 m 个小区间(mn), 小区间长度可以不等, 设分 点 为 01m atttb ; 0 3记 j n 落在小区间,( 1jj tt 中观察值的个数(频数),计算频 率, n n f j j 列表分别记下各小区间的频数、频率; 0 4在直角坐标系的横轴上,标出 m ttt, 10 各点, 分别以 ,( 1jj tt 为底边, 作高为 j j t f 的矩形,, 2 , 1, 1 mjttt jjj 即得直方图 例1在齿轮加工

13、中, 齿轮的径向综合误差 “ i F是个随机变量, 今对n=200件同样的齿轮进行测量,求作 “ i F的直方图。在spss中 的输出如下 齿轮数据 37.535.032.530.027.525.022.520.017.515.012.510.07.5 40 30 20 10 0 Std. Dev = 5.84 Mean = 19.4 N = 200.00 jj tt 1 0 x 中国地质大学北京数学教研室 9 2. 经验分布函数 对于总体 X 的分布函数 F (未知) , 我们可以从样本 X1, X2, , Xn 出发找到一个已知量来近似 F,这就是经验分布函数 Fn(x),方法 是:将 X1, X2, , Xn的观察值按从小到大可排成 (1)(2)( )n XXX 定义 (1) ( )(1) ( ) 0, ( ),1,2,1 1, nkk n xX k F xXxXkn n xX 如图 定理1Fn(x)F(x)(n )以概率1(几乎处处a e)成立,即 lim( )( )1 n n PF xF x 定理2Fn(x) 以概率1一致收敛于理论分布F(x),即 lim sup( )( )01 n n x PF xF x 格里汶科定理(Glivenko 1933) 0 1 x )()3()2()1 (n XXXX )(xFn 中国地质大学

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号