基本概念与抽样分布

上传人:ji****72 文档编号:50727624 上传时间:2018-08-10 格式:PPT 页数:58 大小:432KB
返回 下载 相关 举报
基本概念与抽样分布_第1页
第1页 / 共58页
基本概念与抽样分布_第2页
第2页 / 共58页
基本概念与抽样分布_第3页
第3页 / 共58页
基本概念与抽样分布_第4页
第4页 / 共58页
基本概念与抽样分布_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《基本概念与抽样分布》由会员分享,可在线阅读,更多相关《基本概念与抽样分布(58页珍藏版)》请在金锄头文库上搜索。

1、应用统计电子教案第一章 数理统计的基本概念与抽 样分布 数学学院应用数学系 王国富2007年8月数理统计的基本概念与抽样分布例:某钢筋厂每天可以生产某型号钢筋10000根 ,钢筋厂每天需要对生产过程进行控制,对产品 的质量进行检验。如果把钢筋的强度作为钢筋质 量的重有指标,于是质量管理人员需要做如下方 面的工作第一,对生产出来的钢筋的强度进行检测,获 得必要的数据。 第二,对通过抽样获取的部分数据进行整理、 分析并推断出这10000根钢筋的质量是否合乎要 求。1.2 总体、个体、样本 1.2.1 总体与个体 我们把所研究对象的全体称为总体或母体。 组成总体的每个单元称为个体 总体X可看作一个随

2、机变量 ,称X的概率分 布为总体分布,称X的数字特征为总体的数字特 征 ,对总体进行研究就是对总体的分布或对总体 的数字特征进行研究 . 1.2.2 样本从总体中抽取的一部分个体称为样本或者子 样,其中所含个体的个数称为样本容量 .样本具有二重性:随机性和确定性 定义1.1 设总体X的样本满足 独立性:每次观测结果既不影响其它结果,也不受 其它结果的影响;即相互独立; 代表性:样本中每一个个体都与总体X有相同分布 。 则称此样本为简单随机样本。进行有放回抽样就是简单随机样本 ,无放回抽样 就不是简单随机样本。但N很大,n相对较小时无放 回抽样得到的样本可以近似看作简单随机样本.称样本的分布为样

3、本分布。如果 为简单随机样本, 为总体X的分布函数,则样 本分布有比较简单的形式 它完全由总体X的分布函数确定 它完全由总体X的分布函数确定 两种形式例1.1 设有一批产品,其次品率为p,如果记“ ”表 示抽取一件产品是次品;“ ” 表示抽取一件产品 是正品;那么,产品的质量就可以用X的分布来衡量。 X服从0-1分布,参数就是次品率p。如果为简单随机样 本,求样本分布. 解:总体X的概率分布为 例1.2 设总体X服从参数为 的正态分布 ,求样本 的分布密度。解:总体X的分布密度为所以 的概率分布为 统计量 统计量的定义 定义1.2 设 为总体X的一个样本 ,为 的连续函数, 且不含有任何未知参

4、数,则称T为一个统计量 。注:1.统计量是完全由样本确定的一个量,即 样本有一个观测值时,统计量就有一个唯一确 定的值 ;2.统计量是一个随机变量,它将高维随机 变量问题转化为一维随机变量来处理 ,但不会 损失所讨论问题的信息量. 常见的统计量 1.样本均值 2.样本方差 3.k 阶原点矩 4.k 阶中心矩 5.顺序统计量6.样本极差 与中位数 例1.3 设总体X为连续型的,求最大顺序统计 量与最小顺序统计量的分布密度 .解: 最大顺序统计量 的分布函数为 最小顺序统计量 的分布函数为 如果总体中服从均匀分布则 其分布密度为 充分统计量 例:某厂要了解其产品的不合格率p,检验员 检查了10件产

5、品,检查结果是,除前二件是 不合格品(记为 )外,其它都是 合格品(记为 )。当厂长问 及检查结果时检验员可作如下两种回答:(1) 10件中有两件不合格;(2) 前两件不合格。这两种回答反映了检验员对样本的两种不同 的加工方法。其所用的统计量分别为 显然,第二种回答是不能令人满意的,因为 统计量不包含样本中有关p的全部信息。而第 一种回答是综合了样本中有关p的全部信息。 因为样本 提供了两种信息:(1) 10次检验中不合格品出现了几次;(2) 不合格品出现在哪几次试验上。第二种信息(试验编号信息)对了解不合 格品率p是没有什么帮助的 .充分统计量就是能把含在样本中有关总体 或者参数的信息一点都

6、不损失地提取出来。 或者说充分统计量包含了有关总体或有关参 数的全部信息.考虑样本的分布 由于且 是服从二项分布故它与 无关定义1.3 设总体X的分布为一个含未知参数的分 布族 , 是X的一个样 本。是一个统计量,对给定的t , 样本 在的条件 下的条 件分布与参数 无关,则称统计量T是参数的充分统计量。上例的一般情况是设 是来自0-1分布的一个简单随机样本,其中 ,则 是 参数的充分统计量。 由定义可得 定理1.1 设 是参数 的充分 统计量, 是单值可逆函数,则 也是参数 的充分统计量。 当总体为连续型总体时,充分统计量要用条 件分布密度来描述。奈曼(J.Neyman)和哈 尔斯(P.R.

7、Halmos)在20世纪40年代提出并 严格证明了一个判别充分统计量的方法:因 子分解定理。 定理1.2 (因子分解定理)设样本的联合分布 为一个含未知参数的分布族 ,则 是一个充分统计量 当且仅当存在这样的两个函数:(1)与 无关的非负函数 ;(2)与 有关,且仅与统计量T的值有关的非负 函数 使得其中 在离散总体的情况下表示 样本的分布列,在连续总体的情况下表示样本 的分布密度。 例 设 是来自 分布, 即它的分布密度为 的一个简单随机样本,其中 则 分别是参数 的充分统计量解:样本 的联合分布密度为如果令由因子分解定理知 是 的充分统计量 。 例 设总体X的分布密度为是X的一个简单随机样

8、本,试证 明最小顺序统计量 的充分统计量。证:样本 的联合分布密度为如果令由因子分解定理知 是 的充分统计量。 1.4抽样分布我们称统计量的分布为抽样分布 ,不同的统 计量其分布不一定相同. 常见的分布类型有:正态分布伽玛分布卡方分布 t 分布F分布 伽玛分布 定义1.4 如果连续型随机变量X的密度函数为其中 为 函数,则称X为服从参数是 的伽玛分 布,记为 伽玛分布的性质 (1)由此可得 (2)如果 ,并且X和Y相 互独立,容易求得这个性质称为可加性,即伽玛分布具有可加性. 卡方分布 用构造性的方式定义是定义1.5 设 为相互独立的随机变 量,且均服从 ,则它们的平方和也是一个随机变量,它所

9、服从的分布称为自由 度为n的 分布,记为 它的密度函数为其密度函数与参数n有关,它的图形也有一定 差异 卡方分布的性质若 ,则即卡方分布是一种伽玛分布,因此具有伽 玛分布的性质()() 如果 ,并且X和Y 相互独立,有卡方分布也具有可加性 例是来自参数为 的指数分布 总体,试证明: 总体的密度为当 时,我们有密度为说明 假定子样是简单随机子样,则且它们之间相互独立,故有 t 分布构造性的方式定义定义1.6 设 , ,且X 与Y相互独立,记则也是一个随机变量,它所服从的分布称 为自由度为n的t分布,记为 它的密度函数为与参数n有关,不同的n其图形也有差异 性质 若 则 ()当 时,t分布是柯西分

10、布,柯西分 布不存在数学期望和方差参数为2的t分布 也不存在数学期望和方差 () 时, ()可以证明这是标准正态分布的分布密度,即当n充分大 时,T近似服从标准正态分布 分布构造性的方式定义定义1. 设 , ,且 X与Y相互独立,记则也是一个随机变量,它所服从的分布称 为自由度为(m,n)的F分布,记为 它的密度函数为它与m,n有关,其图形也有一定差异 容易得到若 ,则 例 设 试证明:证明:由t分布的构造性定义知,存在相互独 立的变量和,使得于是,仍相互独立,由分布的定义知结论 成立 分位数: 定义1.6 设X为连续型随机变量,其分布函数为 ,对 ,如果存在数 满足则称 为此分布的 分位数分

11、位数的几何意义 可用图形表示,它的值可 查表得到,不同的分布有不同的分位数,有 不同的表可查 常见的分位数有它们的值可以通过附表1、附表2、附表3、附 表4 查得 分位数具有性质 (1)(2)(3)当n 足够大时(一般n 45)有近似公式 例:查表求下列分位数的值 抽样分布定理 定理1.1 设总体 , 为X的一个简单随机样本, 为样本均值 与样本方差,则有:(1)(2)(3) 相互独立;(4) 定理1.2 设有两个总体与,从两个总体与中分别独 立抽取容量为m,n的简单随机样本 记 为样本 的样本均值与方差, 为样本 的样本均值与方差,则() ()()若 则其中 定理1.3 设总体X为任意总体,存在有限的数 学期望与方差 , 为X的一个样本,当n充分大时(称之为大样 本),有()() 例1.8 设总体 ,分别从X中抽 取容量为10与15的两个独立样本,求它们的 均值之差的绝对值大于0.3的概率 例1. 设总体 , 是从总体中抽取的简单随机样本,选取常数c,d 使得并求出n.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号