计量资料的区间估计

上传人:汽*** 文档编号:570145746 上传时间:2024-08-02 格式:PPT 页数:95 大小:1.34MB
返回 下载 相关 举报
计量资料的区间估计_第1页
第1页 / 共95页
计量资料的区间估计_第2页
第2页 / 共95页
计量资料的区间估计_第3页
第3页 / 共95页
计量资料的区间估计_第4页
第4页 / 共95页
计量资料的区间估计_第5页
第5页 / 共95页
点击查看更多>>
资源描述

《计量资料的区间估计》由会员分享,可在线阅读,更多相关《计量资料的区间估计(95页珍藏版)》请在金锄头文库上搜索。

1、引引 言言 随机变量及其所伴随的概率分布全面描述了随机随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。现象的统计性规律。 概率论的许多问题中,随机变量的概率分布通常概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。是在这已知是基础上得出来的。 但实际中,情况往往并非如此,一个随机现象所但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。型,但是其中的某些参数是

2、未知的。1例如:例如: 某公路上行驶车辆的速度服从什么某公路上行驶车辆的速度服从什么分布是未知的分布是未知的; 电视机的使用寿命服从什么电视机的使用寿命服从什么分布是未知的分布是未知的; 产品是否合格服从两点分布,但参数产品是否合格服从两点分布,但参数合格率合格率p是是未知的;未知的; 数理统计的任务则是数理统计的任务则是以概率论为基础,根据试验以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合所得到的数据,对研究对象的客观统计规律性做出合理的推断。理的推断。2 从现在开始,我们学习数理统计的基础知识。数从现在开始,我们学习数理统计的基础知识。数理统计的任务是理统计的任务是

3、以概率论为基础,根据试验所得到的以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性作出合理的推断数据,对研究对象的客观统计规律性作出合理的推断.数理统计所包含的内容十分丰富,后面学习数理统计所包含的内容十分丰富,后面学习参数估计、参数估计、假设检验、方差分析、回归分析假设检验、方差分析、回归分析等内容等内容.包括数理统计包括数理统计的一些基本术语、基本概念、重要的统计量及其分布,的一些基本术语、基本概念、重要的统计量及其分布,它们是后面各章的基础。它们是后面各章的基础。学习的基本内容学习的基本内容32.1 计量资料的区间估计计量资料的区间估计 2.1.1 随机抽样随机抽样 统计工

4、作统计工作统计设计统计设计搜集资料搜集资料整理资料整理资料分析资料分析资料选估计选估计,检验检验,回归回归,设计方法设计方法按设计抽样按设计抽样,搜集报表搜集报表,试验试验对原始数据分组和归纳对原始数据分组和归纳计算和统计处理计算和统计处理,作出结论作出结论 4统计资料统计资料计量资料计量资料 定量方法测得大小定量方法测得大小,连续总体连续总体分类资料分类资料计数资料计数资料 无序分类无序分类,离散离散等级资料等级资料有序分类有序分类,离散离散5样本与统计量样本与统计量 总体与样本总体与样本 在在数数理理统统计计中中,把把研研究究对对象象的的全全体体称称为为总总体体(population)或或

5、母母体体,而而把把组组成成总总体体的的每每个个单单元元称称为为个个体体。 抽样抽样 要要了了解解总总体体的的分分布布规规律律,在在统统计计分分析析工工作作中中,往往往往是是从从总总体体中中抽抽取取一一部部分分个个体体进进行行观观测测,这这个个过过程程称称为为抽抽样样。 6样本与统计量样本与统计量 子样子样 子子样样 是是n个个随随机机变变量量,抽抽取取之之后后的的观观测测数数据据 称称为为样样本本值值或或子子样样观观察察值值。 在在抽抽取取过过程程中中,每每抽抽取取一一个个个个体体,就就是是对对总总体体X进进行行一一次次随随机机试试验验,每每次次抽抽取取的的n个个个个体体 ,称称为为总总体体X

6、的的一一个个容容量量为为n的的样样本本(sample)或或子子样样;其其中中样样本本中中所所包包含含的的个个体体数数量量称称为为样样本本容容量量。7随机抽样方法的基本要求随机抽样方法的基本要求 独立性独立性即每次抽样的结果既不影响其余各次抽样的即每次抽样的结果既不影响其余各次抽样的 结果,也不受其它各次抽样结果的影响。结果,也不受其它各次抽样结果的影响。 满足上述两点要求的样本称为满足上述两点要求的样本称为简单随机样本简单随机样本.获得简获得简单随机样本的抽样方法叫单随机样本的抽样方法叫简单随机抽样简单随机抽样. 代表性代表性即子样即子样( )的每个分量的每个分量 与总体与总体 具有具有相同的

7、概率分布相同的概率分布。 从简单随机样本的含义可知,从简单随机样本的含义可知,样本样本 是来自总体是来自总体 、与总体、与总体 具有相同分布的随机变量具有相同分布的随机变量.8简单随机抽样简单随机抽样 例如例如:要通过随机抽样了解一批产品的次品率,:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。这是一个简单随机抽样。 但实际抽样中,往往是不再放回产品,则这不是一但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量个简单随机抽样。但当总量N很大时,很大时,可近似看成可近似看成是

8、简单是简单随机抽样。随机抽样。9统计量统计量 定义定义 设(设( )为总体)为总体X的一个样本,的一个样本, 为为不含任何未知参数不含任何未知参数的的连续函数连续函数,则,则称称 为样本(为样本( )的一个统计量。)的一个统计量。则则 例如例如: 设设 是从正态总体是从正态总体 中抽取中抽取的一个样本,其中的一个样本,其中 为已知参数为已知参数, 为未知参数,为未知参数,是统计量是统计量 不是统计量不是统计量 10几个常用的统计量几个常用的统计量 样本均值样本均值(sample mean)设设 是总体是总体 的一个样本,的一个样本,样本方差样本方差(sample variance) 11样本均

9、方差或标准差样本均方差或标准差 它们的观测值用相应的小写字母表示它们的观测值用相应的小写字母表示.反映总反映总体体X取值的取值的平均平均,或反映,或反映总体总体X取值的离散程度取值的离散程度。几个常用的统计量几个常用的统计量 设设 是总体是总体 的一个样本,的一个样本,样本标准差样本标准差S样本变异系数样本变异系数 12子样的子样的K阶(原点)矩阶(原点)矩几个常用的统计量几个常用的统计量 设设 是总体是总体 的一个样本,的一个样本,子样的子样的K阶中心矩阶中心矩13它包括两个方面它包括两个方面数据整理数据整理 计算样本特征数计算样本特征数数据的简单处理数据的简单处理 为了研究随机现象,首要的

10、工作是收集原始数据为了研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。的,需要通过整理后才能显示出它们的分布状况。数据的简单处理是以一种直观明了方式加工数据。数据的简单处理是以一种直观明了方式加工数据。14计算样本特征数:计算样本特征数: 数据的简单处理数据的简单处理 数据整理数据整理:将数据分组:将数据分组 计算各组频数计算各组频数 作频率分布表作频率分布表 作频率直方图作频率直方图(1)反映趋势的特征数)反映趋势的特征数 样本均值样本均值中位数中位数:数据按大小顺

11、序排列后,位置居中的那个数:数据按大小顺序排列后,位置居中的那个数 或居中的两个数的平均数。或居中的两个数的平均数。众数众数:样本中出现最多的那个数。:样本中出现最多的那个数。 15数据的简单处理数据的简单处理 (2)反映分散程度的特征数:极差、四分位差)反映分散程度的特征数:极差、四分位差 极差极差样本数据中最大值与最小值之差,样本数据中最大值与最小值之差, 四分位数四分位数将样本数据依概率分为四等份的将样本数据依概率分为四等份的3个数椐,个数椐, 依次称为第一、第二、第三四分位数。依次称为第一、第二、第三四分位数。第一四分位数第一四分位数Q1: 第二四分位数第二四分位数Q2: 第三四分位数

12、第三四分位数Q3: 16 把包含血糖数据的区间等分为把包含血糖数据的区间等分为8至至15个小区间个小区间 4934884834904544354124373344955195495255535856323954154514534854814904975034365475245515984004184414514874814924975055125375225543854024114394484904664674985075175465325755934044314464414804654824985055155425365734294434494854684815005105055445345

13、78524449451470470478502512503544525568415458458487471476502517507549524564569541534498515497473475480456456490410461454470473478493514512541544558554378531500509495483470485417500517503534546416520 血糖数据最大值为血糖数据最大值为632,最小值为,最小值为334例例1 某地某地148名正常人血糖数据(单位名正常人血糖数据(单位mmol/l),),分析其分布规律。分析其分布规律。 17 记录各小区间内

14、血糖数据的频数及计算频率记录各小区间内血糖数据的频数及计算频率 组序组距d30频数m频率fn频率密度fn/d136210.67570.0225239221.35140.04503422128.10810.270344521610.81080.360454822818.91890.630665123926.35140.878475422617.56760.585685721711.48650.3829960264.05410.13511063210.67570.0225合计148118 以小区间长为底、相应频率密度为高作矩形,以小区间长为底、相应频率密度为高作矩形,称为样本的直方图称为样本的直方

15、图 直方图上缘形成一直方图上缘形成一条条 “中间大、两头中间大、两头小、两侧对称小、两侧对称”的正的正常特点曲线常特点曲线19总体、样本、样本观察值的关系总体、样本、样本观察值的关系总体总体 样本样本 样本观察值样本观察值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资料样本观察值,去推断样本观察值,去推断总体的情况总体的情况总体分布。样本是联系两者的桥梁。总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去取到样本观察值的规律,因而可以用样本观察值去推断总体推断总体2

16、0集中趋势集中趋势样本均数样本均数中位数中位数居中位置的值居中位置的值众数众数频率最大的值频率最大的值离散程度离散程度样本方差样本方差样本标准差样本标准差样本变异系数样本变异系数 样本标准误样本标准误极差极差最大与最小值之差最大与最小值之差25%、75%位置值位置值 四分位数四分位数21样本均数与标准差、标准误常合写在一起样本均数与标准差、标准误常合写在一起 样本构成不含总体任何未知参数的函数称统计量样本构成不含总体任何未知参数的函数称统计量称为称为的无偏估计量的无偏估计量估计量的一个具体值称一个点估计估计量的一个具体值称一个点估计定理定理1 设设X1,X2,Xn为总体为总体X的简单随机样本的

17、简单随机样本 X1,X2,Xn与总体与总体X独立同分布独立同分布,EXiEX,DXiDX 22定理定理1表明,样本均数、样本方差表明,样本均数、样本方差S2分别是总体均分别是总体均数数EX、总体方差、总体方差DX的一个无偏点估计的一个无偏点估计 23例例1 开胸顺气丸崩解时间开胸顺气丸崩解时间XN(,)随机抽取随机抽取5丸崩解时间为丸崩解时间为:36,40,32,41,36(min),作作及及2的无偏的无偏点估计点估计 由数据计算得由数据计算得37,S213 及及2的点估计为的点估计为 24抽抽 样样 分分 布布学学 习习 目目 标标 了解了解 分布、分布、t 分布、分布、F 分布以及来自正态

18、分布以及来自正态 总体的样本均值的分布等常见统计量的分布。总体的样本均值的分布等常见统计量的分布。 会查会查 分布、分布、t 分布、分布、F 分布的临界值表。分布的临界值表。25 统计量是样本的函数,是随机变量,有其统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为概率分布,统计量的分布称为抽样分布抽样分布. 26 分布分布275 10 15 2028或或29定理定理 X1,X2,Xn为总体为总体XN(,2)简单随机样本简单随机样本 2(n -1 )证明:证明:30N(0,1) N(0,1) 2(n) 2(1 1) 2(n -1)31定理定理32推论推论33 例例 1 已知某单位职

19、工的月奖金服从正态分已知某单位职工的月奖金服从正态分布布, 总体均值为总体均值为 200, 总体标准差为总体标准差为 40 , 从该从该总体抽取一个容量为总体抽取一个容量为 20 的样本的样本, 求样本均值介求样本均值介于于 190210 的概率的概率 . 解解 34 t 分布分布3536也称作也称作37 查表时要先看查表时要先看清楚表头清楚表头的的名称或概率表达式,若为名称或概率表达式,若为上侧临界值表上侧临界值表,则可以,则可以直接查用直接查用. 若为若为双侧临界值表双侧临界值表,则需换算后查用则需换算后查用. 38例例 3 解解 39例例 4 解解 40定理定理证明:证明:N(0,1)

20、2(n -1)t(n1) 41定理定理 4 42特别地特别地 43F 分布分布4445也称作也称作 46 F 分布的临界值可以通过查分布的临界值可以通过查 F 分布的临界值分布的临界值表表( (见附表见附表 IV) 求得求得. F 分布的性质分布的性质 例例 5 解解 47定理定理 5 48正态总体的抽样分布定理正态总体的抽样分布定理证明证明:是是n 个独立的正态随个独立的正态随机变量的线性组合机变量的线性组合,故故服从正态分布服从正态分布49(3)证明证明:且且U与与V独立独立,根据根据t分布的构造分布的构造得证得证!5051参参 数数 的的 点点 估估 计计 例例 1 某商场在决定是否接收

21、厂家送来的一某商场在决定是否接收厂家送来的一大批箱装商品时大批箱装商品时, 随机地抽取若干箱进行检验随机地抽取若干箱进行检验, 根据这几箱的平均次品数根据这几箱的平均次品数, 估计该批商品平均每估计该批商品平均每箱的次品数箱的次品数. 例例 2 某省在一次高考结束后某省在一次高考结束后, 先要对考试先要对考试成绩做一个估计成绩做一个估计. 随机地抽取每科中的几包试卷随机地抽取每科中的几包试卷进行试判进行试判. 根据判卷结果估计全体考生的总分的根据判卷结果估计全体考生的总分的平均值和与平均值的偏离程度进行推断平均值和与平均值的偏离程度进行推断, 从而估从而估计出当年的录取线计出当年的录取线. 5

22、2参数估计是统计推断的基本内容之一参数估计是统计推断的基本内容之一. 参数估计有两种方法参数估计有两种方法: 点估计点估计与与区间估计区间估计. 要估计的总体参数称为要估计的总体参数称为待估参数待估参数, . 假设总体分布已知假设总体分布已知, 其中有一个或多个参其中有一个或多个参数未知数未知, 利用来自总体的样本估计总体的未知利用来自总体的样本估计总体的未知参数值参数值, 就是参数估计就是参数估计. 53 用一个估计量估计总体参数用一个估计量估计总体参数, 用这个估计用这个估计量的一个观察值作为总体参数的估计值的方法量的一个观察值作为总体参数的估计值的方法称为称为点估计点估计. 由这种方法得

23、到的估计值为由这种方法得到的估计值为点估点估计值计值. 估计量估计量 . 估计值估计值54矩估计法矩估计法 以样本矩的函数作为总体矩的函数的估计量以样本矩的函数作为总体矩的函数的估计量的方法称为的方法称为矩估计法矩估计法. 例例 3 解解 555657例例 4 解解 58例例 4 解解 5960 例例 5 解解 6162最大似然估计法最大似然估计法 例例 6 设有一批产品设有一批产品, 根据以往的经验知道根据以往的经验知道它的产品率它的产品率 p 可能是可能是 0.1 或或 0.3. 生产这批产品的生产这批产品的厂家认为该批产品质量很好厂家认为该批产品质量很好, 次品率大约为次品率大约为 0.

24、1, 而收购产品的商业部门认为产品质量有问题而收购产品的商业部门认为产品质量有问题, 次次品率可能为品率可能为 0.3. 现从这批产品中随机抽取现从这批产品中随机抽取 15 件件, 发现有发现有 5 件次品件次品. 问问: 生产厂家与收购部门谁的生产厂家与收购部门谁的估计更可靠些估计更可靠些 ? 63解解 64最大似然估计的思想最大似然估计的思想: 最大似然估计值最大似然估计值 . 最大似然估计值最大似然估计值 . 65似然函数似然函数66 求总体未知参数的最大似然估计值就是求似求总体未知参数的最大似然估计值就是求似 然然函数的最大值函数的最大值. 最大似然估计值最大似然估计值. 最大似然估计

25、量最大似然估计量. 67例例 7 解解 686970估计量的评价标准估计量的评价标准 1. 无偏性无偏性 定义定义无偏估计量无偏估计量 . 71例例 8 证证 7273定义定义2. 有效性有效性 (1) 频率是概率的最小方差无偏估计频率是概率的最小方差无偏估计. (2) 正态总体的样本均值和样本方差正态总体的样本均值和样本方差 分别是总体均值与方差的最小方差无偏估计分别是总体均值与方差的最小方差无偏估计. 两个结论两个结论74区区 间间 估估 计计问题的提出:问题的提出: 这种形式的参数估计方法称为这种形式的参数估计方法称为区间估计区间估计 . 75置信区间与置信度置信区间与置信度 定义定义置信区间置信区间置信度置信度 . 76置信度和置信区间的意义置信度和置信区间的意义:77两点说明两点说明: 78正态总体均值的区间估计正态总体均值的区间估计 分三步完成分三步完成:79808182解解 例例 1 83848586解解 例例 2 8788正态总体方差的区间估计正态总体方差的区间估计 8990解解 例例 3 9192小小 结结9394个人观点供参考,欢迎讨论

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号