总体均值的置信区间PPT课件

上传人:嘀嘀 文档编号:264395082 上传时间:2022-03-11 格式:PPT 页数:69 大小:805KB
返回 下载 相关 举报
总体均值的置信区间PPT课件_第1页
第1页 / 共69页
总体均值的置信区间PPT课件_第2页
第2页 / 共69页
总体均值的置信区间PPT课件_第3页
第3页 / 共69页
总体均值的置信区间PPT课件_第4页
第4页 / 共69页
总体均值的置信区间PPT课件_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《总体均值的置信区间PPT课件》由会员分享,可在线阅读,更多相关《总体均值的置信区间PPT课件(69页珍藏版)》请在金锄头文库上搜索。

1、第六章 抽样推断教学目的:掌握抽样调查的概念特点、应用范围;理解、掌握抽样平均误差和抽样极限误差的计算及误差范围和置信区间;熟练掌握简单随机抽样组织方式下如何利用样本指标估计总体的平均指标和成数指标。掌握假设检验的一般问题教学重点:抽样调查的特点、抽样平均误差和抽样极限误差的计算及误差范围和置信区间教学难点:抽样调查的特点、抽样平均误差和抽样极限误差的计算及误差范围和置信区间 教学学时:8学时Date1统计推断的过程总总体体样样本本总体均值、比例、方差样本统计量例如:样本均值、比例、方差Date2第一节 抽样调查一、抽样调查的概念及特点 1.概念 (1)抽样调查:从所研究的总体中抽出一部分单位

2、,作为样本进行观察研究,以认识总体的数量特征一种统计方法。 (2)抽样估计:根据样本分布的原理、利用样本资料提供的信息对总体的某些数量特征进行科学的估计或推断。Date32.特点(1)根据部分实际资料对全部总体的数量特征作出估计;(2)按随机原则从全部总体中抽取样本单位;(3)抽样误差可以事先计算并加以控制;二、抽样调查的作用1.对不可能进行全面调查现象进行抽样估计;2.抽样调查可以节省人力物力,提高调查的经济效益,又能够节省时间,提高调查的实效性。Date4三、抽样调查的几个基本概念 1.总体和样本 (1)总体 总体单位的总数称为总体容量(用N表示)。 (2)样本 从总体中抽取来代表总体的部

3、分总体单位所构成的整体。 样本单位的总数称为样本容量(用n表示)。 种类:大样本 小样本Date52.总体参数和样本指标(1)总体参数(总体指标) 如 (或记为 )、P、 等。(2)样本指标(估计量或样本统计量) 如 、p、s 等。3.重复抽样和不重复抽样(1)重复抽样(回置抽样)(2)不重复抽样(不回置抽样)Date64.概率抽样与非概率抽样(1)概率抽样 基本的组织方式有:整群抽样、分层抽样、等距抽样、简单随机抽样。(2)非概率抽样 根据调查者的经验或判断,从总体中有意识的抽取若干单位构成样本。如典型调查、重点调查、方便(偶遇)抽样等。Date75.抽样筐(1)定义:包括全体抽样单位的名单

4、框架。(2)形式:名单抽样筐列出全部总体单位的名录一览表。如企业名单、居民名单、学生名单;区域抽样筐按地理位置将总体范围划分为若干小区域,以小区域为抽样单位;时间表抽样筐将总体全部单位按照时间顺序排列,把总体的时间过程分为若干小的时间单位,以时间单位为抽样单位。如检测流水线上的产品质量时以1分钟为一个抽样单位。Date8第二节 抽样误差一、抽样误差的概念(一)抽样误差的性质 1.抽样误差 由于随机抽样的偶然因素使各单位的结构不足以代表总体的结构而引起抽样指标与总体指标间的绝对离差。 2.抽样调查中误差的来源 (1)登记性误差:可避免 (2)代表性误差 系统误差:非随机、可避免 随机性误差:可计

5、算、控制 抽样估计中所指的误差主要指随机误差。Date9(二)抽误误差的影响因素 1.样本容量:即样本单位数2.总体差异程度3.抽样方法4.抽样组织形式Date10二、抽样平均误差(一)抽样平均误差的概念 所有可能样本的估计值与相应总体参数的标准差,反映样本估计值与其中心的平均离散程度。(二)抽样平均误差的计算公式 Date11样本均值的抽样分布(一个例子)【例】【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下:均值和方差均值和方差总体分布总体分布1 14 42 23 30 0.1.12 2.3.

6、3Date12 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)Date13样本均值的抽样分布样本均值的抽样分布1.01.00 01 12 23 3P P ( ( x x ) )1.51.53.03.04.04.03.53.52.02.02.52.5x x 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.

7、02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)Date14所有样本均值的均值和方差式中:M为样本数目比较及结论:1. 样本均值的均值(数学期望)等于总体均值2. 样本均值的方差等于总体方差的1/nDate151.1.抽样平均数的平均误差抽样平均数的平均误差(1)重复抽样(2)不重复抽样Date162.2.抽样成数的平均误差抽样成数的平均误差(1)(1)重复抽样重复抽样(2)(2)不重复抽样不重复抽样 例:从40000件产品中随机抽取200件进行检查,结果有10件不合格。求合格率的抽样平均误差?Date17三、抽样极限误差(一)概念 又称允许误差。指样

8、本指标与总体指标之间产生抽样误差被允许的最大可能范围。(二)抽样极限误差的计算 Date18(三)抽样误差的概率度 基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。 极限误差除以抽样平均误差得到的相对数称为概率度。用Z表示。(四)抽样估计的置信度 指样本指标与总体指标误差不超过一定范围的概率保证程度。抽样误差的概率就是概率度Z的函数,即: Date19Date20第三节 简单随机抽样估计的方法 一、抽样估计的优良标准 同一个总体参数有多个样本估计量,究竟哪一个才是最优估计量呢,常用以下三个标准衡量: 1.无偏性:估计量的数学期望等于被估计的总体参数P( X )XC CA

9、 A无偏有偏Date21 2.有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量。A AB B中位数的抽样分布均值的抽样分布XP(X )Date22 3.一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数。A AB B较小的样本容量较大的样本容量P(X )XDate23 二、总体参数的点估计 1.概念 从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。 例如: 用样本均值作为总体未知均值的估计值就是一个点估计。 2.点估计的方法:有矩估计法、顺序统计量法、最大似然法、最小二乘法等。 优点:简单明确 缺

10、点:不能说明估计结果的抽样误差和把握程度。Date24三、总体参数的区间估计 (一)区间估计的概念要点 1.根据一个样本的观察值给出总体参数的估计范围 2.给出总体参数落在这一区间的概率 3.例如: 总体均值在5070之间,置信度为 95%置信区间置信下限置信上限样本统计量 (点估计)Date25(二)区间估计的内容2 已知2 未知均 值方 差比 例置 信 区 间Date26落在总体均值某一区间内的样本95% 95% 的样本的样本x -1.96 -1.96 x xx +1.96+1.96 x x99.73% 99.73% 的样本的样本 x - 3- 3 x x x + 3 + 3 x x90%

11、的样本x -1.65 xx +1.65xDate27(三)置信水平总体未知参数落在区间内的概率表示为 (1 - 为显著性水平,是总体参数未在区间内的概率。Date28(四)总体均值的区间估计 (已知)1.假定条件总体服从正态分布,且总体方差()已知如果不是正态分布,可以由正态分布来近似 (n 30)2.使用正态分布统计量3. 总体均值 在1-置信水平下的置信区间为Date29总体均值的区间估计(正态总体:实例)【例1】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差 =0.15mm,试估计该种零件平均长度的置信区间,给定置信水平为0.95。解:已

12、知N(,0.152),x2.14, n=9, 1- = 0.95,/2=1.96 总体均值的置信区间为我们可以95的概率保证该种零件的平均长度在21.30221.498 mm之间。Date30总体均值的区间估计(非正态总体:实例)【例2】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36分钟)。解:已知 x26, =6,n=100, 1- = 0.95,/2=1.96我们可以95的概率保证平均每天参加锻炼的时间在24.82427.176 分钟之间。Date31总体均值的置信区间

13、( 未知)1.假定条件总体方差()未知总体必须服从正态分布2.使用 t 分布统计量3. 总体均值 在1-置信水平下的置信区间为Date32总体均值的区间估计 ( 未知实例)【例3】从一个正态总体中抽取一个随机样本, n = 25 ,其均值x = 50 ,标准差 s = 8。 建立总体均值 的95%的置信区间。解:已知N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.0639。我们可以95的概率保证总体均值在46.6953.30 之间Date33(五)总体比例的置信区间1.假定条件两类结果总体服从二项分布可以由正态分布来近似2.使用正态分布统计量3. 总体比例 的置信

14、区间为Date34例4: 某城市想要估计下岗职工中女性所占的比例,随机抽取了100名下岗职工,其中65人为女性职工。试以99.73%的置信水平估计该城市下岗职工中女性比例的置信区间?Date35影响区间宽度的因素1. 数据的离散程度,用 来测度2. 样本容量3. 3. 置信水平 (1 - ),影响 Z 的大小Date36区间估计步骤(以估计 为例):计算样本统计量计算抽样平均误差计算抽样极限误差 确定置信区间Date37 四、样本容量的确定思考:1.影响样本容量的因素? 2.比例条件下n的确定?Date38 课堂练习课堂练习: : 3788.26,4111.743788.26,4111.74

15、77.86%,92.14% 用简单随机抽样方法,从一批电子产品中按重复抽样抽取100个对其使用寿命进行测试,结果如下: (1)以95.45的概率保证 程度估计该产品的平均使用 寿命区间? (2)若 3000小时以下为不 合格品,试以同样的概率估 计该产品合格率的区间? 使用寿命(小时时) 产品个数3000以下 15 30004000 30 40005000 505000以上 5Date39第四节 其他抽样组织形式的参数估计Date40一、分层抽样及其参数估计(一)概念1.分层抽样2.分配样本单位数的方法 (1)等比例分配法 (2)不等比分配法:奈曼法、经济法(二)等比例抽样的参数估计回忆:纯随

16、机抽样估计步骤思考:等比例抽样估计关键应是什么?Date41平均数的参数估计思考:成数的参数估计?Date42例题: 某地区对居民在一年内用于某类消费的支出进行了等比例分层抽样,结果如下(单位:元)。 要求以95.45%的置信水平,估计该地区平均每户支出的区间?调查调查户户数平均支出方差城镇镇403502209农农村802602916Date43Date44二、等距抽样及其参数估计(一)概念 1.等距抽样 2.等距抽样的方法 (1) 无关标志排队等距抽样 (2) 有关标志排队等距抽样 半距起点等距抽样 对称起点等距抽样(二)等距抽样参数估计 (1)无关标志排队等距抽样 (2)有关标志排队等距抽样Date45三、整群抽样及其参数估计(一)概念(二)参数估计 假设将总体全部N个单位划分成R群,从中随机抽取r群,被抽中的群的平均值为 Date46例题: 某商场有某种饮料500箱,每箱6瓶,现随机抽取10箱检查每瓶的含菌量数,测得这10箱的平均每瓶含菌数分别为:90、80、65、85、75、70、50、70、60、65个。要求以95%的置信度推断这批饮料的平均含菌数的区间?Date47Date

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号