统计学第七章抽样推断syong

上传人:飞*** 文档编号:50746135 上传时间:2018-08-10 格式:PPT 页数:63 大小:767KB
返回 下载 相关 举报
统计学第七章抽样推断syong_第1页
第1页 / 共63页
统计学第七章抽样推断syong_第2页
第2页 / 共63页
统计学第七章抽样推断syong_第3页
第3页 / 共63页
统计学第七章抽样推断syong_第4页
第4页 / 共63页
统计学第七章抽样推断syong_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《统计学第七章抽样推断syong》由会员分享,可在线阅读,更多相关《统计学第七章抽样推断syong(63页珍藏版)》请在金锄头文库上搜索。

1、第七章 抽样推断v本章内容第一节 抽样推断概述第二节 抽样推断的几个基本概念第三节 抽样误差 第四节 参数估计的一般问题第五节 一个总体参数的区间估计第六节 样本容量的确定抽样方案设计v本章重点v 第三、五、六节内容v本章难点v 第三、五节内容v具体要求v 理解抽样推断的含义、作用及基本概念v 掌握抽样误差的计算、参数估计的方法等。7.1抽样推断概述 一、抽样推断的概念“抽样推断、抽样调查和抽样估计”基本上是相同的意思。回顾第二节“抽样调查”的概念抽样推断是按照随机原则从全部研究对象中抽取一部分单位进行观察,并根据被抽取的那部分单位的数量特征,运用一定的数理统计方法,对总体的数量性作出具有一定

2、可靠程度的估计和判断。【参书中的例子或自己举些例子】 二、抽样推断的特点 1、抽样推断是非全面调查。可以节省人力物力和财力,取得事半功倍的效果。 2、抽样推断是按随机原则抽选调查单位。 3、抽样推断是用样本的指标数值去推算总体的指标数值。 4、抽样推断运用的是概率原理。 5、抽样推断中产生的误差可以事先计算并加以控制。 三、抽样推断的作用(适用范围) 1、对无限总体全面情况的了解,必须采用 抽样推断。 2、对破坏性或消耗性检查,必须采用抽样调 查。 3、对某些可以但事实上不必或不可能进行全 面调查的现象总体,可以采用抽样推断获取相关 资料。 4、抽样调查可以对全面调查得来的资料进行 验证,并据

3、以进行补充和修改。 5、抽样推断可以用于生产过程的质量控制。 7.2抽样推断的几个基本概念一、全及总体和抽样(样本)总体1、全及总体又称母体,简称总体,它是指所要认 识的,具有某种共同性质的许多单位的集合体。组成全及总体的单位称为总体单位,全及总体的单 位数一般用N表示。 2、抽样总体又称子样,简称样本,是从全及总体 中随机抽取的那一部分单位所构成的集合体。 组成抽样总体的单位称为样本单位,样本单位数亦 称样本容量,一般用n表示。样本单位数的范围:1nN 抽样比例: 大样本:n30;小样本:n30 重点理解:如果说对于一次抽样调查, 全及总体是唯一确定的,那么抽样总体就不 是这样,样本是不确定

4、的,一个全及总体可 能抽出很多个样本总体,样本的个数和样本 的容量有关,也和抽样的方法有关。n N二、样本容量和样本个数 1.样本容量:是指一个样本所包含的单位数, 通常用n表示。(总体单位数用N表示) 2.样本个数:样本可能数目,是从一个总体中 可能抽取的样本个数。 如:样本容量为n 重复抽样:样本个数为 不重复抽样:样本个数为三、总体指标和样本指标 1.总体指标(参数) 总体平均数 总体成数 当研究的是总体个单位的属性特征时,只 能用一定的术语来描述,所以就应该计算比 重结构指标,称为总体成数。用大写 P 表示 ,它说明了总体中具有某种标志的单位数在 总体中所占的比重。 设总体N个单位中,

5、有N1个单位具有 某种属性,N0个不具有某种属性, N1 +N0=N,P为总体中具有某种属性的单位数 所占的比重,Q为布局有某种属性的单位所 占的比重,则总体成数为: 总体标准差、总体方差2.样本指标(统计量) 样本平均数 样本成数 样本标准差、样本方差 四、重复抽样和不重复抽样 抽取样本有两种基本方法,不同的方法会影响抽样的误差。 1、重复抽样(重置抽样、放回抽样) 基本的特点和做法 样本个数的计算:Nn(可重复排列数) 2、不重复抽样(不重置抽样、不放回抽样) 基本的特点和做法 样本个数的计算: (不重复排列数) N(N-1)(N-2)(N-n+1)N!/(N-n)! 以上都是考虑顺序的抽

6、样!7.3 抽样误差15 一、 抽样误差1 抽样误样误 差的概念一般地说说,抽样误样误 差是指根据样样本数据计计算而得的样样本统计统计 量值值与被它估计计的未知的总总体参数真值值之间间的差值值。总总体参数真值值样样本统计统计 量值值抽样误样误 差例如Xx均值值抽样误样误 差2、统计调查误差的种类(1)登记性误差(工作误差)调查过程中由于主客观原因在登记、汇总、计算、过录 中所产生的差错。(2)代表性误差用部分推算总体时产生的误差。偏差(系统性误差):由于抽样调查没有遵循随机原 则而产生的误差。随机误差 (偶然性误差):在没有登记性误差又遵循 了随机原则的情况下,所产生的样本指标与被它估计的总体

7、相 应指标的差数。 3、抽样误差的进一步理解 它就是指随机误差; 它是一个随机变量; 它是抽样推断中不可避免不可消除的误差; 抽样误差的大小反映了样本代表性的高低; 它可以用数理统计方法进行计算和控制。 二、抽样平均误差1.抽样平均误差的含义: 抽样平均误差从一般意义上说是所有样本指标与总体 指标差数的平均水平,它反映了抽样指标与总体指标的平 均离差程度。 实质就是所有可能出现的样本指标的标准差 。u 一全及总体可抽取的样本有多个 u 每个样本都可以计算出相应的样本指标(抽样平均数或抽样成数指标) u 样本指标和总体指标的抽样误差各不相同(随机变量) 为了测定样本(指标)的代表性程度的高低,单

8、独用某一次的抽样误差来衡量是不科学的,因此就需要采用一 定的方法(求标准差的方法)计算所有抽样误差的平均数 ,这就是抽样平均误差。同时它在参数估计中也要用到。 【例例】假假设从设从4 4个生产汽车零件的工人总体抽取个生产汽车零件的工人总体抽取2 2人进人进 行抽样调查,来推断行抽样调查,来推断4 4个工人的平均日产量。个工人的平均日产量。4 4 个工人个工人 的日产量分别为:的日产量分别为:x x1 1=1=1、x x2 2=2=2、x x3 3=3=3 、x x4 4=4=4 ( (单位:件单位:件 )。可得总体的均值、方差及分布如下)。可得总体的均值、方差及分布如下总体分布总体分布1 14

9、 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差 现从总体中抽取现从总体中抽取n n2 2的简单随机样本,在重复抽的简单随机样本,在重复抽 样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个 观察值所有可能的n = 2 的样本(共16个) 计算出各样本的均值,如下表。计算出各样本的均值,如下表。3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51

10、.01第二个观察值第一个 观察值16个样本的均值(x)样本平均数概率1 1.5 2 2.5 3 3.5 41/16 2/16 3/16 4/16 3/16 2/16 1/16样本平均数的均值或 抽样平均误差是所有样本指标与总体指标离差的平均水平抽样平均误差是所有样本指标与总体指标离差的平均水平 ,所以有以下计算,所以有以下计算(件)(件)0.79060.7906件的含义是,对于件的含义是,对于1616个样本,无论抽到哪个样本个样本,无论抽到哪个样本平均来说误差为平均来说误差为0.79060.7906件。件。从以上计算中可以看出: (1)抽样平均误差就是抽样指标的标准差, 所以也称为抽样标准误差

11、或估计标准误。 (2)抽样平均误差(即抽样指标的标准差) 比总体标准差小的多,仅为总体标准差的 。26 l依据抽样分布的基本原理,可以利用以下计算公式直接计算出相应样本统计量的抽样平均误差。 l(1)样本均值的抽样平均误差2.抽样平均误差的计算D重复抽样条件下: x n = n N 1NnN - - 1- N1N- Q 一般情况下N比较大Nnx )1 (n2 - D不重复抽样条件下: - - 1NnN n2 ) (x = 27 (2)样样本成数的抽样样平均误误差抽样平均误差) 1 p- n ( p p = D重复抽样条件下:N n )(- - =) ( - - - =1 n ) 1 ( 1 N

12、 n N n ) 1 ( p Pppp D不重复抽样条件下:28 l 【例】从10000名学生中抽查200名测得平均身高为1.65m,已知学生身高的总体标准差=0.28。其中女生占全部学生的比重30%。求学生平均身高和女生比重的抽样平均误差。 抽样平均误差(举例)解:已知N=10000,n=200, x =1.65m, = 0.28,p = 30% 在重复抽样的条件下: 在不重复抽样的条件下:200x n = = 0.28= 0.0198) 1 P- n ( p P =) 1 0.3- 200( 0.3=3.24%10000200)( - - =- =1200)1( n)1( p0.30.3

13、P P N)(- 1n=3.21%Nnx )1 (n2 - = 10000200)1(2002 - = 0.28= 0.0196 在没有总体方差和标准差时怎么办? (用样本的相关指标代替即可) 计算公式汇总: 三、影响抽样(平均)误差的因素 1、抽样单位数目的多少; 2、总体被研究标志的变异程度; 3、抽样方法和组织形式的不同。7.4 参数估计的一般问题一. 估计量与估计值 二. 评价估计量的标准 三. 点估计与区间估计 估计量:用于估计总体参数的随机变量 如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值 的一 个估计量 参数用 表示,估计量用 表示 估计值:估计参数时计算出来的

14、统计量的具 体值 如果样本均值 x =80,则80就是的 估计值一、估计量与估计值(estimator & estimated value)二、评价估计量的标准 1. 无偏性(unbiasedness) 无偏性:估计量抽样分布的数学期望等于 被 估计的总体参数 P P( ( ) )B BA A无偏无偏有偏有偏A AB B的抽样分布的抽样分布的抽样分布的抽样分布P P( ( ) )2.有效性 (efficiency)有效性:有效性:对同一总体参数的两个无偏点估计量对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效,有更小标准差的估计量更有效 3.一致性 (consistency) 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数A AB B较小的样本容量较小的样本容量较大的样本容量较大的样本容量P P( ( ) )三、点估计与区间估计估 计 方 法点 估 计区间估计参数估计的方法参数估计的方法(一)点估计(point estimate) 用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值 的估计 例如:用两个样本均

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号