《应用经济学课件第5章抽样与抽样分布》由会员分享,可在线阅读,更多相关《应用经济学课件第5章抽样与抽样分布(29页珍藏版)》请在金锄头文库上搜索。
1、第第5章章 抽样与抽样分布抽样与抽样分布 抽样的基本概念抽样的基本概念(理解)(理解)基本的抽样方法基本的抽样方法(掌握)(掌握)常用的抽样分布常用的抽样分布(知道)(知道) 主要内容和学习目标主要内容和学习目标 一、抽样的基本概念一、抽样的基本概念 总体、单位与样本总体、单位与样本 样本容量与样本个数样本容量与样本个数 参数与统计量参数与统计量 非抽样误差与抽样误差非抽样误差与抽样误差 抽样单元与抽样框抽样单元与抽样框 总体:总体:调查研究的事物或现象的全体调查研究的事物或现象的全体用符号用符号X X表示表示单位:单位:构成总体的每一个个别事物构成总体的每一个个别事物用符号用符号X Xi i
2、表示表示样本:样本:从总体中抽取的一部分总体单位的集合从总体中抽取的一部分总体单位的集合 用符号用符号(X X1 1,X,X2 2,X Xn n) )表示表示l 样本是一个样本是一个n n维随机变量维随机变量l 样本观察值用符号样本观察值用符号(x1,x2,xn) )表示表示l 简单随机样本是具有简单随机样本是具有代表性和独立性的样本代表性和独立性的样本 总体、单位与样本总体、单位与样本 样本容量:样本容量:一个一个样本中所包含的单位数样本中所包含的单位数 用符号用符号n n表示表示l 样本容量大,则抽样误差小,但调查成本高样本容量大,则抽样误差小,但调查成本高l 样本容量小,则调查成本低,但
3、抽样误差大样本容量小,则调查成本低,但抽样误差大l n30n30的样本称为大样本的样本称为大样本l n30n30的样本称为小样本的样本称为小样本样本个数:样本个数:指从一个总体中可能抽取的样本个数指从一个总体中可能抽取的样本个数 样本容量与样本个数样本容量与样本个数 参数与统计量参数与统计量参数:参数:n是用来描述总体的数量特征的常数是用来描述总体的数量特征的常数l参数通常是一个未知的常数参数通常是一个未知的常数统计量:统计量:n是指不含任何参数的样本函数是指不含任何参数的样本函数l是用来描述样本的数量特征的随机变量是用来描述样本的数量特征的随机变量l统计量通常是可以由样本数据计算出来的统计量
4、通常是可以由样本数据计算出来的 常用的总体参数常用的总体参数总体均值总体均值总体方差总体方差总体比例总体比例 常用的样本统计量(一)常用的样本统计量(一)样本均值样本均值样本方差样本方差样本比例样本比例 常用的样本统计量常用的样本统计量(二)二)Z Z统计量统计量t t统计量统计量2统计量统计量 非抽样误差与抽样误差非抽样误差与抽样误差非抽样误差:非抽样误差:n由于调查者或被调查者的人为因素造成的由于调查者或被调查者的人为因素造成的登记性误差登记性误差n由于主观因素破坏了随机原则而产生的由于主观因素破坏了随机原则而产生的系统性偏差系统性偏差l非抽样误差是可以避免或消除的非抽样误差是可以避免或消
5、除的抽样误差:抽样误差:n由于抽样的随机性而带来的偶然的由于抽样的随机性而带来的偶然的代表性误差代表性误差l抽样误差是抽样调查中所固有的误差抽样误差是抽样调查中所固有的误差l抽样误差是不可避免的,但可事先计算或控制抽样误差是不可避免的,但可事先计算或控制 抽样单元与抽样框抽样单元与抽样框抽样单元:抽样单元:在大规模抽样调查,通常将总体划分成在大规模抽样调查,通常将总体划分成不重叠且不重叠且又穷尽又穷尽的若干部分,每一个部分称为一个抽样单元。的若干部分,每一个部分称为一个抽样单元。l抽样单元的划分可以是自然形成的,也可以是认为划定的抽样单元的划分可以是自然形成的,也可以是认为划定的抽样框:抽样框
6、:是指关于总体单位或抽样单元的名册是指关于总体单位或抽样单元的名册l编制高质量的抽样框是保证抽样调查达到预期目的的前提编制高质量的抽样框是保证抽样调查达到预期目的的前提条件之一条件之一返回返回二、基本的抽样方法二、基本的抽样方法 简单随机抽样简单随机抽样 等距抽样等距抽样 分层抽样分层抽样 整群抽样整群抽样 简单随机抽样(一)简单随机抽样(一) 简单随机抽样:简单随机抽样:也称为纯随机抽样也称为纯随机抽样n是从总体包含的是从总体包含的N N个单位中个单位中任意抽取任意抽取n n个单位作为样本个单位作为样本n总体中每个单位可能被抽中的总体中每个单位可能被抽中的概率相等概率相等l它是一种最基本的抽
7、样方法它是一种最基本的抽样方法l它是其他抽样方法的基础它是其他抽样方法的基础 简单随机抽样(二)简单随机抽样(二) 简单随机抽样的优点简单随机抽样的优点n在理论上容易处理在理论上容易处理n当总体包含的单位数当总体包含的单位数N N不大时,实施并不困难不大时,实施并不困难简单随机抽样的缺点简单随机抽样的缺点n当总体包含的单位数当总体包含的单位数N N很大时,抽样框很难编制很大时,抽样框很难编制n当总体包含的单位数当总体包含的单位数N N很大时,调查极不方便很大时,调查极不方便 等距抽样(一)等距抽样(一)等距抽样:等距抽样:n首先将总体中的所有单位按首先将总体中的所有单位按排序排序n然后在规定的
8、范围内然后在规定的范围内抽取抽取一个单位作为一个单位作为初始单元初始单元n最后按事先定好的最后按事先定好的间隔间隔K K确定其他样本单位确定其他样本单位计算公式:计算公式: N N为总体单位数,为总体单位数,n n为样本容量为样本容量 等距抽样(二)等距抽样(二) 等距抽样的优点等距抽样的优点n实施简单实施简单n估计的精度较高估计的精度较高等距抽样的缺点等距抽样的缺点n对估计量精度的估计比较困难对估计量精度的估计比较困难 分层抽样分层抽样( (一)一)分层抽样:分层抽样:又称为分类抽样或类型抽样又称为分类抽样或类型抽样n首先将总体按某种特征或原则划分成若干层首先将总体按某种特征或原则划分成若干
9、层n然后在每层内独立地、随机地抽取子样本然后在每层内独立地、随机地抽取子样本n最后将子样本合起来构成总体样本最后将子样本合起来构成总体样本划分层时划分层时l应使层内各单位的差异尽可能小应使层内各单位的差异尽可能小l而使层间各单位的差异尽可能大而使层间各单位的差异尽可能大 分层抽样(二)分层抽样(二) 分层抽样的优点分层抽样的优点n可以同时对总体参数和各层的目标量进行估计可以同时对总体参数和各层的目标量进行估计n实施和组织比较方便实施和组织比较方便n样本在总体中的分布比较均匀样本在总体中的分布比较均匀n层次划分合理时,可以大大提高估计的精度层次划分合理时,可以大大提高估计的精度 整群抽样(一)整
10、群抽样(一)整群抽样整群抽样n首先将总体划分成若干群首先将总体划分成若干群n然后以群为抽样单元抽取样本然后以群为抽样单元抽取样本n最后对抽中的各个群内的所有单位进行调查最后对抽中的各个群内的所有单位进行调查划分群时划分群时l应使群内各单位的差异尽可能大应使群内各单位的差异尽可能大l而使群间各单位的差异尽可能小而使群间各单位的差异尽可能小 整群抽样(二)整群抽样(二) 整群抽样的优点整群抽样的优点n抽样时只需群的抽样框,可以减少工作量抽样时只需群的抽样框,可以减少工作量n群内各单位集中,调查方便、节省费用群内各单位集中,调查方便、节省费用整群抽样的缺点整群抽样的缺点n估计的精度较差估计的精度较差
11、ExcelExcel在抽样中的应用在抽样中的应用 方法一:利用方法一:利用ExcelExcel的分析工具库中的的分析工具库中的“抽样抽样” 工具进行工具进行 方法二:利用方法二:利用ExcelExcel的函数的函数“RAND”RAND”、“CEILING” CEILING” 和和“INDEX”INDEX”进行进行返回返回三、常用的抽样分布三、常用的抽样分布 样本均值的抽样分布样本均值的抽样分布 样本比例的抽样分布样本比例的抽样分布 样本方差的抽样分布样本方差的抽样分布 样本均值的抽样分布样本均值的抽样分布( (一)一)定理定理1 1:设设X X1 1,X,X2 2, ,X Xn n是来自是来自
12、正态总体正态总体N(N(2 2) )的样本,的样本,则有则有定理定理2 2:设设X X1 1,X,X2 2, ,X Xn n是来自是来自非正态总体非正态总体N(N(2 2) )的样本,的样本,但样本容量但样本容量n n充分大充分大(n30)n30),则近似有,则近似有 样本均值的抽样分布(二)样本均值的抽样分布(二)定理定理3 3:设设X X1 1,X,X2 2, ,X Xn n是来自是来自正态总体正态总体N(N(2 2) )的样本的样本(或是来自(或是来自非正态总体非正态总体的样本,但样本容量的样本,但样本容量n30n30) ),则有则有定理定理4 4:设设X X1 1,X,X2 2, ,X
13、 Xn n是来自是来自正态总体正态总体N(N(2 2) )的样本,的样本,则有则有 样本均值的抽样分布(三)样本均值的抽样分布(三)定理定理5 5:设设X X1 1,X,X2 2, ,X Xn n是来自是来自某一总体某一总体X X的样本,且总体的样本,且总体X X的均值为的均值为,方差为,方差为2 2,则有,则有样本均值的抽样分布与总体分布的关系:样本均值的抽样分布与总体分布的关系:l样本均值的期望值总体均值样本均值的期望值总体均值l样本均值的方差总体方差样本均值的方差总体方差/nl样本均值的标准差样本均值的标准差=总体标准差总体标准差/ 样本比例的抽样分布样本比例的抽样分布定理定理6 6:设
14、设X X1 1,X,X2 2, ,X Xn n是来自是来自二项分布总体二项分布总体B(nB(n, ,) )的样的样本,但样本容量本,但样本容量n n充分大(充分大(np5np5,n(1-p)5n(1-p)5),则有),则有定理定理7 7:设设X X1 1,X,X2 2, ,X Xn n是来自是来自二项分布总体二项分布总体B(nB(n, ,) )的样的样本,但样本容量本,但样本容量n n充分大(充分大(np5np5,n(1-p)5n(1-p)5),则有),则有 样本方差的抽样分布样本方差的抽样分布定理定理8 8:设设X X1 1,X,X2 2, ,X Xn n是来自是来自正态总体正态总体N(N(2 2) )的样本,的样本,则有则有ExcelExcel在抽样分布模拟中的应用在抽样分布模拟中的应用l首先利用首先利用ExcelExcel的分析工具库中的的分析工具库中的“随机数发生器随机数发生器”工工具得到总体数据具得到总体数据l然后利用然后利用ExcelExcel的分析工具库中的的分析工具库中的“抽样抽样”工具或工具或“RAND”RAND”函数抽取适当的样本,并计算出样本统计量的函数抽取适当的样本,并计算出样本统计量的值值l最后根据样本统计量的值计算或作图,显示抽样分布的最后根据样本统计量的值计算或作图,显示抽样分布的特征特征返回返回End of Chapter 5