第四节 总样本量的确定,(一 )一般公式 (二 )不同应用场合下的公式,一、一般公式,已知nh=nwh,其中wh已经选定,当方差 给定时,得确定总样本量的公式为,若估计精度以误差限形式给出,则,其中d为绝对误差限,r为相对误差限,t为标准正态分布的双侧 分位数二、不同应用场合下的公式,(1)当按比例分配时,wh=Wh,,(2)当按最优分配时,,二、不同应用场合下的公式,(3)当按奈曼分配时,,例1(续3.2节的例1)若要求在95%置信度下,相对误差 不超过10%,则按比例分配和奈曼分配时,总样本量分别为多少?,例1:调查某地区的家庭年收入,以居民户为抽样单元,根据经济及收入水平将居民户划分为2层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:万元):,第五节 分层抽样的效率分析,(一 )分层抽样与简单随机抽样的效率比较 (二 )分层抽样的设计效应 (三 )比率分配与奈曼分配的效率比较,问题:在相同的样本量下,比较其估计量的方差大小?,(一 )分层抽样与简单随机抽样的效率比较,定理1: 令简单随机抽样下总体均值估计量的为 ,比例分配分层随机抽样下总体均值估计量的方差为 , 当Nh(h=1,2,…,L)都较大时,有,注:,(1) 称为层内方差,记为S2内, 称为层间方差,记为S2间,当层内方差小,而层间方差大时,分层抽样会提高估计精度。
2)若条件“Nh(h=1,2,…,L)都较大”不满足时,可能出现,(二 )分层抽样的设计效应,(1)设计效应,定义1: 某抽样方案确定的总体均值估计量的方差与相同样 本量下简单随机抽样下的均值估计量的方差之比, 称为该抽样方案的设计效应,记为Deff2)分层抽样的设计效应,注:当总体方差和层的方差未知时,由相应的样本方差来代替三 )比率分配与奈曼分配的效率比较,定理2: 记奈曼分配下总体均值估计量的方差为 ,则,注:,当各层标准差Sh的差异越大,采用奈曼分配效果越好问题: 如何分层,分多少层,才能使得抽样的效率更高?,第六节 划分层的问题,(一 )层的界限 (二) 层数的确定,(一 )层的界限,1:若分层的目的为了便于组织或估计子总体的参数,则分层按自然或单元的类型来划分常用方法:累积平方根法,2:若分层的目的为了提高抽样效率,则分层的主要原则为:层内方差尽量小,而层间方差尽量大累积平方根法:将分层变量Y(频数)分布的累积平方根进行 等分获得最优分层注:若Y未知,可通过用与Y高度相关的辅助变量X来代替二) 层数的确定,1:一般地,若总样本量为n,则层数不能超过n/2,2:当用辅助变量分层时,层数一般不超过6层。
2 某企业有工人132人,技术人员92人,管理人员27人现欲通过抽样调查去年全年平均每人请假天数,拟采用分层抽样若已知工人请假天数的方差为36,技术人员请假天数的方差为25,管理人员请假天数的方差为9,设样本量为30,(1)试用奈曼分配确定各层的样本量 (2)另当置信度为95%,绝对误差不超过10%,按比例分配层样本量时,总样本量应为多少?,作业:,。