最新十五章节抽样调查ppt课件

上传人:s9****2 文档编号:573304176 上传时间:2024-08-14 格式:PPT 页数:87 大小:866KB
返回 下载 相关 举报
最新十五章节抽样调查ppt课件_第1页
第1页 / 共87页
最新十五章节抽样调查ppt课件_第2页
第2页 / 共87页
最新十五章节抽样调查ppt课件_第3页
第3页 / 共87页
最新十五章节抽样调查ppt课件_第4页
第4页 / 共87页
最新十五章节抽样调查ppt课件_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《最新十五章节抽样调查ppt课件》由会员分享,可在线阅读,更多相关《最新十五章节抽样调查ppt课件(87页珍藏版)》请在金锄头文库上搜索。

1、十五章节抽样调查十五章节抽样调查第一节 抽样调查方案n一、抽样单位n二、抽样方法n三、样本容量n四、确定抽样方案的一些因素三、样本容量n样本容量(或样本含量sample size):指样本所包括的抽样单位数。样本容量的大小与所获抽样调查结果的准确度和精确度密切有关。 四、确定抽样方案的一些因素n设计抽样方案时须考虑以下几方面:n(1) 所要求的准确度与精确度,要求高时样本容量应大。 n(2) 是否需估计置信限或作统计推论,一般随机抽样有合理的试验误差估计,可以做统计推论。而其他抽样方法往往缺乏合理的误差估计,统计分析有局限性。 n(3) 与人力、物力、时间等条件相适应,抽样单位大、样本容量大、

2、进行总体编号等都是较费事的,必须权衡需要与可能,在保证一定精确性的情况下,尽量减低消耗。n(4) 注意到调查研究对象的特点。 第二节 常用抽样方法的统计分析n一、简单顺序抽样及简单典型抽样法n二、简单随机抽样法n三、分层随机抽样法n四、整群抽样法n五、分级随机抽样法n六、双重随机抽样法n七、序贯抽样法一、简单顺序抽样及简单典型抽样法n简单顺序抽样(simple systematic sampling):通常只计算平均数作为总体的估计值。n计算平均数的公式为: n例15.1设成熟期对水稻汕优2号大田测产,该田块约5亩,生长较均匀。采用棋盘式抽样,10个点,每点由12行间距计算平均行距。其中任选二

3、行测查2m长度内的穴数及有效穗数。再在其中拔连续5穴,将稻穗分成大、中、小三级,按比例选取20穗,结合考查其他性状计数每穗总粒数及空瘪粒数,从而算出结实粒数。每点其余稻穗脱粒,称取千粒重。将10点数据汇总后求得每亩平均穴数4.2万,每穴平均n有效穗数9.2个,每穗平均结实粒数53.7粒,平均千粒重25.2克。计算平均数的公式为。本例中土地利用系数定为98%,则估计每亩产量为: =513.75(kg/亩) n简单典型抽样法的分析同样只计算 。二、简单随机抽样法n简单随机抽样(simple random sampling):每个抽样单位具有相同概率被抽入样本。总体编号方法及随机抽取方法依调查对象而

4、定。n例15.2 设在一休闲地上调查小地蚕虫口密度每测框为1m2,随机取30点,调查结果列在表15.1。 表15.1 30个单位的小地蚕幼虫头数 每m2内幼虫头数(y )0123456789101112单位数(个)123844222100130 fy02624162012141690012131 fy20212726410072981288100144773(头/)(头/)(头/) n即该田块小地蚕幼虫约为3.385.34(头/),折合每亩2253.43560.2头,这个估计的可靠性为95%。n以上将所调查研究的总体看为面积甚大的一个无限总体进行分析,设若该30个单位从336的一块田中抽出,这

5、时调查研究的总体实为一有限总体,有限总体的两个参数为:n平均数 (151) (头/)n标准差nN 为总体内单位数,即总体容量。n样本估计值仍为及,但估计抽样误差时应考虑到抽样分数的影响。 (153)(152)n本例中 (头/)n该有限总体平均数的95%置信限为: (头/)即3.425.30(头/),折合每亩2280.03533.4头。三、分层随机抽样法n分层随机抽样法(stratifiedrandomsampling):从各个层次或段落分别进行随机抽样或顺序抽样。n分层随机抽样有三个步骤:n(1)将所调查的总体按变异情况分为相对同质的若干部分、地段等称为区层,各区层可以相等,也可以不等。 n(

6、2)独立地从每一区层按所定样本容量进行随机抽样。各区层所抽单位数可以相同,也可以不同。 n抽样单位总数在各区层的分配有:n 比例配置法:指各区层大小不同时按区层在总体中的比例确定抽样单位数,若各区层大小相同,比例配置结果实际即为相等配置;n 最优配置法:指根据各区层的大小、变异程度以及抽取一个单位的费用综合权衡,确定出抽样误差小、费用低的配置方案。 n(3)根据各区层的估计值,采用加权法估计总体参数。n总平均数 : (154) n 总标准误: n若各区层总体方差相同,则 (15)(156)n若各区层抽样单位数按区层比例配置,则 (157)n其中 (158)四、整群抽样法n整群随机抽样法( ra

7、ndomgroupsampling):被抽取的整群中各抽样单位都进行调查,按群计算平均数及标准差,并估计其置信限。 n例15.4 设某农场调查水稻螟害发生情况,在全场100个条田中随机抽取9条做调查,每田块采用平行线式取10点,每点连续查20穴,经初步整理后将结果列于15.2。 某农场螟害率抽样调查结果田块123456789调查茎秆数198020622154251223152098242118672248螟害茎秆数178211335345212238460119298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25n这资料以条田为抽样单位进行分析。n

8、全场100条田平均螟害率95%的可能在9.0114.91%范围内。n本例的总体实际上是一个N =100的有限总体,故更确切地应为:即9.1514.77(%)间。n此外,本例是百分数资料,如果田块间的差异不大,可以采用百分数资料的分析方法,即由总调查茎秆数和总螟害茎秆数求出总螟害率 ,得 n这样, 即11.6912.59(%)。这个区间比前面所估小得多,这是因为前面以田块为抽样单位,而不是以n茎秆为单位,除了有茎秆受害与否的随机误差外,还包含有田块间的差异,所以此处不宜采用百分数的误差估计方法。五、分级随机抽样法n巢式随机抽样法(nested random sampling):最简单的是二级随机

9、抽样。例如全区的棉花结铃数,可以在区内随机抽取几个乡,乡内随机抽取若干户进行调查。这时,乡为初级抽样单位,户为次级抽样单位。又例如研究农药在叶面上的残留量,第一步随机抽取单株,第二步在单株上随机抽取叶片,分别作为初级和次数抽样单位。表15.3 某农药残留量分析结果及其方差分析 植株各叶片内的残留量(单位数)合计平均13.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30变异来源自由度均方所估计的方差分量F植株间3 MSB=0.2961*44.9

10、F0.05(3,12)=3.49株内叶片间12 MSA=0.0066n巢式随机抽样数据可以应用方差分析法算出各阶段的抽样误差,从而估计平均数的标准误。二级抽样的公式如下: (1513)n其中,k=初级抽样单位数,n =次级抽样单位数。 (1514) n、分别为次级和初级抽样误差的估计值。 n二级抽样的数据按单向分组的组次数相等(也可能不相等)的随机模型进行方差分析。例题中k=4,n=4,方差分析结果F =0.2961/0.0066=44.9,说明植株间的误差显著大于株内叶片间的误差。n这二个阶段的抽样误差是不同的,应该分别估计。但此处若将kn=44=16张叶片直接计算其方差则为0.0645。比

11、扣除株间误差后剩余的株内叶片间误差0.0066大得多。n例15.5 表15.3数据的分析结果:(单位) (单位)2 (单位) (单位) 此处DF=3,因由均方MSB计算。 若只从1个初级单位估计置信限,如以株为单位作估 计,则: (单位)2 (单位) (单位)由一株四张叶片估计,比四株16张叶片估计,误差 要大得多。若每株只取一张叶片,四株共取4张叶片,则(单位) 所以,同样测定4张叶片,从1株上取与从4株上取, 抽样误差是不同的,今后对此材料抽样测定时,应多取植株,每株上可以少取一些叶片。n三级抽样时的情况为:n 、 、 依次为三级、二级及一级抽样单位的抽样误差,分别抽取n、k、l个不同级别

12、的抽样单位,则所获样本平均数的抽样误差为 n获得后,其总体平均数的置信区间的计算方法与前相同。(1515)六、双重随机抽样法n双重抽样法(double sampling):亦称相关抽样法。若所要调查的性状y是不易观察测定,甚至对观察材料要破坏后方能测定的,而试验又不容许将材料破坏,这时可以利用和所要调查的性状有密切相关关系的另一便于测定的性状x进行间接的抽样调查,按确定的相关关系从x的调查结果推算y 的结果。 n1.做一次随机抽样,调查y 和x两种性状,从中求出y 依x 的回归方程。这个样本容量 n 不一定很大,但希望x 和y 有较大的幅度。 n2.对总体进行x的抽样调查,设样本容量为m,按以

13、上建立的回归关系从 推算n的标准误的近似式:(1516) n采用双重抽样法,必须注意 y 和 x 两性状间不但要有显著相关,而且须有高程度显著相关,才能获得比较准确的结果,所以在建立回归方程时要检验其相关系数的大小及显著性。七、序贯抽样法n序贯抽样法( sequentialsampling):根据逐个抽样单位调查累积的信息,在抽样过程中当机确定样本容量。 n序贯抽样法的基本步骤:n(1)确定作为“推断”所依据的两个标准,P0与P1,此处P0=0.50(即50%)、P1=0.75(即75%)分别代表不符控制要求(必须治虫)及符合控制要求(不必打药)的两个界限。n(2)确定“推断”的可靠程度的两个

14、概率标准与,表示总体百分数PP0而误以为PP1的n险, 表示总体PP1而误以为PP0的风险。n(3) 估计总体分布类型,计算出两条平行的控制线。当总体为二项式分布时。两条控制线为下式:(1517) n (4) 将(1517)的计算结果画成序贯抽样控制图。横坐标为m ,纵坐标为h 。n (5) 进行实际抽样调查,将逐个抽样单位测定的累计数 m 及 h (完好穗数)在坐标图上标记。n (6) 有时总体 P 可能在 P0 与 P1 之间,需预先计算一个推断所需最大样本容量 E(m)。 n当总体属二项式分布时: n例15.7 设按上述方法对玉米完好穗率进行调查,以确定是否需要继续用药。此时确定P0=0

15、.50,即完好穗率低于50%一定要防治;P1=0.75,即完好穗高于75%不再防治。 =0.10,即应该防治而误以为不需防治的风险允许为0.10; =0.10,即不需防治(1518)n而误以为要防治的风险允许为0.10;玉米完好穗率总体分布估计为二项式分布。n 由(1517)计得ha 和hr 的截距及斜率分别为: ha截距 hr截距 斜率 因而两条控制线为: 由(1518)得: n说明推断所需最大样本容量为测定18株。n将计算结果画成图15.2中两条回归线。n经田间逐穗实际测查结果列于表15.4。 图15.2 玉米完好穗率序贯抽样控制图n测查至m =18时,h = 9,超出界外,抽样停止,因h

16、ha(ha=-2.00+0.63118=9.36),故推论为总体完好穗率在50%以下,所以需要防治。n本例恰好抽样至E(m)=18时才作出推断,这是因为总体完好穗率与“推断”所依据的两个标准P0,P1很相近,如果相差较大,则测查穗数m小于18,便能作出推断。累计测查穗数(m)12 3 456789101112131415161718累计完好穗数(h)01 2 234556667778899表15.4 玉米完好穗数序贯抽样结果n设若将 及 均定为0.05,P0 及P1不变,则: ha=-2.68+0.631m hr=2.68+0.631m E(m)=30.85n两条平行线的间距增宽了,推断所需最

17、大样本容量也增加了。n又设若将 、 均定为0.05,P0=0.50,P1=0.60,则n ha = -7.26+0.550m n hr =7.26+0.550mn E(m)=213.08n两条平行线的间距更宽了,推断所需最大样本容量也更大了。n这里说明序贯抽样法中有效确定 、 、P0、P1值对提高工作效率是很重要的。这需要依据专业知识确定。n上例因估计总体是二项式分布。如果总体不是二项式分布而属泊松( Poisson)分布则:(1519)n(1519)中ln为自然对数的符号,与为“推断”所依据的两个标准。例如每公斤种子含某种杂草种子在一粒以下便调进,若在三粒以上便拒绝,这时因每公斤种子中含某种

18、杂草种子数是泊松分布, =1, =3。设若 =0.1, =0.1,则: ha截距 hr截距 斜率 n“推断”所需平均样本容量,bb0及bb1时不同。 (1520) 此处 :n说明平均抽取2个抽样单位即可获得推断。若实践中抽样至31.95=6个抽样单位尚无结果,则可停止抽样。计取这6个抽样单位的平均数 ,若 偏向 则推断为可调进,若 偏向b,则推断为拒绝调进。 图15.3 杂草种子容量序贯抽样控制图第三节 样本容量的估计n一、简单一级抽样样本容量的估计n二、分层抽样样本容量的估计n三、二级或多级抽样样本容量的估计n四、抽样单位大小与样本容量的相互决定一、简单一级抽样样本容量的估计n简单一级抽样主

19、要指简单随机抽样。在估计其样本容量时,首先要对调查对象的标准差做出估计,并提出预定准确度和置信系数的要求,然后据此以确定样本容量。 n因为 n其中n 为待定的样本容量。 n经变项,n得:(1521)n (1521)中代表预定的准确度要求,即指要求所得的样本平均数与总体平均数相差不超过给定的量。若s估计值来自大样本,则95% 置信系数下t2,n所以,(1522)n有时没有大样本的s值可借用,这时可通过平均全距(或平均极差)估计s值, n式中 为k个容量为n的小样本极差的平均值,c为折算系数(表15.6),t 由(表15.6)中的自由度估计值( )及置信系数决定。 (1524)(1523)n若总体

20、属有限性时,估计的抽样误差应按(153)用抽样分数作矫正,因而(1521)将变为:n变项合并后: (1525) n如果N 很大时,可计算其近似值 ,即(1521):n 如n0/N 比数不大,可采用n0为近似值,否则须计算值: n抽样单位数( )是随变异程度(s2)和置信概率( )两者的增加而增加,同时随容许误差(d )数值的减少(1526)而增加的。n二、分层抽样样本容量的估计n 1比例配置法 若各区层比例为 ,则当总样本容量为 时,各区层样本容量可按 进行分配,因此只要估计出 ,便可确定各区层的 。 n 因为 ,则 。 n若令,则称V为一定置信系数下的样本必需方差。n得比例配置法的分层抽样样

21、本容量的近似公式为:(1527)(1528) n若抽样分数极小,则 。n 2最优配置法 其基本出发点是区层大、误差大的应安排较多抽样单位,区层小、误差小的可少安排抽样单位。nNeyman证实若按区层大小与区层标准差乘积分配抽样单位可使样本平均数具有最小方差,因而称之为最优配置。 n各区层抽样单位数: (1529)n最优配置法分层抽样样本容量估计的近似公式为: (1530)(1531)n抽样分数极小时, 。 三、二级或多级抽样样本容量的估计n设第二级和第一级抽样误差的估计值为 及 ,待定的抽样方案中第一级样本容量为 ,第二级样本容量为 ,则所待抽取的样本平均数标准误将为: (1532) n所以,

22、 (1533) (1534)n在能假定较大时,可用作近似估计。否则需用假定自由度下的 t 值。n设抽取第一级单位(植株)的费用为CB,抽取第二级单位(叶片)的费用为CA,则抽取单位的费用为: n (1535) n 若将(1532)与(1535)相乘,则: (1536)n当 最小时,其微分: n得: n此时 为最佳第二级抽样单位数。n3级抽样时,可根据3级抽样试验进行3级巢式数据方差分析,从而估计出一、二、三3级抽样误差为、,(1537)(1538)n通过 ,推导出 、 、 间的关系式。n若 (1539)n求 为最小值时的解: (1540) (1541) 求出 及 后,再代入 中解出 。四、抽样

23、单位大小与样本容量的相互决定 n一些抽样方案中抽样单位是定性的,例如种子含油量的测定,另一些抽样方案中,抽样单位是定量的,例如测定田间穗数。抽样方案中便须权衡用大抽样单位少样本容量合适,还是用小抽样单位大样本容量合适,何者精确度高、花费少。这时便须考虑抽样单位大小与样本容量的相互决定问题。 例15.14 研究田间麦穗数抽样调查中抽样单位大小与样本容量的抽样误差,在3块大小相同的田内进行调查,每块田分为16小块,每小块中随机定1样点,每样点调查1m行长,1行的穗数,顺序查平行6行,按次序记录。所获数据共有316=48个样点,486个每m穗数记录。这里将3块田看为3个相等的区层,每区层中样点看作为

24、一级抽样单位,每样点内1行看为1个二级抽样单位,抽样单位大小为1行。n若将相邻2行依次合并,二级抽样单位大小为2行。若将相邻3行分别合并,则二级抽样单位大小为3行。因此同一组数据可以用以估计一级单位的抽样误差,不同大小二级单位的抽样误差,以这些误差估计值为依据,可制订今后麦田穗数调查的抽样方案。变异来源DFSSMSEMS方差估计值田块间3-1=218589.789294.89田块内样点间3(16-1)=45107403.442386.74*样点内二级单位间(1行)316(6-1)=240211374.78880.73316(3-1)=96114597.671193.73*3163(2-1)=1

25、4496777.11672.06316(2-1)=4876014.041583.62*3162(3-1)=192135360.74705.00总3166-1=287337368.00表15.9 麦田穗数抽样方案研究方差分析表n表15.9中,为样点间抽样误差的估计值; 、 、 分别为二级抽样单位是1行、2行、3行的抽样误差估计值。此调查研究为二级抽样,按(1523)及(1535):1行单位时,若2行单位时,若3行单位时,若 则由(1537)得: 1行单位时,2行单位时,3行单位时,n以上假定2行单位及3行单位的化费或工作量分别为1行单位的2倍及3倍。n由以上分析,麦田穗数抽样中,1行单位的抽样误差 为880.73,2行单位的 为260.84,3行单位的 为298.87。抽样单位较大时抽样误差较小,但三者中以2行单位的抽样误差最小。结合抽样单位的花费考虑,在二级抽样单位分别为1、2、3行大小 时其最佳二级抽样单位数分别为 、 、 ,三者公因子为 ,因而可作相互比较。 n相同准确度和精确度要求下最佳第二级1行、2行、3行抽样单位的实际工作量为1.8730.72120.6243=1.8731.4421.8722行单位的工作量最小,因而综合 及 的信息,二级抽样单位以2行为较合适。 结束语结束语谢谢大家聆听!谢谢大家聆听!87

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号