第二章 统计2.1 随机抽样随机抽样

上传人:ni****g 文档编号:570196012 上传时间:2024-08-02 格式:PPT 页数:31 大小:2.50MB
返回 下载 相关 举报
第二章 统计2.1 随机抽样随机抽样_第1页
第1页 / 共31页
第二章 统计2.1 随机抽样随机抽样_第2页
第2页 / 共31页
第二章 统计2.1 随机抽样随机抽样_第3页
第3页 / 共31页
第二章 统计2.1 随机抽样随机抽样_第4页
第4页 / 共31页
第二章 统计2.1 随机抽样随机抽样_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《第二章 统计2.1 随机抽样随机抽样》由会员分享,可在线阅读,更多相关《第二章 统计2.1 随机抽样随机抽样(31页珍藏版)》请在金锄头文库上搜索。

1、1.我国水土流失面积已经从建国初期的我国水土流失面积已经从建国初期的150万平方公里发展到万平方公里发展到90年代的年代的179万平方公里万平方公里,占国土面积的占国土面积的18.6%中科院的研究数中科院的研究数字表明字表明,进入进入90年代年代,我国土地沙漠化的面积正以每年我国土地沙漠化的面积正以每年2460平方平方公里的速度发展公里的速度发展 2.全国矿山发展直接破坏森林面积大约全国矿山发展直接破坏森林面积大约105万公顷万公顷,破坏草地面破坏草地面积积26万公顷万公顷,占用耕地面积占用耕地面积98万公顷万公顷,而恢复治理率仅为而恢复治理率仅为5% 笑一笑,十年少 一天,爸爸叫儿子去买一盒

2、火柴,临出门前,爸爸嘱一天,爸爸叫儿子去买一盒火柴,临出门前,爸爸嘱咐儿子要买能划燃的火柴,儿子拿着钱出门了,过了好咐儿子要买能划燃的火柴,儿子拿着钱出门了,过了好一会儿,儿子才回到家。一会儿,儿子才回到家。 “火柴能划燃吗?火柴能划燃吗?”爸爸问。爸爸问。 “都能划燃。都能划燃。” “你这么肯定?你这么肯定?” 儿子递过一盒划过的火柴,兴奋地说:儿子递过一盒划过的火柴,兴奋地说:“我每根都试我每根都试过啦。过啦。”问:这则笑话中,儿子采用的是什么调查方式?这问:这则笑话中,儿子采用的是什么调查方式?这其中的全体是什么?这种调查方式好不好?其中的全体是什么?这种调查方式好不好? 普查是通过调查

3、普查是通过调查总体总体来收集数据,调查的结果来收集数据,调查的结果准确准确,但普查往往但普查往往工作量大,难度大工作量大,难度大,而且有些调查对象不,而且有些调查对象不宜使用普查。从节约等方面考虑,一般宜使用普查。从节约等方面考虑,一般从调查的从调查的全体全体对象对象(总体总体)中按照一定的方法中按照一定的方法抽取一部分抽取一部分(样样本本),进行,进行调查或观测,获取数据,并以此对调查对象的某一项调查或观测,获取数据,并以此对调查对象的某一项或多项指标作出推断。这就是抽样调查或多项指标作出推断。这就是抽样调查,抽样调查抽样调查是是通过调查通过调查样本样本来收集数据,抽查的来收集数据,抽查的工

4、作量较小,便于工作量较小,便于进行进行。但样本的抽取是否得当,直接关系到对总体的。但样本的抽取是否得当,直接关系到对总体的估计的准确程度,为了获得较为准确的调查结果抽样估计的准确程度,为了获得较为准确的调查结果抽样时要注意所选取样本的代表性。时要注意所选取样本的代表性。在抽样调查时,什么样的样本才具有在抽样调查时,什么样的样本才具有代表性代表性在抽在抽样时,如果抽样不当,那么调查的结果可能会出现样时,如果抽样不当,那么调查的结果可能会出现与实际情况不符,甚至是与实际情况不符,甚至是错误错误的结果,(课本的结果,(课本p45案案例)导致对决策的例)导致对决策的误导误导在抽样调查时,一定要保在抽样

5、调查时,一定要保证随机性原则,不能只图方便而只抽取证随机性原则,不能只图方便而只抽取“方便样本方便样本”,尽可能地避免人为因素的干扰;并且要保证每个尽可能地避免人为因素的干扰;并且要保证每个个体以一定的概率被抽取到;同时,还要注意到要个体以一定的概率被抽取到;同时,还要注意到要尽可能地控制抽样调查中的尽可能地控制抽样调查中的误差误差。下面我们来研究。下面我们来研究几个常见的抽样方法几个常见的抽样方法 定义定义:设一个总体含有:设一个总体含有N N个个体。从中个个体。从中逐个逐个不放回不放回的抽取的抽取n n个个体作为样本个个体作为样本(n N),(n N),且且每次抽取时各个个体被抽到的概率相

6、等,就每次抽取时各个个体被抽到的概率相等,就称这样的抽样为称这样的抽样为简单随机抽样简单随机抽样(simple (simple random sampling)random sampling)。 ( (一一) )抽签法(抓阄法)抽签法(抓阄法) 抽签法是先对总体抽签法是先对总体N N个抽样单元分别编上个抽样单元分别编上0 0到到N-1N-1的号码,再制作与之相对应的的号码,再制作与之相对应的N N个号码签并个号码签并充分摇充分摇匀匀后,从中随机地抽取后,从中随机地抽取n n个号码签个号码签( (可以是一次抽可以是一次抽取取n n个号码签,也可以一次抽一个号码签,连续抽个号码签,也可以一次抽一个

7、号码签,连续抽n n次次) ),与抽中号码签的号码相同的,与抽中号码签的号码相同的n n个个体即为被个个体即为被抽中的个体,由其组成简单随机样本。抽中的个体,由其组成简单随机样本。二、简单随机抽样的具体实施方法二、简单随机抽样的具体实施方法抽签发大家所熟悉的,如抽签发大家所熟悉的,如摸彩摸彩、摇奖摇奖、摇盘摇盘等,他就是等,他就是把总体中的把总体中的N个个体的代号写在形状、大小相同的签上个个体的代号写在形状、大小相同的签上(签可以是纸条、卡片、小球等),然后将这些签均匀(签可以是纸条、卡片、小球等),然后将这些签均匀的的搅拌搅拌,每次随机的,每次随机的抽取抽取一个,在均匀一个,在均匀搅拌搅拌,

8、在进行下,在进行下一次一次抽取抽取,如此下去,知道抽到预先设定的样本数。根,如此下去,知道抽到预先设定的样本数。根据实际需要,如果抽取后再放回,就称为据实际需要,如果抽取后再放回,就称为有放回抽取有放回抽取,如果每次抽取后不放回,就称如果每次抽取后不放回,就称无放回抽取无放回抽取。利用转盘产生随机数是比较简单的,就是将转盘分成利用转盘产生随机数是比较简单的,就是将转盘分成N等份分等份分别标上别标上0,1,N-1,转动转盘指针指向的数字是几。我们就选几,转动转盘指针指向的数字是几。我们就选几号样品。号样品。利用摸球产生随机数也是一样的,就是将利用摸球产生随机数也是一样的,就是将N个形状、大小、质

9、个形状、大小、质地完全一样的球,分别标上地完全一样的球,分别标上0,1,N-1,放入一个不透明的容,放入一个不透明的容器中进行摸球,摸到几号球,就抽取相应标号的个体,然后放器中进行摸球,摸到几号球,就抽取相应标号的个体,然后放回,再进行下一次抽取。回,再进行下一次抽取。(1)给调查对象中的每个个体)给调查对象中的每个个体编号编号;(2)准备抽签的工具,实施)准备抽签的工具,实施“抽签抽签”;(3)对样本中的每一个个体进行)对样本中的每一个个体进行测量测量或或调查调查抽签的方法一般只用在总体容量抽签的方法一般只用在总体容量比较小时,对于总体容量较大时,比较小时,对于总体容量较大时,往往操作起来比

10、较麻烦往往操作起来比较麻烦为尽快让学生适应社会,某大学有为尽快让学生适应社会,某大学有5万多人,学校决定每年随机抽取万多人,学校决定每年随机抽取50名大学生参加名大学生参加“三下乡三下乡”活动,活动,这个总体容量大,不适合抽签法,这个总体容量大,不适合抽签法,我们采用随机数法比较方便。我们采用随机数法比较方便。把总体中的把总体中的N个个体一次个个体一次编编上上0,1,N-1的的号号码,然后利用码,然后利用工具工具(转盘、摸球、(转盘、摸球、随机数表、科学计算器、计算机)随机数表、科学计算器、计算机)产生产生随机数随机数,产生的随机数是几,我们就选,产生的随机数是几,我们就选几号个体,知道抽满规

11、定的样本数。几号个体,知道抽满规定的样本数。我们来看一个具体的例子我们来看一个具体的例子例例1总体由总体由80个个体组成,利用随机数表随机的选取个个体组成,利用随机数表随机的选取10个样本个样本二二.因为它是一个两位数的总体,因此我因为它是一个两位数的总体,因此我们选两列组成两位数。如们选两列组成两位数。如8,9两列两列一一.给总体中的每个个体编号:给总体中的每个个体编号:0 1 2 3 79三三.从随机表中任取一行开始选数:如第从随机表中任取一行开始选数:如第10行行他们从上到下分别是:他们从上到下分别是:83 55 46 72 56 08 97 31 53 21 62 49 35 29 7

12、7 四四.排除比编号还大的数,重复的号,只算一排除比编号还大的数,重复的号,只算一次,因此次,因此83 97不能选,这样选取的不能选,这样选取的10个样个样本的编号分别为:本的编号分别为:55 46 72 56 08 31 53 21 62 49然后对这然后对这10个样本进行调查个样本进行调查1.简单随机抽随机抽样对总体体不加任何限制不加任何限制,等概率地,等概率地从从总体中直接抽取体中直接抽取样本,是本,是最最简单、最、最单纯的的抽抽样技技术,它具有,它具有计算算简便便的的优点,是研究其点,是研究其它复它复杂抽抽样技技术的基的基础,也是比,也是比较各种抽各种抽样技技术之之间估估计效率的效率的

13、标准,同准,同时,从理,从理论上上讲简单随机抽随机抽样在各种抽在各种抽样技技术中是中是贯彻随机原随机原则最好的一种,并且数学性最好的一种,并且数学性质很很简单,是等概率,是等概率抽抽样的特殊的特殊类型。型。三、简单随机抽样的方法评估三、简单随机抽样的方法评估2.2.因因为是是等概率等概率抽取抽取样本,所以要求本,所以要求总体在所研究的体在所研究的主要主要标志上志上同同质性或性或齐性性( (共性共性) )较好好,也即,也即总体要比体要比较均匀;要求均匀;要求样本容量要比本容量要比较大,以保大,以保证样本本对总体体具有充分的代表性。但是,在社会具有充分的代表性。但是,在社会经济现象中,象中,这种种

14、均匀均匀总体是很少体是很少见的。因此,的。因此,实际工作中很少工作中很少单纯使使用用简单随机抽随机抽样方法。方法。3.3.直接从直接从总体中抽取体中抽取样本,未能充分本,未能充分利用关于利用关于总体的各种其它已知信息,体的各种其它已知信息,以有效地提高以有效地提高样本的代表性,并本的代表性,并进而而提高抽提高抽样的估的估计效率。效率。4.4.简单随机抽随机抽样要求在抽要求在抽样前前编制出制出样本,并本,并对每一个每一个总体抽体抽样个体个体进行行编号,而且当号,而且当总体抽体抽样单元的分布比元的分布比较分散分散时,样本也可能会比本也可能会比较分散,分散,这些都会些都会给简单随机抽随机抽样方法的运

15、用方法的运用造成造成许多的不便,甚至在某些情况下多的不便,甚至在某些情况下无法使用无法使用例例2.2.为了解参加某种知识竞赛的为了解参加某种知识竞赛的10001000名学生的名学生的成绩,打算抽取容量为成绩,打算抽取容量为5050的一个样本进行了解。的一个样本进行了解。过程如下:过程如下:(1 1)随机将这)随机将这10001000名学生编号为名学生编号为0 0,1 1,2 2,3 3,999999;(2 2)将总体按编号顺序平均分成)将总体按编号顺序平均分成5050部分,每部分包含部分,每部分包含2020个个体;个个体;(3 3)在第一部分的个体编号)在第一部分的个体编号0 0,2 2,19

16、19中,利用简单随中,利用简单随机抽样抽取一个号码,比如机抽样抽取一个号码,比如1313;(4 4)以)以1313为起始号,每间隔为起始号,每间隔2020抽取一个号码,这样就得抽取一个号码,这样就得到一个容量为到一个容量为5050的样本:的样本:1313,3333,5353,973973,993993。 这样我们就得到一个容量为这样我们就得到一个容量为50的样本,这种抽样方法是的样本,这种抽样方法是一种一种系统抽样系统抽样(systematic sampling) 将总体分成均衡的几个部分,然后按照将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,预先定出的规则,从每一

17、部分抽取一个个体,得到所需要的样本,这种抽样叫做得到所需要的样本,这种抽样叫做系统抽样系统抽样(也称为机械抽样)。(也称为机械抽样)。 系统抽样的步骤:系统抽样的步骤:采用随机的方式将总体中的个体编号。为简便起见,有采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等道上各户的门牌号,等等 ;在第一段用简单随机抽样确定起始的个体编号在第一段用简单随机抽样确定起始的个体编号l l;按照事先确定的规则抽取样本(通常是将按照事先确定的规则抽取样本(通常是将l l加上间隔加上间隔k k

18、,得到第得到第2 2个编号个编号l l+k+k, ,第第3 3个编号个编号l l+2k+2k,这样继续下去,直到,这样继续下去,直到获取整个样本)。获取整个样本)。 整个的编号分段(即分成几个部分),要确定分段的间整个的编号分段(即分成几个部分),要确定分段的间隔隔k k。当。当 (N N为总体中的个体的个数,为总体中的个体的个数,n n为样本容量)是为样本容量)是整数时,整数时,k= k= ;当;当 不是整数时,通过从总体中剔除一不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数些个体使剩下的总体中个体的个数N N,能被能被n n整除,这时整除,这时k= k= ;问题一问题一 系统

19、抽样中,每个个体被抽中的概率是否一样?系统抽样中,每个个体被抽中的概率是否一样?答:在上面的抽样中,由于在第一部分(编号为答:在上面的抽样中,由于在第一部分(编号为1 12020)中的起始号码是随机确定的,每个号码被抽取的概率都中的起始号码是随机确定的,每个号码被抽取的概率都等于等于 ,所以在抽取第,所以在抽取第1 1部分的个体前,其他各部分中部分的个体前,其他各部分中每个号码被抽取的概率也都是每个号码被抽取的概率也都是 。就是说,在这个系统。就是说,在这个系统抽样中,每个个体被抽取的概率都是抽样中,每个个体被抽取的概率都是 。讨论:若学生数变为讨论:若学生数变为10031003人,在上述整个

20、抽样过程中人,在上述整个抽样过程中每个个体被抽取的概率是否相等?每个个体被抽取的概率是否相等? 1 1、总体中的每个个体被剔除的概率是相等的、总体中的每个个体被剔除的概率是相等的 ,2 2、也就是每个个体不被剔除的概率相等、也就是每个个体不被剔除的概率相等 ;3 3、采用系统抽样时每个个体被抽取的概率都是、采用系统抽样时每个个体被抽取的概率都是 ;4 4、在整个抽样过程中每个个体被抽取的概率仍、在整个抽样过程中每个个体被抽取的概率仍相等,都是相等,都是 。问题问题3 3 一个单位的职工一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535到到4949

21、岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容单位职工与身体状况有关的某项指标,要从中抽取一个容量为量为100100的样本。由于职工年龄与这项指标有关,试问:的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在应用什么方法抽取?能在500500人中任意取人中任意取100100个吗?能将个吗?能将100100个份额均分到这三部分中吗?个份额均分到这三部分中吗? 分析:考察对象的特点是由具有明显差异的几部分组成。分析:考察对象的特点是由具有明显差异的几部分组成。当已知总体由差异明显的

22、几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”(stratified sampling),其中所分成的各部分叫做“层”。问题问题一个单位的职工一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个单位职工人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为与身体状况有关的某项指标,要从中抽取一个容量为100100的样的样本。由于职工年龄与这项指标有关,试问:

23、应用什么方法抽取本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在?能在500500人中任意取人中任意取100100个吗?能将个吗?能将100100个份额均分到这三部个份额均分到这三部分中吗?分中吗? 解:(1)确定样本容量与总体的个体数之比100:500=1:5。(3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56。19人,然后合在一起,就是所抽取的样本。(2)利用抽样比确定各年龄段应抽取的个体数,依次为,即25,56,19。(2 2)分层抽样是建立在简单随机抽样或系统抽样)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此的基础上的,

24、由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。它获取的样本更具代表性,在实用中更为广泛。(1 1)分层抽样是等概率抽样,它也是公平的。用)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为分层抽样从个体为N N的总体中抽取一个容量为的总体中抽取一个容量为n n的的样本时,在整个抽样过程中每个个体被抽到的概样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于率相等,都等于 。类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围简单随机简单随机抽样抽样抽样过程中抽样过程中每个个体被每个个体被抽取的概率抽取的概率相等相等从总体中逐个抽从总体中逐个抽取

25、取总体中个数较总体中个数较少少系统抽样系统抽样按总体分成及部按总体分成及部分,按事先的规分,按事先的规则在个部分抽取则在个部分抽取起始部分才用起始部分才用随机抽取随机抽取总体个数较多总体个数较多分层抽样分层抽样将总体分成几层,将总体分成几层,分成进行随机抽分成进行随机抽取取各层抽取时,各层抽取时,采用简单随机采用简单随机抽取抽取总体有明显的总体有明显的层次差异层次差异20052005年年9 9月月1 1日起,教育部新颁布的日起,教育部新颁布的普通高等学校管理规定普通高等学校管理规定正式正式实施,它将取代沿用了实施,它将取代沿用了1515年的旧年的旧规定规定。新规定删。新规定删除了原规定中除了原规定中“在校期间擅自结婚而未办理退学手续在校期间擅自结婚而未办理退学手续的学生,作退学处理的学生,作退学处理”的内容,对学生能否结婚不再的内容,对学生能否结婚不再作特殊规定,大学生可以自由婚恋。针对人们不同的作特殊规定,大学生可以自由婚恋。针对人们不同的看法,请你设计一个调查方案,并与同学交流看法,请你设计一个调查方案,并与同学交流

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号