科学研究报告中收集数据的方法

上传人:人*** 文档编号:488472243 上传时间:2023-07-25 格式:DOC 页数:16 大小:174KB
返回 下载 相关 举报
科学研究报告中收集数据的方法_第1页
第1页 / 共16页
科学研究报告中收集数据的方法_第2页
第2页 / 共16页
科学研究报告中收集数据的方法_第3页
第3页 / 共16页
科学研究报告中收集数据的方法_第4页
第4页 / 共16页
科学研究报告中收集数据的方法_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《科学研究报告中收集数据的方法》由会员分享,可在线阅读,更多相关《科学研究报告中收集数据的方法(16页珍藏版)》请在金锄头文库上搜索。

1、-科学研究中收集数据的方法师大学 新平一、引言科学研究离不开两种分析1理论分析定理、命题等2实证分析利用获取的资料、数据进展分析以对理论上获得的结论进展实际验证。数据分为离散型数据和连续型数据。离散型数据一般指取整数值的数量指标,这类数据是计数性的,数据之间不能再划分为更小的单位,如学校的个数,学生的人数等,有些指标是按属性来分的,例如学生能力,可分为优、良、中、差,但我们可以使其量化,用5代表优,4代表良,3代表中,2代表差,这样的数据仍然是离散型的。连续型数据一般指经过度量和测定而得到的数量指标,这类数据可以连续变化,可以无限细分,取值可以充满一个区间。例如,学生的考试分数,儿童的体重,测

2、量的误差,平均气温,降雨量,候车时间等,这类数据常以小数形式出现,也可以整数出现,但可以小数化,如90分记为90.0分。科学研究中的数量化分析其主要工具是数学,而数据分析的工具主要是统计学。数学的产生有点哲学味,不是一种静止的东西,而是人类创造力的活动,毕达哥拉斯把世界和数字联系起来万物皆数1是最神圣的数,天下一切源于1。中国古代一生二,二生三,三生万物。统计与数字相关,应用广泛源于十七世纪,日本,预测统计学与生活息息相关。如医学与统计学统计解决相关性,不解决因果性,如:流行病原因是什么有人利用数据结论是:心肌堵塞与持续高温有关70年代。又如鸡叫天亮,但天亮的原因不是鸡叫,移项产生了代数,丈量

3、土地产生了几何,赌博产生了概率1664年pemore,打赌问题预测产生了统计,数学与日常生活相关,投资,炒股,领带打法30种,甚至足球点球大战。英国有人用数据统计起动右脚向左扑旧金山大学人力动力学高麦加里博士分析19821998年,数据,英格兰点球大战惜败阿阿根廷原因。给出一个数学模型其中:为最可进球机率:已往进球情况:此前进球可能性:相反顺序:压力说明罚点球时先让5人中成绩最差者上,1998年如让林汉姆上第二轮则英格兰可能胜。结论:守门员扑球要点有4个因素,罚者眼睛;助跑速度;站立姿势;最重要的是用哪只脚罚。又如教育投入产出何时入学最好?有人统计过,平均6.5岁。综上:统计是一门艺术不是音乐

4、、美术、舞蹈而是一门数据的艺术和科学。统计分为:1. 描述性统计; 2.推断性统计由局部整体样本总体坐井观天可信性多大?概率是根底为什么要抽样?原因样本的代表性?推断的准确性?什么是概率?美国:可能性,天气预报,降水概率日本最先开场。二、获取数据的根本方法1统计调查收集现象数字资料的过程按围有全面调查普查,报表,非全面调查重点,典型,抽样。按方式有直接观察,采访问卷,报告上报制定调查表,确定目的,对象,工程和指标。2抽样调查抽样方式:有放回抽样从总体中抽出一个个体记下其特征后再放回总体,然后进展第二次抽样无放回抽样 从总体中抽出一个个体后不再放回去,再抽第二次当总体个体数目较多时,这两种抽样方

5、式没有本质区别。教育统计中一般采用无放回抽样,但由于有放回抽样能简化*些计算,故当总体个体数目较多时,我们可以看做是有放回抽样。通过抽样获取数据离不开的科学态度和认真的工作作风,数据如果不准确、不完整、或有遗漏,不仅数据本身失去价值,而且以此进展分析推断还会导致错误的结论。简单随机抽样1随机数表法随机数表是根据数理统计的原理,由许多随机数字排列起来的数字表,表中数字的构造方法是:利用计算机使0,1,,9十个数字中每次自动出现一个,用这种方式得到一串数,编排成组(一般四个数为一组)2抽签法抽签法是将所有个体编号打乱次序用类似于抽签的方法从中来获取随机样本分层抽样 分层抽样是按一定标志把总体的每个

6、个体划分为假设干层,使相互差异小的个体集中在一层,从而可以缩小各层个体之间的差异程度,使样本中各个个体在总体中散布更均匀。分层抽样时,从各层抽取的样本个数可以与各层个体数成比例。具体做法是:把总体中N个个体划分为L个不相重叠的局部,使每一局部包含的个体数分别为N1,NL,且N=N1+N2+NL则第h层所含的样本个体数为,其中n为样本容量,为第h层的层权数。 例如,要从*校210名7至9岁儿童中抽出三分之一进展智力测验。该校7岁儿童有63人,8岁儿童有112人,9岁儿童有35人,现在用分层抽样法确定各年龄组儿童入数。由()式得(7岁组)=(210/3)(63/210)=21(人),(8岁组)=(

7、210/3)(112/210)=37(人),(9岁组)=(210/3)(35/210)=12(人)。等距抽样法:把所有个体按顺序排列起来,然后以确定的相等距离抽取随机样本整群抽样整群抽样是将总体各单位划分成假设干群,然后以群为单位从其中随机抽取一些群,对中选群的所有单位进展全面调查的抽样组织形式。整群抽样和类型抽样比照,虽然两者都需要将总体划分许多组,但划组的作用却很不同,类型抽样划分的组称为类,它的作用是缩小总体,使总体的变异减少,而抽取的根本单位仍是总体单位;整群抽样划分的组成为群,它的作用却是要扩大单位,抽取的根本单位不再是总体单位而是群,这样抽样的工作要简便多了。例如要抽查家庭副业开展

8、情况,不是直接抽农户,而是以村为单位,抽选假设干村,然后对这些村的全体农户进展调查。又如按片抽查林业资源、按日期抽检假设干天的产品质量等等。整群抽样也常按地理区域划群,称为区域抽样。设总的全部单位划分为R群,每群所包含的单位数为M。现在从总体R群中随机抽取r群组成样本,并且对中选的r 群的所有M单位进展调查,样本的第i群第j单位的标志值为,第i群的样本平均数为:则样本平均数为:从上式中不难看出,整群抽样实质上是以群代替总体单位,以群平均数代替总体单位标志之后的简单随机抽样。整体抽样的优点是组织工作比拟方便,确定一群就可以抽出许多单位进展观察。但是,正因为以群为单位进展抽选,抽选单位比拟集中,显

9、著地影响了在全体中各单位分配的均匀性。因此,整群抽样和其他抽样方法比拟,在抽样单位数一样的条件下,抽样误差较大,代表性较低。在统计工作实践中,采用整群抽样时,一般都要比其他抽样方式抽选更多的单位,借以降低抽样误差,提高抽样结果的准确程度。阶段抽样当总体很大时,抽样调查直接抽选总体单位,技术上有很大困难,可以用多阶段的抽样方法。例如我国农产量抽样调查,第一阶段是从省抽县,第二阶段再从中选的县抽村,第三阶段再从中选的村抽地块。最后再从地块抽具体的样本点,并以样本点测框的实际资料来推算平均亩产和总产。又如我国职工家计调查,第一阶段先抽选调查城市,第二阶段从中选城市的各部门中抽调查单位,第三阶段再从调

10、查单位中抽选职工,确定具体的调查户,调查每月实际的生活费收支情况。这种分阶段进展的抽样调查方式称为阶段抽样。以两阶段抽样而论,首先将总体划分为R组,而每组包含Mi个单位。第一步从R组中随机抽取r组,第二步又从中选的r组中分别随机抽取mi个单位,构成一个样本,这种抽样就是两阶抽样。其中总体单位数N=M1+M2+MR,各组的单位数Mi可以是相等的。也可以是不等的。样本单位数n=m1+m2+mr。各组抽取的样本单位可以是相等,也可是不等的。为了简化起见,假定R组中各组的单位数相等,都为M,则有N=RM。而且从各组抽取的单位数也相等,都为m,则有n=rm。两阶抽样和类型抽样、整群抽样同样都需要先对总体

11、加以分组,然后再抽取单位,但它们之间却有明显的差异。类型抽样是从全部的分组中每组各抽取局部单位,它和两阶抽样的区别在于第一阶段取了全部的组,而两阶抽样在第一阶段只是随机地抽取局部的组。整群抽样是从全部的分组中随机抽取局部的组,然后对中选组的全部单位进展调查。它和两阶抽样的区别在于第二阶段抽取了中选组的全部的单位,而两阶抽样在第二阶段只是在中选组中随机地抽取局部单位。所以两阶抽样在组织技术上是整群抽样和类型抽样的综合。列表比拟如下:初阶组二阶单位类型抽样从全部抽局部整群抽样从局部抽全部阶段抽样从局部抽局部例1随机样本的产生抽签法提供了一种产生真正的随机样本的方法。例如从652人的总体中,需选出两

12、个样本I和II,每个样本有16个成员。取652纸条,其中的16,每标上I;另16,每标上II;其余620纸条为空白。现在让652人抽签,即得到所谓样本。利用随机数表,可以比拟简单地完成这类任务。随机数表中的数记录了5位数字组。假设需要16个小于653的随机数,我们可以胡乱地选择表中的一点作为志点,然后从左到右地每三个数字组为一组,依次记录小于653的三位数。假设起点是倒数第6行中第3列的第一个数字,那末我们所找的16个数将是178,317,607,436,147,601,578等。从一个有N个个体组成的总体中,选择n个个体的一个样本,可按以下步骤进展:1对总体的N个个体指定1到N的整数。如果N

13、=600,对每个个体从001到600编号,每个个体用一个三位数表示。2从表中选出任一数字作为始点,如果总体是三位数,那末将三个数字组为一组,读出以后的数字如果总体是一个z位数,那末将z个数字组成一组。3如果从表中读出的数小于或等于N,有那个标号的个体就在n个个体组成的随机样本中,如果读出的数大于N,或者对应的个体已经在样本中,那末就不再考虑这个数。如此重复,直至选出随机样本的n个个体。这里给出两个利用随机数字表得到随机样本的进一步例子。A我们要求分别有概率0.60, 0.20, 0.16, 0.04的A,B,C,D类型的样本,概率和为1。把二个相继数字作为100个两位数00,01,99。每个数

14、有出现概率,利用下面的对应关系。随 机 数0059607980959699类 型ABCD例如从表得到的随机数字为14,93,03,65,我们获得样本A,C,A,B,。n医生对2n个病人设计的新疗法与标准的或旧疗法的比拟,将病人分成n对,每对由两个病人组成,他们有相似的病情,在每个比拟对中的一个病人用新疗法,另一个用旧疗法。按照随机挑选的随机数字,如果为0,1,2,3,4,在第一行的病人I用新疗法,否则II中的病人用新疗法,现在随机数字为6,2,9,所以在前三对病人中,用新疗法。编号成比照拟者随机数字新疗法III0,1,2,3,4,5,6,7,8,9病 人 I病 人 II1王编 号1232新疗法3汪旧疗法王汪三、抽样估计误差及样本单位数确实定1有关概念1总体:研究对象的全体,用*表示总体期望值总体方差为标准差的含义?常见总体:正态总体,数据呈现中间高、两头低、对称2样本:研究对象的一局部,用表示n:样本容量,n50称为大样本*1*n样本观测值:样本均值s2:样本方差 S23统计量(不含未知参数的样本函数)定理:,称为标准误差,记为4大数定律5抽样估计点估计 用作为的估计区间估计 :置信水平记称为抽样极限误差:为置信系数t:称为概率度临界值由正态分布表可查出:利用可以确定样本单位n。2样本单位数n确实定以简单随机抽样为例重复抽样下 不重复抽样下 我们

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号