zxy第二章 试验资料的整理与特征数的计算

上传人:我*** 文档编号:136541164 上传时间:2020-06-28 格式:PPT 页数:130 大小:944KB
返回 下载 相关 举报
zxy第二章 试验资料的整理与特征数的计算_第1页
第1页 / 共130页
zxy第二章 试验资料的整理与特征数的计算_第2页
第2页 / 共130页
zxy第二章 试验资料的整理与特征数的计算_第3页
第3页 / 共130页
zxy第二章 试验资料的整理与特征数的计算_第4页
第4页 / 共130页
zxy第二章 试验资料的整理与特征数的计算_第5页
第5页 / 共130页
点击查看更多>>
资源描述

《zxy第二章 试验资料的整理与特征数的计算》由会员分享,可在线阅读,更多相关《zxy第二章 试验资料的整理与特征数的计算(130页珍藏版)》请在金锄头文库上搜索。

1、1,试验资料的整理,特征数的计算,与,第二章,2,本章重点,3,一、试验资料的类型,二、试验资料的搜集,三、试验资料的整理,对试验资料进行分类整理是统计归纳的基础。,4,试验资料类型,数量性状资料,质量性状资料,计数资料非连续变量资料,计量资料连续变量资料,5,数量性状是指能够以计数和测量或度量的方式表示其特征的性状。 数量性状资料的获得方式:计数、测量 数量性状资料:计数资料和计量资料,一) 数量性状资料,6,1、计数资料 用计数方式获得的数量性状资料。 两个相邻整数间无小数, 各观察值 不连续 也称为非连续变量资料 ,离散变量资料。,7,2、计量资料 用测量或度量法获得的, 其数据是用长度

2、、重量、容积温度、浓度等来表示,要带单位。 相邻整数间可以有小数出现,之间的变异是连续性的,也称为连续变量资料。,8,二) 质量性状资料 质量性状: 观察而不能直接测量的。 也称为属性性状资料。 这类性状本身不能直接用数值表示,以下两种方法对其观察结果作数量化处理,9,1、统计次数法 在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白花杂交,F2 中红花、紫花和白花的株数分类统计如下表。,这种由质量性状数量化得来的资料又叫次数资料。,表2-1 豌豆的花色遗传分离情况,10,2、评分法 对某一质量性状分成不同级别,对不同级别进

3、行评分来表示其性状差异的方法。从而将质量性状进行数量化,以便统计分析。 例:药物治疗胃溃疡的动物实验 实验方法 量化指标 结果统计,11,其它: 半定量或等级资料 是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。这类资料既有次数资料的特点,又有程度或量的不同。,12,如粪便潜血试验的阳性反应是在涂有粪便的棉签上加试剂后观察颜色出现的快慢及深浅程度分为六个等级; 又如用某种药物治疗实验动物的某种疾病,疗效分为“无效”、“好转”、 “显效”和“控制”四个级别 ;然后统计各级别的动物数。,13,不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的

4、要求将一种类型资料转化成另一种类型的资料。,14,调 查,试 验,资料搜集的方法,二、试验资料的搜集,15,一)、调查 调查是对已经存在事情的资料按某种方案进行收集。调查又可以分为两种:普查和抽样调查。 1、普查 是对研究对象的全部个体逐一进行调查的方法。普查一般要求在一定的时间或范围进行,要求准确和全面。,16,2、抽样调查 是根据一定原则从研究对象中抽取一部分具有代表性的个体进行调查的方法。 随机抽样必须满足2个条件:一是总体中每个个体被抽中的机会均等;二是总体中任意个体相互独立,是否被抽中不受其他个体的影响。,17,二)、试验 试验是对事物加以处理的方法。 试验设计须遵循的三大原则是:随

5、机、重复和对照。,18,(一)原始资料的检查与核对,调查,试验,原始 数据,核对,检查,订正,检查和核对原始资料的目的:确保原始资料的完整性和正确性。,三、试验资料的整理,19,完整性是指原始资料无遗缺或重复。 正确性是指原始资料的测量和记载无差错或未进行不合理的归并。 检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。 重复、异常或遗漏的资料 -删除或补齐 ; 错误、相互矛盾的资料-更正,复查或重新试验。,20,1. 计数资料的整理,计数资料基本上采用分组法进行整理。,特点:用样本变量自然值进行分组,每组用一个或几个变量值来表示。,试验资料的整理,(三)资料的整理,当观测值n3

6、0时,不必分组,直接进行统计分析。 当观测值n30时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。,1117,来亨鸡每月产蛋数变动范围:,分为7组,统计各组次数,计算频率和累积频率,制表,1 自然值进行分组,最大值17,最小值11。,2 数据主要集中在14,向两侧分布逐渐减少。,24,图2.1 月产蛋数次数分布柱形图,图2.2 月产蛋数频率分布柱形图,条形图(bar chart), 又称柱形图,计数资料,特点: 柱形之间要间隔一定的距离,产蛋数,次数,产蛋数,频率,25,2 饼图(pie chart),图2.6 来亨鸡月产蛋次数分布图,计数

7、资料,质量性状资料,试验资料的整理,26,计量资料一般采用组距式分组法。,全距,组数,组距,组限,归组,制表,试验资料的整理,表2-5 150尾鲢鱼体长(cm),56 49 62 78 41 47 65 45 58 55 59 65 69 62 73 52 52 60 51 62 78 66 45 58 58 60 57 52 51 48 56 46 58 70 72 76 77 56 66 58 58 55 53 50 65 63 57 65 85 59 58 54 62 48 63 46 61 62 57 38 58 52 54 55 66 52 48 56 75 72 57 37 46

8、76 56 63 75 65 48 52 55 54 62 71 48 62 58 46 57 38 54 53 65 42 83 66 48 53 58 46 46 66 58 76 55 60 54 58 49 52 56 82 63 65 54 75 65 86 46 77 70 69 40 56 58 61 54 53 52 43 52 64 58 58 54 78 52 56 61 59 54 59 64 68 51 59 68 63 52 63,28,1、求全距 全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即 R=Max(x)-Min(x) 本例 R=Xma

9、x- Xmin =85-37 =48(cm),试验资料的整理,29,(2) 确定组数,组数是根据样本观测数的多少及组距的大小来确定的,同时考虑到对资料要求的精确度以及进一步计算是否方便。,组数,组距,多,小,统计数精确,计算不方便,少,大,统计数不精确,计算方便,试验资料的整理,30,组数的确定,表2-9 样本容量与分组数的关系,10组,试验资料的整理,31,(3)确定组距 每组最大值与最小值之差称为组距,记为 i。分组时要求各组的组距相等。组距的计算公式为: 组距(i)全距组数 48104.8,5cm,32,(4)确定组限和组中值,组限 是指每个组变量值的起止界限。,上限,下限,组中值 是两

10、个组限的中间值。,试验资料的整理,33,最小值为37.0, 第一组的组中值取37.5,因组距已确定为5.0,所以 第一组的下限为:37.5-(1/2)5.035.0; 第一组的上限也就是第二组的下限为: 35.0+5.0=40.0; 第二组的上限也就是第三组的下限为: 40.0+5.0=45.0, 以此类推,一直到某一组的上限大于资料中的最大值为止。,34,最小一组的下限必须小于资料中的最小值,最大一组的上限必须大于资料中的最大值; 组限可取到10分位或5分位上; 通常将上限略去不写。 临界值就高不就低。,35,40,45,85。,35,(5) 分组,确定好组数和各组上下限后,可按原始资料中各

11、观测值的次序,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。,计数的方法,卡片法,唱票法,画“正”字,组限 组中值 次数 频率 累积频率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0.1667 0.7800 65 67.5 17 0.1133 0.8973 70 72

12、.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000,表2-6 150尾鲢鱼体长的次数分布表,图2.3 鲢鱼体长次数分布图,直方图 (histogram),又称矩形图,计量资料,35 40 45 50 55 60 65 70 75 80 85 90,特点: 各组之间没有距离,38,图2.4 鲢鱼体长次数分布图,35 40 45 50 55 60 65 70 75 80 85 90,试验资料的整理,39,多边形图(polygon),又称折线图(broken-line c

13、hart),计量资料,图2.5 鲢鱼体长次数分布图,40,样本大小(即样本内包含观察值的个数的多少) 极差的大小 便于计算 能反映出资料的真实面貌,在确定组数和组距时应考虑,41,注意,不要重复或遗漏,归组划线后将各组的次数相加,结果应与样本含量相等,如不等,证明归组划线有误,应予纠正。 同一组资料,不同的人编制的频数表,结果不尽相同,允许合理的结果并存。,42,频数分布表和频数分布图的用途,描述分布类型 描述分布的特征 便于发现特大、特小的可疑值 便于计算有关指标、统计分析与处理,表2-7 50株水稻产量(单位:克),186,111,175,131,187,149,181,119,157,1

14、63,205,123,163,152,154,140,142,191,189,131,216,149,100,175,173,145,194,102,156,163,145,175,176,192,168,209,175,125,214,161,131,119,149,205,159,123,126,197,215,177,练习题,44,对于质量性状资料 、 半定量(等级)资料,可按性状或等级进行分组,分别统计各组的次数,然后制成次数分布表。,45,例:药物治疗皮肤病实验 实验方法 实验结果 量化指标 结果统计,46,量化指标,有效,破损区未恢复面积22,无红肿 显效,破损区未恢复面积小于22

15、,无红肿 痊愈,破损区已恢复,新毛长出,无红肿 无效,破损区未恢复面积大于22,红肿,或有脓,47,指标 只数 频率 累积频率 无效 12 0.12 0.12 有效 27 0.27 0.39 显效 39 0.39 0.78 痊愈 22 0.22 1.00,表2-8 对皮肤病的治疗作用,48,(四)统计表和统计图,49,1. 统计表,要求:结构简单,层次分明,安排合理,重点突出,数据准确。,表号 标题,1)、标题 简明扼要、准确地说明表的内容。 2)、标目 标目分横标目和纵标目两项。标目需 注 明计算单位,如、kg、cm等等。 3)、数字 阿拉伯数字,以小数点对齐,小数位数一致。 4)、线条 多用三线表,上下两条边线略粗。,试验资料的整理,50,统计表的种类 统计表可根据纵、横标目是否有分组分为简单表和复合表两类。 简单表 由一组横标目和一组纵标目组成,纵

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号