第1章 统计数据的收集与整理课件

上传人:我*** 文档编号:141167678 上传时间:2020-08-04 格式:PPT 页数:43 大小:564KB
返回 下载 相关 举报
第1章 统计数据的收集与整理课件_第1页
第1页 / 共43页
第1章 统计数据的收集与整理课件_第2页
第2页 / 共43页
第1章 统计数据的收集与整理课件_第3页
第3页 / 共43页
第1章 统计数据的收集与整理课件_第4页
第4页 / 共43页
第1章 统计数据的收集与整理课件_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《第1章 统计数据的收集与整理课件》由会员分享,可在线阅读,更多相关《第1章 统计数据的收集与整理课件(43页珍藏版)》请在金锄头文库上搜索。

1、绪 论,一、生物统计是应用于生物科学的数理统计方法,(1)科学的发展总是从定性研究到定量 (2)研究生物学和数学之间的一门交叉科学 (3)生物统计的基础:概率论和数理统计 (4) 生态数学、数量遗传学、群体遗传学、数量分类方法,二、统计学研究的是随机现象,确定性现象 在一定的条件下必然发生(结果可以预言)。 非确定性现象 又称随机现象 在一定条件下,具有多种可能结果,而究竟出现哪种结果,事先不可断言 在个别试验中呈现出不确定性,但经大量重复试验,又具有统计规律性,三、生物统计的研究内容,1研究简缩数据和描述数据描述统计学 2研究样本和总体的关系 A.从已知的总体研究样本的特性。 b.根据部分样

2、本数据去推断总体。 3研究实验设计。,四、课程安排,学时 51学时作业辅导5学时+计算器使用2学时+统计软件使用3学时。 成绩 理论成绩:70(闭卷50,开卷50) 平时成绩:作业30%。 准备 课代表一人 练习本一本,带统计功能的计算器,五、学习要求,1、掌握数据分析的基本方法 会算 2、理解统计学的基本概念 弄懂 3、提高分析问题和解决问题的能力 灵活应用,包括分析数据的合理性,针对具体研究项目,进行合理的试验设计,六、参考书,1、生物统计 刘来福 北师大出版社 2、现代生物统计 杨纪柯 安徽教育出版社 3、统计学导论 美A.M穆德, 科学出版社 4、田间试验和统计方法 5、生物统计,第1

3、章 统计数据的收集与整理,11 总体与样本,一、总体和样本,总体 指研究对象的全体,可以看成一个集合 每一个研究对象个体,元素 无限总体和有限总体 样本 总体的一部分,即总体的一个子集 样本含量 研究样本的目的上为了推断总体,二、随机抽样,要求总体中的每一个个体被抽到的机会相等 1抽样的方式: 有放回抽样和无放回抽样 样本容量的大小,是统计学研究的课题之一 2抽样的方法: (1) 抽签、抓阄 (2) 计算机,RND( ) (3) 随机数字表,随机数字表 附表11 p224,随机数字表 附表12 p225,三、连续型数据和离散型数据,连续型数据 由称量、度量或测量等计量方法所得到的数据,又称计量

4、数据 离散型数据(间断性数据): 用计数的方法获得的数据。是整数、可数的、又称计数数据。 观察值 每一个个体的某一性状、特征的测定数值,12 频数分布,频数表或频数图,一、离散型数据资料的整理,举例: 每10个新生儿中体重超过3公斤的人数 共调 查120次,每次只调查10人),特点: 根据样本数据的自然值进行分组 如果观察值个数较多,变异幅度较大, 可扩大以几个观察值为一组。,每10名新生儿中体重超过3kg人数的频数(频率)表,二、连续型数据资料和整理,举例:高梁“三尺三”株高测量结果,样本容量100,株高数据,p4。 表1-2,表1-2“三尺三株高测量结果,分组数:10,组下限,组上限,组中

5、值,表1-2“三尺三株高测量结果,二、连续型数据资料和整理,1求极差:又称全距 R = 最大观察值最小观察值 170-14129 2确定组数: 考虑到: (1)观察值的多少 (2)便于计算(整数) (3)能反映出资料的真实面貌 两种确定组数的方法: 经验 公式:G=1.87(N-1)2/5,二、连续型数据资料和整理,3确定组距: 每一组的范围称为组距 分组时要求各组的距离相等 一般以整数作为组距,二、连续型数据资料和整理,4选定组限与组中值 (1)选定第一组的组中值 最好接近于最小观察值,142 组中值最好是整数或与观察值的位数相同。 (2)求第一组的组下限:下限=组中值-1/2组距 (3)求

6、各组的组中值和组限: (组中值)i(组中值)i-1 +组距 (组限)i =(组限)i-1 +组距,二、连续型数据资料和整理,5.唱票 唱票程序 L第一组下限;D组距 Dim Frequency(N) As Integer, Data(nSample) As Single Dim i As Integer, nGroup As Integer For i = 1 To nSample nGroup = Int(Data(i) - L) / D) Frequency (nGroup) = Frequency (nGroup) + 1 Next i,二、连续型数据资料和整理 5.唱票,说明第组的下限

7、等于第组的几种处理方法: (1)组限明确,比原始数据多一位小数, LXH (2)各组的上限是整数时减0.1,一位小数时减0.01 (3)对各组的下(上)限不记载,用一缺横表示 60 70 80 LXH (4)半数法,表1-3 “三尺三株高的频数分布统计,6绘制直方图(histogram),7多边形图(polygon),7多边形图(polygon),三、研究频数分布的意义,1、可以看出数据的集中情况 平均、大部分数据集中在何处、重心所在。 2、可以看出数据的变异情况 是整齐还是分散,这些数据是集中在平均数附近,还是分散在平均数的两侧。 3、可以看出数据的分布是否对称,13平均数和标准差,mean

8、 & standard deviation,一、平均数(average)的意义、种类,1意义 (1)资料中观察值的中心位置 (2)不同资料进行比较 2算术平均数(arithmetic mean) 设x1,x2, x3 ,xn表示样本内的几个观察值,一、平均数(average)的意义、种类,3中位数(median) 有序数列的中点上的数 排序,中间位置所对应的那个数 样本为奇数和偶数的情况 4众数(mode) 具有最高频数的组值或组中值 5几何平均数,二、算术平均数的基本特征和算法,1特征 (1) 每个观察值都对 有贡献1/n (2) (3) (4) 如果 (5) 样本平均数是总体平均数的无偏估

9、计,二、算术平均数的基本特征和算法,2算法 (1)一般算法:根据定义的公式。 (2)频数分组资料 用组中值代表每一组的平均数,三、变异程度的几种度量方法,1、极差 又称全距,记作R 是资料中最大观察值与最小观察值的差数。 R=max(x)min(x) 优点:简单。样本数小于10时常用 缺点:没有充分利用资料,完全受极端值的影响 2平均离差(mean deviation) 平均离差,三、变异程度的几种度量方法,3样本方差(sample variance) 说明: (1)平方的作用:消除负号,加重较大的分量 (2)样本方差是总体方差的无偏估计 (3)除以n-1的问题,三、变异程度的几种度量方法,4样本标准差, 又称标准差(sample standard deviation,s),四、方差、标准差的计算方法,一般情况:用公式 证明,四、方差、标准差的计算方法,频数资料的计算,五、变异系数(coefficient of variability),(1)平均数相差很大,不能比较 (2)单位不同,也不能进行比较,第1章 结束,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号