统计数据的收集与整理.ppt

上传人:博****1 文档编号:571517724 上传时间:2024-08-11 格式:PPT 页数:37 大小:1.11MB
返回 下载 相关 举报
统计数据的收集与整理.ppt_第1页
第1页 / 共37页
统计数据的收集与整理.ppt_第2页
第2页 / 共37页
统计数据的收集与整理.ppt_第3页
第3页 / 共37页
统计数据的收集与整理.ppt_第4页
第4页 / 共37页
统计数据的收集与整理.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《统计数据的收集与整理.ppt》由会员分享,可在线阅读,更多相关《统计数据的收集与整理.ppt(37页珍藏版)》请在金锄头文库上搜索。

1、生 物 统 计 学主讲教师:段彦玲第一章 统计数据的收集与整理 1.1 总体与样本 1.2 数据类型及频数(率)分布 1.3 样本的几个特征数第一节第一节 总体与样本总体与样本1.1.1 样本数据的不齐性 遗传因素 环境因素 发育噪声(development noise) 实例:1. 考察我国18岁男青年身高 2. 考察我国新生儿体重 3. 测定某块实验田中稻穗品平均重量 4. 测定某块实验田中某种小麦的百粒重1.1.2 总体与样本l总体总体:l研究对象的全部个体. 无限总体 有限总体 个体个体:构成总体的每个成员l样本样本:从总体中抽出的一部分个 体 l样本含量样本含量:样本中包含的个体数量

2、称为样本含量1.1.3 抽样抽样(sampling)定义:从总体中获得样本的过程。目的:希望通过对样本的研究,推断其总体。抽样方法:随机数字表 放回式抽样放回式抽样: 非放回式抽样非放回式抽样: 样本的含量越大越有代表性1.2数据类型与频数(率)分布1.2.1 数据类型数据类型l连续型数据:为与某种标准相比较所得到的数l据,又称为度量数据。如长度、重量等,若精l确度提高的话,总会出现小数。对连续型数据l进行分析的方法称为变量的方法。l离散型数据:为纪录不同类别个体的数目所得l到的数据,又称为计数数。所得数据均为整数l。对离散型数据进行分析的方法,通常称为属l性的方法。1.2.2 频数(率)表和

3、频数(率)图l离散型数据的整理 l例:调查新生儿体重增长超过3kg的 人数,每次调查10名,共l调查120天。每天的10名新生儿中,增重超过3kg的人数,l可能有11种情况:1名也没有,有1名,有2名,l10名都是,如表1-1的第一列所示,这一组称为组值。连续型数据频数(率)表和频数(率)图。l例:表1-2列出了某农场在做“三尺三”提纯时所调查的100个数据,试做其频数(率)表和频数(率)图l1、从原始数据中找出最大值和最小值,并求出极 差。R=mamx-minx(R=170-141=30)l2、决定划分的组数,分组数是由数据的多少决定 的,美国统计学家斯特吉斯提出分组数公式: n=1+3.3

4、22lgN(式中为样本数)。l 3、根据极差与决定划分的组数、确定组限。l(30/103)l4、在频数表中列出全部组限、组界及中值。l5、将原始数据表中数据,填入频数表中,计算出 每组的频数和频率。总结:编制连续型数据的频数表的步骤总结:编制连续型数据的频数表的步骤l1. 从原始的数据表中找出最大值和最小值,并求出极差l2. 决定划分的组数l3. 根据极差和决定划分的组数,确定组限l4. 在频数表中列出全部组限、组界和种值l5.将原始数据表中数据,用唱票的方式填入频数表中,计算出各组的频数的频率次数分布图柱形图多边形图(包括饼图、曲线图、折线图、直方图等)1.3 样本的几个特整数l1 平均数l

5、2 标准差l3 偏斜度和峭度1 平均数平均数的意义平均数的种类算术平均数的计算方法 算术平均数的重要特性 一、平均数的意义:平均数是数据的代表值,表示资料中观察值的中心位置。 二、平均数的种类算术平均数 为所有测量值之和除以变量值个数(即,样本含量Sample Size)。反映一组呈对称分布的变量值在数量上的平均水平。 中数:又名中位数,是指将所得资料从大到小排序,居中间位置的观察值称为中数,记作Md。 众数 :在一个变数的观察值中,出现资料最多的观察值称为众数。 几何平均数 三、算术平均数的计算方法 直接法 加权法 举例举例1:试计算:试计算1,3,7,9的均数?的均数?例例2:试计算:试计

6、算1,3,3,7,7,9,9,9的均数?的均数?加权法加权法中位数(中位数(median) 是将每个变量值从小到大排列,位置是将每个变量值从小到大排列,位置居于中间的那个变量居于中间的那个变量值值。11个大鼠存活天数:个大鼠存活天数:4,10,7,50,3,15,2,9,13,60,60存活天数存活天数 2, 3, 4, 7, 9, 10, 13, 15, 50,60,60秩次秩次 1 2 3 4 5 6 7 8 9 10 11 中位数的计算中位数的计算公式公式: n为奇数时为奇数时 n为偶数时为偶数时 例例 9名中学生甲型肝炎的潜伏期分别名中学生甲型肝炎的潜伏期分别为为12,13,14, 1

7、4, 15, 15, 15, 17, 19 天,求其天,求其中位数中位数。众数(众数(Mode) 是一群数据中出现次数(频数)最是一群数据中出现次数(频数)最多的值。适用于大样本;较粗糙。多的值。适用于大样本;较粗糙。 例例 有有16例高血压病人的发病年龄例高血压病人的发病年龄(岁岁)为:为:42,45,48,51,52,54,55,55,55,55,55,55 ,61,61,61,61,62,62,65试求众数。试求众数。2 变 异数 变异数:变异数:用来反映平均数代表性的优劣。常用的有极差、方差、标准差和变异系数。 一、极差:极差又称全距。是资料中最大观察值与最小观察值的差数。用“R”来表

8、示。我们举个例子来说明。例如调查两个不同品种的富士苹果的维生素含量,每品种计10个数,经过整理其数字为 品种名称 维生素含量(mg/个) 总和平均甲1314151718181921222318018乙1616171818181819202018018甲乙样本平方和总体平方和二、方差与标准差用观察值数目来除平方和,得到平均平方和,简称均方或方方差差,即离均差的平方和,样本均方用s2来表示,定义为由于方差的单位是原始数据单位的平方,不能直接地指出某个数小x与平均数之间的偏离到什么程度,因此我们采用标准差s作标准衡量x与平均数间的偏离程度。标准差一般记作SD。标准差的计算方法直接法:分四个步骤:先求

9、出 ,再求出各个 和各个 ,求和得 ,即可代入公式求得标准差。矫正数法:矫正数记为C且 所以 矫正数法用的最多,最普遍,一般用 于非频数资料的计算。 1.3.3 偏斜度和峭度l偏斜度:度量数据围绕众数呈不对称的程度。l一般用三阶中心矩m3 lm3=0,说明曲线对称于平均数,此时平均数等于中位数也等于众数。lm3 0,称为正偏,此时众数小于平均数。见图A。lm30,说明曲线过于陡峭; g 200、判断峭度g时,样本含量至少要1000。三、变异系数:反映不同资料的整齐度。比较两个样本,单位不同,均数不同,不能用标准差直接比较。这时可计算样本的标准差对均数的商,称之为变异系数。 变异系数(coefficient of variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。由于变异系数是一个不带单位的纯数,故可用以比较两个事物的变异度大小,例如赞皇大枣果皮厚、角质层厚测量结果赞皇大枣果皮厚、角质层厚测量结果性状CV果皮厚49.64.90.10角质层厚6.20.80.13例例 题题 某罐头厂生产肉类罐头,某日随机抽查了10瓶罐头,测其净重,得结果如下:50,51,49,49,50,51,50,49,49,51。 请写出中数、众数、计算出平均数,标准差、极差和变异系数。练练 习习

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号