九章资料的统计分析讲课教案

上传人:yuzo****123 文档编号:140485440 上传时间:2020-07-30 格式:PPT 页数:94 大小:995KB
返回 下载 相关 举报
九章资料的统计分析讲课教案_第1页
第1页 / 共94页
九章资料的统计分析讲课教案_第2页
第2页 / 共94页
九章资料的统计分析讲课教案_第3页
第3页 / 共94页
九章资料的统计分析讲课教案_第4页
第4页 / 共94页
九章资料的统计分析讲课教案_第5页
第5页 / 共94页
点击查看更多>>
资源描述

《九章资料的统计分析讲课教案》由会员分享,可在线阅读,更多相关《九章资料的统计分析讲课教案(94页珍藏版)》请在金锄头文库上搜索。

1、第九章 资料的统计分析,在调查结束后,我们必须对收集到的资料进行认真仔细 的整理。而整理的目的是为了分析,没有对资料的分析, 我们就不可能有对研究对象的总体把握,也不可能写出好的 研究报告。 当然,作为社会调查研究对象的社会现象有其质和量两 方面,我们对整理好的资料也必须展开定性和定量两方面的 分析,缺一不可。但是,定性分析是以研究者的理论功底为 基础,主要靠个人的悟性。定量分析就不同了,它是我们每 个人通过学习都可以统一掌握的技术。所以学习社会研究方 法,课堂教学在资料分析方面重点讲得是统计分析,而对定 性分析,本书是以穿插于有关章节的方式并以情境启发的方 式来加以讨论的。,第一节 统计调查

2、资料及其整理,一、统计分组和频数分布 统计整理是与统计分组相 联系的。所谓统计分组,就是 将情况相同或相近的数据资料 加以分门别类的归并,使之简 单明晰,以便为统计分析中提 取各种有用信息打下基础。,经过调查收集上来的资料虽然是大量的,却很可能是杂乱无章的,用它来直接做分析往往有困难。统计整理是对调查数据资料的条理化、系统化和有序化,通过它,社会调查研究才能进入统计分析阶段。,统计分组有两方面的含义,对总体(或样本)而言是“分”,即将总体中各个单位按照它们的差异性(如身高的差异)区分为若干部分;对总体单位而言是“合”,即将相近似的单位组合起来。这样,本来杂乱无章的数据便有序化了。,频数分布是统

3、计分组的结果, 它是指众多的调查数据在各个组 (各类别、各等级或各区间)出 现或发生的次数。频数分布是对 客观事物自然形成的分布状态的 集中反映和描述。,60名男性青年的身高表 (原始资料) 单位:厘米,161 179 173 162 161 169 166 155 177 165 165 171 165 168 176 174 163 173 159 170 170 169 169 170 174 169 171 167 164 169 178 160 168 166 163 158 169 172 178 171 152 176 167 171 161 176 168 181 175 15

4、9 162 165 168 164 179 157 173 166 172 167,现在我们用从某大学大一男同学中抽取出来的60人的身高资料来编制频数分布表,60名男同学身高(以厘米计)的原始资料如右:,将原始资料编排成序列资料,实际上是在进行统计汇总。由于身 高(X)是连续变量,我们如果选4cm为间距,我们可以直接把序列资 料编制成为含有8个组的,频数分布表(频数用f 表示)。如此一来,原 来无序的原始资料就变为现在有序的分组资料。与此同时,学生总体中身高的分布状况也清晰地呈现出来。(注:由于身高是连续变量,汇总时使用了“上组限不包括在内”的处理原则。),某校大一60名男生身高频数分布表,二

5、、频率分布与总体内部结构 分组资料虽然简单明了,但不能直接看出各组人数占这60人的比 重,从而显示出总体内部结构。为了实现这个要求,就要在分组资料 的基础上派生出频率分布表(频率用P表示)。,频率就是各组人数占总体人数的比重,即PfN。比重都小于1,经常用百分数来表达,它反映了对象总体的内部结构。,某校大一60名男生身高频率分布表,累计频数(F),向上累计以变量数 列首组的频数为始点,逐 个累计各组的频数,展示 小于该组上限的频数和。,向下累计以变量数 列末组的频数为始点,逐 个累计各组的频数,展示 大于该组下限的频数和。,以上我们看到了三种形式的资料:原始资料、次序资料和分组资料,这反映了对

6、资料进行整理和简化的顺序。这三种形式是依次逐步简化和条理化的,使人们看起来越来越容易、越来越清楚。,三、图示法 把无序的原始资料整理成频数分布表,是表示统计 资料的一种有效方式,我们可以称为列表法。其实,用 图示法来表示统计资料比列表法更能一目了然。我们可 以根据整理好的频数分布(或频率分布和累积百分数分 布)绘制出相应的统计图。最常用的有直方图、条形 图、折线图、曲线图等。,对于连续变量的分布,可以用矩形图表示。矩形高度表示各组的频数或频率。在等距分组的条件下,很显然,各矩形的面积与其高度成正比。因此,各矩形的面积同样可以用来表示各组的频数和频率,而且更加形象直观(如前图)。,1矩形图,方条

7、图适用于表示离散变量的资料。方条图与矩形图基本相同,其高度表示各组的频数(或频率)。对于定类变量和定序变量的测量,它的宽度是没有意义的,各方条之间要留有一定的距离。,2方条图,3折线图,表示频数(或频率)分布的另一种相似的图形是折线 图。直接把矩形图各矩形顶部的中点用直线连接起来,并 把原来的矩形抹掉,就得到了折线图。,在许多并非十分严格的场合,人们往往乐于把频数分布的矩形图和折线图修匀成平滑曲线,这样看起来更美观。例如,1901年至1985年,全世界已有300多位科学家获得过诺贝尔物理奖、化学奖和生物医学奖。对这些科学家取得成果的年龄进行统计,结果如下表。再以年龄为横坐标,人数为纵坐标,使可

8、制成“获诺贝尔奖的年龄曲线”(见下图9-3)。,4曲线图,第二节 统计分析一:描述统计,所谓描述统计就是讨论 范围仅以搜集资料本身为 限,而不予以扩大。包括推 论统计在内,没有描述统计 作为基础,想要运用好也是 不可能的。描述统计所用数 学较少,实用性又很强,因 此在社会调查研究中使用的 机会很多。,调查数据资料经分类整理后,已经使杂乱无章的原始数据资料成为有系统、有条理的数据资料,这就为统计分析中提取各种有用信息打下了基础。而在社会研究的定量分析中,描述统计是基础。,一、集中趋势统计量 统计分析首先要解决的第一个问题是,要用一统计指标来代表一系列的数据。这个具有代表性的统计指标,能够概括这一

9、系列数据的特征,集中反映这一系列数据的一般水平。,主 要 内 容,算术平均数,中位数,众数,1算术平均数( ) 简单算术平均数(对于未分组资料) 注意:对求和符号,此时流动脚标的变动范围是1, 2, 3, ,N , N是总体单位数。 例 求74、85、69、9l、87、74、69这些数字的 算术平均数。 解 78.4,加权算术平均数(对于分组资料) 注意:对求和符号,此时流动脚标的变动范围是1,2,3 ,n,n是组数,而 不是总体单位数。 很显然,算术平均数不仅受各变量值(X)大小的影响, 而且受各组单位数(频数)的影响。由于对于总体的影响要 由频数( f )大小所决定,所以 f 也被称为权数

10、。值得注 意的是,在统计计算中,权数不仅用来衡量总体中各标志 值在总体中作用,同时反映了指标的结构,所以它有两种 表现形式:绝对数(频数)和相对数(频率)。这样一 来,在统计学中,凡对应于分组资料的计算式,都被称为 加权式。,注意:分组资料有单项式和组距式两种。计算加权 算术平均数,只有对每个变量值可分为一组的离散变量 的分组资料(即单项式分组资料,参见下表)才能得到 精确的结果。 例 求下表(单项数列)所示数据的算术平均数 。,对于组距数列(参见下表) ,要用每一组的组中值 权充该组统一的变量值。 例 求下表(组距数列)所示数据的算术平均数 。,算术平均数的性质,各变量值与算术平均数的离差之

11、和等于0。,各变量值对算术平均数的平方和,小于它们对任 何他数偏差的平方和,算术平均数受抽样变动影响较小。,分组资料如遇有开放组距时,不经特殊处理 不能进行算术平均数的计算。,受极端值影响较大。,2中位数( Md),把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值,即为中位数,用Md表示。 Md可用于定序、定距、定比资料。,对未分组资料,(1)、先把所有数据按大小顺序排列,如果总体单位数为奇数,则取第(N+1)/2 位上的变量值为中位数; (2)、如果总体单位数为偶数。因为居中的数值不存在,按惯例,取第 N/2位和第(N+1)/2 位上的两个变量值的平均作为中位数。,数。,例

12、 求54,65,78,66,43这些数字的中位数。 例 求54,65,78,66,43,38 这些数字的中位数。,你会吗?,例 求72、81、86、69、57这些数字的中位数。 解 先将这几个数字由小到大排序:57、69、72、81、86,然后把居中那个数拿出来,于是 Md72,(1)单项数列,根据N/2在累计频数分布中找到中位数所在组, 该组变量值就是Md 。,中 位 数,对于分组资料,(2)组距数列按中位数所在组的下限:按中位数所在组的上限:,当根据组距数列求中位数时,要采用所谓的比例插值法:先根据N2在累计频数分布中找到中位数所在组,然后假定该组中各变量值是均匀分布的,再用以下任何一种方

13、法求出中位数(注意:此处用的是向上累计)。,例 调查大一男生60人的身高如前表,求他 们身高的中位数。 解 第一种方法 166 4 1685(厘米),请你用第二种方法来做一下,中位数的性质,(1)各变量值对中位数之差的绝对值总和, 小于它们对任何其他数的绝对值总和。 (2)中位数不受极端值的影响。 (3)分组资料有不确定组距时,仍可求得 中位数。 (4)中位数受抽样变动的影响较算术平均 数略大。,3众数(Mo),众数是在一组资料中,出现次数(或频 数)呈现出“峰”值的那些变量值,用Mo表示。 众数只与次数有关,可以用于定类、定序、定距、定比资料。,对于未分组资料 直接观察。首先,将所有数据顺序

14、排列;然后,只要观察到某些变量值(与相邻变量值相比较)出现的次数(或频数)呈现“峰”值,这些变量值就是众数。,对于分组资料 单项式:观察频数分布 (或频率分布 ) 组距式:,Lo为众数组下限; 为众数组频数与前一组频数之差; 为众数组频数与后一组频数之差; ho为众数组组距。,例 就72、81、56、86、81、57这几个数字求众数。 解 按照众数的定义识别,众数是81。,例 调查大一男生60人的身高情况如前表,求他们身 高的众数。 解 因为是组距式分组资料,运用前式计算,为什么众数有时不存在,有时有两个以上?,二、离中趋势统计量,主要内容:(1)全距;(2)异众比率 ;(3)标准差。,所谓离

15、中趋势,是指数列中各变量值 之间的差距和离散程度。离势小,平均数 的代表性高;离势大,平均数代表性低。,例如有A、B、C、D四组学生各5人的成绩如下: A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;平均数不同,离势可能相同。,1. 全距(R) R =Xmax Xmin 例 求74,84,69,91,87,74,69这些数字 的全距。 解 把数字按顺序重新排列:69,69,74, 74,84,87,91,显然有 R =Xmax Xmin 91 6922,全距(R

16、):最大值和最小值之差。也叫极差。全距越大,表示变动越大。,优点: 缺点:,计算简单、 直观。,(1)受极端值影响大; (2) 没有量度中间各个单位间的差异性,数据利用率 低,信息丧失严重; (3)受抽样变动影响大,大样本全距比小样本全距大。,2. 异众比率(VR) 所谓异众比率,是指非众数的频数与总体单位数 的比值,用VR来表示 其中: 为众数的频数; 是总体单位数,异众比率能表明众数所不能代表的那一部分变量值在总体中的比重。,例 调查某小区50户家庭的人口情况如表9.5,求异众比率。 解,3. 标准差(S),在统计分析中,对于定距变量,用标准差来作为离中趋势统计量是最基本的做法。这是指在一组数据中,各数值之间的差

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号