心理与教育统计学03讲述

上传人:最**** 文档编号:117190919 上传时间:2019-11-18 格式:PPT 页数:53 大小:391KB
返回 下载 相关 举报
心理与教育统计学03讲述_第1页
第1页 / 共53页
心理与教育统计学03讲述_第2页
第2页 / 共53页
心理与教育统计学03讲述_第3页
第3页 / 共53页
心理与教育统计学03讲述_第4页
第4页 / 共53页
心理与教育统计学03讲述_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《心理与教育统计学03讲述》由会员分享,可在线阅读,更多相关《心理与教育统计学03讲述(53页珍藏版)》请在金锄头文库上搜索。

1、 恬静的统计学家改变了我们的 世界;不是通过发现新的事实 或者开发新技术,而是通过改 变我们的推理、实验和观点的 形成方式 Ian Hacking 1 集中趋势集中趋势 ( (位置位置) ) 离中趋势离中趋势 ( (分散程度分散程度) ) 偏态和峰度偏态和峰度 (形状)(形状) 第三章 集中 量 2 数据分布的特征和测度 数据的特征和测度数据的特征和测度 分布的形状集中趋势离散程度 众众 数数 中位数中位数 均均 值值 平均差平均差 方差和标准差方差和标准差 峰峰 度度 百分位差百分位差 四分位数四分位数 偏偏 态态 3 集中趋势的测度 3.1 算术平均数( 等距数据和比率数据) 3.2 中位

2、数和百分位数( 顺序数据) 3.3 众数(等距数据和比率数据) 3.4 其他度量 4 集中趋势 (Central tendency) 1. 1. 一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度 2. 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 3. 不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值 4. 4. 低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层次反过来,高层次数据的集中

3、趋势测度值并不适用于低层次 的测量数据的测量数据 5. 5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定的数据的类型来确定 5 3.1 算术平均数 6 一、算术平均数的概念 算术平均数是所有观察值的总和除以 总频数所得之商,简称为平均数或均 数。 7 均 值 (概念要点) 1. 集中趋势的测度值之一 2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于称名数据和顺 序数据 8 1、观察值的总和等于算术平均数的N倍 2、各观察值与算术平均数之差的总和等 于零。 3、若

4、一组观察值是由两部分(或几部分 )组成,这组观察值的算术平均数可以由 组成部分的算术平均数而求得。 9 二、均值的计算方法 1 1、设一组数据为、设一组数据为:X X1 1 , ,X X2 2 , , ,X X N N 简单均值简单均值的计算公式为的计算公式为 2 2、设分组后的数据为:、设分组后的数据为:X X1 1 , ,X X2 2 , , ,X XK K 相应的频数为:相应的频数为: F F1 1 , , F F 2 2 , ,F FK K 加权均值加权均值的计算公式为的计算公式为 10 简单均值 (算例) 原始数据: 10591368 11 加权均值(算例) 表3-8 某车间车间 5

5、0名工人日加工零件均值计值计 算表 按零件数分组组组组中值值(Xi)频频数(Fi)XiFi 105110 110115 115120 120125 125130 130135 135140 107.5 112.5 117.5 122.5 127.5 132.5 137.5 3 5 8 14 10 6 4 322.5 562.5 940.0 1715.0 1275.0 795.0 550.0 合计计506160.0 【例例3.83.8】根据表中的数据,计算根据表中的数据,计算50 50 名工人日加工零件数的均值名工人日加工零件数的均值 12 13 均 值 (数学性质) 1.各变量值与均值的离差之

6、和等于零 2. 2. 各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小 14 均 值 (数学性质) 3. 每一个数加一个常数 C,所得均值等于原均值加上 常数 C 4. 4. 每一个数乘以一个常数每一个数乘以一个常数 C C,所得均值等于原均值乘 ,所得均值等于原均值乘 以常数以常数 C C 15 均值的特点与应用 优点:反应灵敏;计算简单、严密确定;适合 进一步代数运算;受抽样变动的影响较小。 缺点:易受极端数据的影响;出现模糊不清得 数据时,无法计算。 应用:数据同质性原则; 一组数据中每个数据 都比较准确、可靠;无极端值的影响;而且还 要通过它计算其他统计量。 16 3.2

7、中位数和百分位数 1717 一、中位数的概念: 中位数是位于依一定大小顺序排列的 一组数据中央位置的数值,大于及小 于这一数值各有一半数据分布着。 1818 中位数 median (概念要点) 1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值,记为 Md MdMd 50%50%50%50% 3.3. 不受极端值的影响不受极端值的影响 4.4. 主要用于顺序数据,也可用数值型数据,但不能用于称主要用于顺序数据,也可用数值型数据,但不能用于称 名数据名数据 5.5. 各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即 19 1、原始数据的计算方法 20 顺序

8、数据的中位数 (算例) 【例例3.43.4】根据中数据,计算甲城市家根据中数据,计算甲城市家 庭对住房满意状况评价的中位数。庭对住房满意状况评价的中位数。 解:解:中位数的位置为:中位数的位置为: 300/2300/2150150 从累计频数看,中位数从累计频数看,中位数 的在的在“ “一般一般” ”这一组别中这一组别中 。因此。因此 MdMd一般一般 表3-4 甲城市家庭对对住房状况评评价的频频数分布 回答类别类别 甲城市 户户数 (户户)累计频计频 数 非常不满满意 不满满意 一般 满满意 非常满满意 24 108 93 45 30 24 132 225 270 300 合计计300 21

9、 数值型未分组数据的中位数 (5个数据的算例) 原始数据: 24 22 21 26 20 排 序: 20 21 22 24 26 位 置: 1 2 3 4 5 中位数中位数 2222 22 数值型未分组数据的中位数 (6个数据的算例) 原始数据: 10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6 位置位置 N+N+1 1 2 2 6+16+1 2 2 3.53.5 中位数中位数 8 + 98 + 9 2 2 8.58.5 23 根据位置公式确定中位数所在的组 采用下列近似公式计算: 3 3 . . 该公式假定中位数组的频数在该组内均匀分布该公式

10、假定中位数组的频数在该组内均匀分布 数值型分组数据的中位数 (要点及计算公式) 24 数值型分组数据的中位数 (算例) 表3-5 某车间车间 50名工人日加工零件数分组组表 按零件数分组组频频数(人)累积频积频 数 105110 110115 115120 120125 125130 130135 135140 3 5 8 14 10 6 4 3 8 16 30 40 46 50 合计计50 【例例3.53.5】 根据表根据表3-53-5 中的数据中的数据 ,计算,计算50 50 名工人日名工人日 加工零件加工零件 数的中位数的中位 数数 25 三、百分位数的概念及其计算方法 1、百分位数的概

11、念 百分位数是位于依一定顺序排列的一组数 据中某一百分位置的数值。 在教育测量中,常通过计算某个原始分数 所属的百分位数来说明、解释、评价它在 团体中的位置。 2、百分位数的计算方法 26 中位数的特点与应用 优点:简单、容易理解,稳健。 缺点:不稳定、受抽样影响大;计算时不 用所有数据;计算时要对数据先排序;总 数乘以众数不等于数据的总和;不能作进 一步代数运算。 应用:一般用在下列情形:当数据有极端 值;两端数据或个别数据不清楚;需要快 速估计一组数据的代表值。 27 3.3 众数(mode) 28 一、众数的概念要点 集中趋势的测度值之一 出现次数最多的变量值,用 M0 表示 不受极端值

12、的影响 可能没有众数或有几个众数 有理论众数与粗略众数 29 众数的不唯一性 无众数 原始数据: 10 5 9 12 6 8 一个众数一个众数 原始数据原始数据: : 6 6 5 5 9 8 9 8 5 55 5 多于一个众数多于一个众数 原始数据原始数据: : 25 25 28 2828 28 36 36 42 4242 42 30 二、众数的计算方法 1、用观察法直接寻找粗略众数 例如,一组原始数据2、4、3、6、4、5、4 31 称名数据的众数 (算例) 表3-1 某城市居民关注广告类类型的频频数分布 广告类类型人数(人)比例频频率(%) 商品广告 服务务广告 金融广告 房地产产广告 招

13、生招聘广告 其他广告 112 51 9 16 10 2 0.560 0.255 0.045 0.080 0.050 0.010 56.0 25.5 4.5 8.0 5.0 1.0 合计计2001100 【例例3.13.1】根据下表根据下表数据,计算众数数据,计算众数 解解:这里的变量为这里的变量为“ “广告类广告类 型型” ”,这是个定类变量,不,这是个定类变量,不 同类型的广告就是变量值。同类型的广告就是变量值。 我们看到,在所调查的我们看到,在所调查的200200 人当中,关注商品广告的人人当中,关注商品广告的人 数最多,为数最多,为112112人,占总被人,占总被 调查人数的调查人数的5

14、6%56%,因此众数,因此众数 为为“ “商品广告商品广告” ”这一类别,即这一类别,即 MM o o 商品广告商品广告 32 顺序数据的众数 (算例) 【例例3.23.2】根据下表根据下表数据,计算众数数据,计算众数 解:解:这里的数据为顺这里的数据为顺 序数据。变量为序数据。变量为“ “回回 答类别答类别” ”。甲城市中。甲城市中 对住房表示不满意的对住房表示不满意的 户数最多,为户数最多,为108108户户 ,因此众数为,因此众数为“ “不满不满 意意” ”这一类别,即这一类别,即 MM o o 不满意不满意 表3-2 甲城市家庭对对住房状况评评价的频频数分布 回答类别类别 甲城市 户户

15、数 (户户)百分比 (%) 非常不满满意 不满满意 一般 满满意 非常满满意 24 108 93 45 30 8 36 31 15 10 合计计300100.0 33 2、用公式求理论众数的近似值: (1)皮尔逊的经验法: 频数分布呈正态或接近正态时才能使用。 34 金氏插补法 1. 众数的值与相邻两组频数的分布有关 4.4. 该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布 2. 2. 相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值 即为众数即为众数 MM o o 3. 3. 相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下 列近似公式计算列近似公式计算 MM o o MM o o 35 数值型分组数据的众数 (算例) 表3-3 某车间车间 50名工人日加工零件数分组组表 按零件数分组组频频数(人)累积频积频 数 105110 110115 115120 120125 125130 130135 135140 3 5 8 14 10 6 4 3 8 16 30 40 46 50 合计计50 【例例3.33.3】 根据表中根据表中 数据,计数据,计 算算5050名工名工 人

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号