第二讲 描述统计,主讲教师:纪凌开,第一节 常用的统计表与图,在心理科学研究中,一般对获得大量的观测数 据进行统计分析的预处理就是对它们进行统计分 组,制定出简单明了的统计表、统计图⊙统计表:将统计指标与被说明事物之间的 关系以表格的形式表示 ⊙统计图:用点、线、画、面、体、色等形 状描绘统计指标与被说明事物之 间关系 ■评:直观、一目了然,■注:统计表与统计图,一、数据的初步整理,1、数据排序 排序依据是事物本身的性质与研 究的目的.,就是根据被研究对象的特征和统计研究 的目的,将所得数据划分到各类别中去2、统计分组,⑴统计分组前的准备 观察数据的核对与校验-消除记录误差 ◆删除受过失影响的数据(忌主观) ◆统计删除(3个标准差之外的数据),⑵统计分组的准则,①正确性:掌握研究现象的本质,以此为 分类的标志; [例]对人口的进行统计,可以性别、年龄 、民族、文化程度等特征进行归类分 组,若以头发的长短、鼻梁的高低这 些非本质的特征进行分组则失之无聊②准确性 分组标志明确,前后一致,不能重叠, 不能遗漏;,⑶常见的分组类别,①性质分组 ②数量分组,二、统计表 (tabulation),统计表是将要统计分析的事物或指标以 表格的形式列出来,以代替烦琐文字描述 的一种表现形式。
㈠统计表的结构,1、标题 即表的名称,应确切地、简明扼要地 说明表的内容,位置在表格的最上方;,2、表号 表号是表的序号,一般放在标题的前 面;,3、标目 标目是表格中对统计数据分类的项目,相 当于“变量名称”,要有单位;,4、线条 线条不宜过多,有的书籍、杂志还有不能 用竖线或斜线等特殊要求;,5、数字 表内数字必须准确,一律用阿拉伯数 字表示,位次对齐,小数的位数一致, 缺失时用“-”或“---”代替6、表注 表中用“*”标出,再在表的下方注出,它 不是表的必要组成部分统 计 表 示 范,表3 各年龄组在各种条件下的成绩(回答正确人数比例),,自己喜欢别人也喜欢,自己不喜欢别人也不喜欢,自己喜欢别人不喜欢,自己不喜欢别人喜欢,,条 件,3 岁,4 岁,5 岁,0.757(28/37)*,0.757(28/37)*,0.432(16/37)*,0.892(28/37)**,0.914(32/35)**,0.829(29/35)**,0.771(27/35)**,0.886(31/35)**,0.944(34/36)**,0.944(34/36)**,0.806(29/36)**,1.000(36/36)**,,注:每个问题只有两个答案,如果凭猜测回答正确的概率为50%。
*表示与机遇水平50%比较,P0.05,**表示P0.01,案例来源:儿童心理状态推理中的观点偏差 心理学报.2006.3 傅莉 苏彦捷,㈡具体统计表编制,次数分布指一批数据中各个不同数值 所出现的次数情况,或者是指一批数据 在量尺上各等距区组内所出现的次数的 情况将次数分布情况以表形式表示, 则称次数分布表以图形的形式表示, 则称次数分布图1、次数分布表,一个次数分布表,次数分布图——多边图,⑴简单次数分布表(simple frequency table),①内涵 即依据观察数据中每一个分数取 值的出现次数或总计数资料编制成 的统计表②例子,在一项关于大学生抑郁倾向自我评定的 大型调查中,研究者编制抑郁量表对武汉地 区10所高校进行调查,每个接受调查大学生 的抑郁倾向结果以5点量表进行刻划(5分表 示非常严重、4分表示严重、3分表示中等水 平、2分表示偶尔有点抑郁、1分表示一点都 不抑郁)最后的调查结果如下:,表2-1 武汉地区10所高校名大学生抑郁情况调查表,,抑郁状况自我评定结果 人数,,5 65 4 775 3 1467 2 890 1 150,,,总计 3247,⑵分组次数分布表(grouped frequency table),①内涵 当观察数据是连续型数据且数据量很大 时,事先对所有的数据划分若干区间,然 后根据其数值大小划归到相应的组别内, 分别统计各个组别中包括的数据个数,再 以列表的形式呈现出来,就构成了分组次 数分布表。
i、求全距R (range) R = max-min,ii、决定组数K与组距I(数据呈正态时),② 编制步骤,■分组的标准,其一、一般而言,组数的多少根据数据量 的多少而定,否则,次数分布表的 功能不能发挥; ◆分组数目多,则要求总的数据量 大; ◆若总的数据量比较少,则分组数 应少一些;,其二、数据呈正态分布,则用公式 计算比较精确; 其三、分组数目或组距的稍稍变化对次数 分布的显示和计算影响不大; (有关研究表明任一组观察数据被分10-15组, 次数分布的信自息就保存下来了),③顺序列出分组区间,i、分组区间 即一个分组的起点值和终点值之间的 距离,起点值称组下限,终点值称组上 限数学形式如下:,ii、组限表示法(表述组限与精确组限),★精确组限 ★表述组限 精确组限见于分组次数分布表的表述 形式 ■两者关系 精确组限是分组区间的真正界点,而 表述组限则是精确组限的表现形式,常 用四舍五入原则( 即在精确位以下取一 半),并以连续的上开下闭区间表示 两者实际表示同样的分组区间[例]表述组限与精确组限,◆分组时,最高组应包含观察数据最大 值,最低组包含观察数据最小值; ◆最低组的下限或最高组的上限之差是I 的整数倍;,iii、注意事项,◆在编制表格时,各分组区间一般在纵坐 标按顺序排列,数值大的分组区间呈现 在上面,数值小的分组区间排在下面; ◆在呈现表格时,一般用表述组限。
但在 数据归类划分时应按精确组限分到相应 组别中;,④求各分组区间组中值,组中值=(组实上限+组实下限)/2,⑤归类划记、登记次数 “正”或“ ”,,,,,,⑥ 计算次数,编制表格,随机地从某省参加高考的考生中抽取100名, 登记其数学成 绩如下: 70.6 77.5 82.0 90.5 81.0 85.5 71.0 80.0 92.5 77.0 88.0 81.0 76.5 67.0 83.0 84.0 84.0 62.0 79.0 72.0 89.0 78.0 78.0 80.0 78.5 76.5 75.0 79.5 66.5 81.5 75.0 84.0 90.0 80.0 86.0 84.5 68.5 71.0 86.0 81.5 79.5 80.5 73.0 93.0 83.0 72.0 68.0 71.0 87.0 78.0 66.0 83.0 87.0 82.5 79.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 75.5 89.0 87.5 69.0 74.0 70.0 77.5 75.0 79.0 79.0 80.5 74.5 77.0 82.5 72.5 73.5 73.5 76.0 88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.0 94.0 79.0 80.0 75.5 83.5 82.0 65.0 74.5 80.0 70.5,2、分组次数分布表编制例子 (连续型变量),第二步:确定组数K、组距I,编制过程:,,第一步:确定最大、最小值,求全距R R=98.0-62.0=36;,组距I=R/K=3,第三步:列分组区间 因为最小值为62,组距为3,所以最 低组的下限取为60,这样最低组既包括 最小值62,又是3的倍数。
于是分组区 间则 取为[59.5,62.5),……,[95.5,98.5),第四步:登记与计算次数,见下表:,100名高考考生数学成绩统计结果,?为什么导致正式表格是13组分组区间其一、编制次数分布表和绘制次数分布图 可以将一堆杂乱无章的数据排列成 序,简洁地反映数据的整体概貌, 平均水平,离散情况 其二、次数分布表在实际应用上具有较大 的价值(如年龄断层问题),■ 评价,其三、对原始数据进行次数分组之后,原始 数据就不见了,若只保留了次数分布 丢失了原始数据,用这种分组数据继 续进行运算会带来一些运算上的误差3、相对次数分布表、累加次数分布表,自 学,■注:累加次数分布表有两种 ◆向上累加次数分布表 ◆向下累加次数分布表,4、双列次数分布表,⑴ 定义 也称相关次数分布表,是对有联系的 两列变量用同一表表示其次数分布 ⑵心理学中常见的两相关变量 ①同一组被试中每个被试的两种心理指标; ②配对样本的同一测量指标;(孪生子等),■样例 表1-2 31名被试的视听反应时(毫秒),,被试 听 视,被试 听 视,被试 听 视,1 2 3 4 5 6 7 8 9 10 11,174.1 177.5 136.4 167.4 118.3 116.7 178.1 130.9 186.3 199.1 135.2 198.3 203.0 225.0 229.0 212.0 163.0 180.0 146.5 171.0 144.5 144.0,12 13 14 15 16 17 18 19 20 21 22,128.0 138.0 168.0 191.0 143.0 171.5 154.5 147.0 171.0 172.0 205.5 195.5 161.1 190.0 179.6 206.7 140.1 153.2 195.6 217.0 181.3 179.2,23 24 25 26 27 28 29 30 31,211.5 242.2 141.9 212.8 130.6 171.0 150.0 241.0 140.0 176.1 166.8 165.4 164.5 201.0 133.4 145.5 147.0 163.0,,⑶双列次数分布表的编制,①依照前面编制分组次数分布表的方法, 分别确定各变量的分组区间; ②将一变量的分组区间竖列,另一变量分 组区间横排; ③逐一将每对观察数据归类到相应的表格 中,划记记录次数,编制成表;,■样例编制 表1-3 31名被试视、听双列次数分布表,,,,,听,视,100~ 120 ~ 140 ~ 160 ~ 180 ~ 200~ 220 Yf,230~ 210 ~ 190 ~ 170 ~ 150 ~ 130~ 110 ~,,,Xf,,1 5 9 8 4 3 1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,2 4 7 8 4 5 1,5、其他常用统计表,⑴ 简单表,表2-8 某运动队队员几项心理指标测试平均结果,,指标名称 人数 闪光融合( Hz) 错觉量( mm) 反应时( ns ),,数值 25 37.5 2.8 178.6,,■只罗列出名称、地点时序或统计指标 名称,⑵分组表(one-way table),■特征: 只有一个分类标志,表2-9 不同年龄组脑电平均频率分布,,年龄组 0~1月 1月~1岁 1岁~ 3岁~ 7岁~ 12岁~ 20岁~ 60岁~,,平均频率 2.0 4.0 6.4 8.5 8.5 10.4 10.4 10.0,,⑶复合表,■特征: 分类标志两个或两个以上,表2-10 不同年级控制组与实验组的学习成绩,,年级,组别,,成 绩 人 数,优 良 中 差,,二 四。