《心理与教育统计学第2章统计图表》由会员分享,可在线阅读,更多相关《心理与教育统计学第2章统计图表(68页珍藏版)》请在金锄头文库上搜索。
1、心理与教育统计学第第2章章 统计图表统计图表2.1 数据的初步整理数据的初步整理2.2 次数分布表次数分布表2.3 次数分布图次数分布图2.4 计算机绘制统计图表计算机绘制统计图表2.1 数据的初步整理数据的初步整理心理和教育研究中收集的各种原始心理和教育研究中收集的各种原始资料杂乱无章,只有经过整理分析资料杂乱无章,只有经过整理分析才能从中提取出有用的信息。才能从中提取出有用的信息。6, 4, 1, 12, 7, 53, 6, 5, 8, 11, 52, 9, 7, 9, 4, 108, 6, 6, 7, 5, 7样本一样本一样本二样本二6, 9, 2, 12, 8, 43, 11, 1,
2、10, 9, 34, 5, 4, 7, 3, 95, 8, 10, 2, 9, 3*123456789 10 11 12*123456789 10 11 12样本一样本一样本二样本二2.1.1 审核审核审核是对原始数据进行初步审核是对原始数据进行初步审查审查与与核实核实不符合要求的数据主要有三种:不符合要求的数据主要有三种:缺缺失失、可疑可疑、失误失误。缺失缺失:指数据不全或缺项未填;例如一份:指数据不全或缺项未填;例如一份资料中未回答的问题占资料中未回答的问题占10以上,或者缺少以上,或者缺少关键性资料。关键性资料。 可疑可疑:指难以辨认或怀疑其真实性的数据;:指难以辨认或怀疑其真实性的数据
3、;例如,有的被试填答的问卷全部选同一个选例如,有的被试填答的问卷全部选同一个选项(如全选项(如全选A或全选或全选B);有的被试填答的);有的被试填答的结果可以看到是一种规则的排列方式(如结果可以看到是一种规则的排列方式(如A B C D E D B C A B C D E)。)。失误失误:指存在明确差错的数据或答案。:指存在明确差错的数据或答案。在剔除不合格问卷的过程中,注意在剔除不合格问卷的过程中,注意不能把一些不符合自己主观假设的不能把一些不符合自己主观假设的数据随意去掉。因此这项工作一定数据随意去掉。因此这项工作一定要非常慎重。对于个别极端数据是要非常慎重。对于个别极端数据是否该剔除,应
4、遵循否该剔除,应遵循三个标准差三个标准差法则。法则。 2.1.2 数据排序数据排序数据排序,就是按照某种标准,对数据排序,就是按照某种标准,对收集到的杂乱无章的数据进行排列。收集到的杂乱无章的数据进行排列。年龄、性别等年龄、性别等数值大小升序或降序排列数值大小升序或降序排列数据排序是整理数据最简单的方法数据排序是整理数据最简单的方法2.1.3 统计分组统计分组统计分组,根据被研究对象的特征,将统计分组,根据被研究对象的特征,将所得数据划分到各个组别中去。所得数据划分到各个组别中去。分组要以被试对象的分组要以被试对象的本质特征本质特征为基础。为基础。分类标志分类标志要明确,要能包括所有数据要明确
5、,要能包括所有数据性质类别性质类别:按事物的不同性质进行分类。:按事物的不同性质进行分类。数量类别数量类别:按数值大小进行分类,并排:按数值大小进行分类,并排序。序。2.1.4 统计表统计表 统计表是用来表达研究变量与被说明统计表是用来表达研究变量与被说明的事物之间数量关系的表格。它可以的事物之间数量关系的表格。它可以将大量数据的分类结果清晰、概括、将大量数据的分类结果清晰、概括、一目了然地表达出来,便于分析、比一目了然地表达出来,便于分析、比较和计算。较和计算。 表表2-1 2-1 北京市四街道智力落后患者分布北京市四街道智力落后患者分布街道街道检查人数检查人数病人数病人数患病率患病率()甲
6、甲518411593.1乙乙760302633.5丙丙495081903.8丁丁517881703.3总计总计2291687823.4顶线顶线表线表线表号表号标题标题表注表注资料来源:见资料来源:见心理学报心理学报1979年第年第1期期103页,选部分引用页,选部分引用底线底线数字数字表注表注表目表目统计表的种类统计表的种类简单表简单表:只按研究现象(或变量)的名:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。称、地点、时序等列出数据的统计表。分组表分组表:只按一个标志分组的统计表称:只按一个标志分组的统计表称为分组表。为分组表。复合表复合表:按两个或两个以上标志分组的:按两个或
7、两个以上标志分组的统计表称为复合表。统计表称为复合表。简单表简单表表表2-2 各校学生数一览表各校学生数一览表学校学校校校校校校校校校人数人数9857628931051分组表分组表表表2-3 上海市区男幼儿上海市区男幼儿20米跑步用时米跑步用时年龄组年龄组3岁岁4岁岁5岁岁6岁岁平均用时平均用时(秒秒)7.717.166.045.53资料来源:引自资料来源:引自华东师范大学学报华东师范大学学报,1985年第年第2期第期第30页页复合表复合表表表2-4 不同年不同年级男生和女生的学男生和女生的学习成成绩年年级性性别成成绩(人数)(人数)优良良中中差差一年一年级男生男生22163011女生女生35
8、9269二年二年级男生男生28232516女生女生34171915三年三年级男生男生36192613女生女生263224182.1.5 统计图统计图统计图是整理和呈现数据的另一种方统计图是整理和呈现数据的另一种方法,它把研究变量与被说明事物之间法,它把研究变量与被说明事物之间的数量关系用的数量关系用图形表现图形表现,直观、形象,直观、形象地表达出事物的全貌及其数据的分布地表达出事物的全貌及其数据的分布特征,使人一目了然,便于理解和记特征,使人一目了然,便于理解和记忆,印象深刻。忆,印象深刻。 图图2-1 某年级数学考试成绩统计某年级数学考试成绩统计图题图号图目图尺图形统计图的种类统计图的种类条
9、形图条形图:直条图,表示离散型数据资:直条图,表示离散型数据资料,以条形的长短表示数量大小。料,以条形的长短表示数量大小。圆形图圆形图:饼图,描述间断性资料,显:饼图,描述间断性资料,显示各部分在整体中所占的比重大小,示各部分在整体中所占的比重大小,以及各部分之间的比较。以及各部分之间的比较。图图2-2 简单条形图简单条形图图图2-3 分组条形图分组条形图图图2-4 分段条形图分段条形图圆形图图图2-5 某年级数学考试成绩统计某年级数学考试成绩统计绘制圆形图的步骤绘制圆形图的步骤求出各组成部分所占的百分比求出各组成部分所占的百分比求出各部分的角度求出各部分的角度以顺时针方向画出扇形以顺时针方向
10、画出扇形标出不同颜色及百分比标出不同颜色及百分比图图2-6 某年级数学考试成绩统计某年级数学考试成绩统计线形图线形图:描述连续性资料,表示两个:描述连续性资料,表示两个变量之间的函数关系,某种现象在时变量之间的函数关系,某种现象在时间上的发展趋势,或一种现象随另一间上的发展趋势,或一种现象随另一种现象变化。种现象变化。散点图散点图:也称点图、散布图,用圆点:也称点图、散布图,用圆点的多少或疏密表示统计资料数量大小的多少或疏密表示统计资料数量大小以及变化趋势。以及变化趋势。例如:对有意义的词汇,小学一年级至初中三年级学例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉记忆再现率的情况。生
11、视觉、听觉记忆再现率的情况。 图图2-7 有意义的材料再现率比较线形图有意义的材料再现率比较线形图图图2-8 0-60个月婴儿身高个月婴儿身高图图2-9 0-60个月婴儿体重个月婴儿体重表表2-5 31人的视听反应时(单位:毫秒)人的视听反应时(单位:毫秒)图图2-10 31人的视、听反应时散点图人的视、听反应时散点图茎叶图与箱图茎叶图与箱图例2-2 下面是100名学生在某项测验中的成绩分数76.0 77.5 82.0 90.5 81.0 85.5 71.0 80.5 92.5 77.088.0 81.0 76.5 67.0 83.0 84.0 84.0 62.0 79.0 72.098.0
12、78.0 78.0 80.0 78.5 76.5 75.0 79.5 86.0 81.575.0 84.0 90.0 80.0 86.0 84.5 68.5 71.0 68.0 81.579.5 80.5 73.0 93.0 83.0 72.0 68.0 71.0 87.0 78.066.0 83.0 87.0 82.5 79.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 75.5 89.0 87.5 69.0 74.0 70.077.5 75.0 79.0 79.0 80.5 74.5 77.0 82.5 72.5 73.573.5 76.0
13、88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.094.0 79.0 80.0 75.5 83.5 82.0 65.0 74.5 80.0 70.5Frequency Stem & Leaf .00 6 . 1.00 6 . 2 1.00 6 . 5 2.00 6 . 67 4.00 6 . 8889 6.00 7 . 001111 7.00 7 . 2223333 9.00 7 . 444455555 9.00 7 . 666667777 12.00 7 . 888889999999 13.00 8 . 0000000011111 11.00 8 . 222223
14、33333 6.00 8 . 444455 6.00 8 . 666777 4.00 8 . 8899 3.00 9 . 001 2.00 9 . 23 1.00 9 . 4 1.00 9 . 6 2.00 Extremes (=98) Stem width: 10 Each leaf: 1 case(s)茎叶图次数十位数个位数茎宽每叶的样本数图图2-11 100名学生成绩茎叶图名学生成绩茎叶图身高 Stem-and-Leaf Plot Frequency Stem & Leaf 7.00 15 . 0123334 23.00 15 . 55555666667788888889999 29.0
15、0 16 . 00000000000001222223333334444 10.00 16 . 5555567888 6.00 17 . 002234 3.00 17 . 555 5.00 Extremes (=176) Stem width: 10 Each leaf: 1 case(s)图图2-12 学生身高茎叶图学生身高茎叶图箱图箱图中数75%25%最大值最小值异常值图图2-13 学生分数箱图学生分数箱图2.2 次数分布表次数分布表次数分布显示初步整理后一组数据的分布次数分布显示初步整理后一组数据的分布情况。情况。它能使我们对样本情况有个初步的了解它能使我们对样本情况有个初步的了解为今后
16、进一步分析和研究问题提供很大方为今后进一步分析和研究问题提供很大方便。便。次数分布表可以分为次数分布表可以分为简单次数分布表简单次数分布表、分分组次数分布表组次数分布表、累积次数分布表累积次数分布表等等2.2.1 简单次数分布表简单次数分布表简单次数分布表简单次数分布表是依据每一个分数值是依据每一个分数值在一列数据中出现的次数或总计数资在一列数据中出现的次数或总计数资料编制而成的统计表。料编制而成的统计表。表表2-6 80名员工对部门主管尽职程度调查结果名员工对部门主管尽职程度调查结果员工工对主管尽主管尽职情况的情况的评定定人数人数 非常不尽非常不尽职9 不尽不尽职30 不置可否不置可否10
17、尽尽职25 非常尽非常尽职6总计80态度、兴趣、偏好等测验或调查态度、兴趣、偏好等测验或调查2.2.2 分组次数分布表分组次数分布表分组次数分布表分组次数分布表,指当数据量很大时,把,指当数据量很大时,把所有数据先划分为若干分组区间,然后将所有数据先划分为若干分组区间,然后将数据按其数值大小划分到相应的组别内,数据按其数值大小划分到相应的组别内,分别统计各个组别中包括的数据个数,最分别统计各个组别中包括的数据个数,最后用列表形式呈现出来。后用列表形式呈现出来。例2-2 下面是100名学生在某项测验中的成绩分数76.0 77.5 82.0 90.5 81.0 85.5 71.0 80.5 92.
18、5 77.088.0 81.0 76.5 67.0 83.0 84.0 84.0 62.0 79.0 72.098.0 78.0 78.0 80.0 78.5 76.5 75.0 79.5 86.0 81.575.0 84.0 90.0 80.0 86.0 84.5 68.5 71.0 68.0 81.579.5 80.5 73.0 93.0 83.0 72.0 68.0 71.0 87.0 78.066.0 83.0 87.0 82.5 79.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 75.5 89.0 87.5 69.0 74.0 70.
19、077.5 75.0 79.0 79.0 80.5 74.5 77.0 82.5 72.5 73.573.5 76.0 88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.094.0 79.0 80.0 75.5 83.5 82.0 65.0 74.5 80.0 70.51. 求全距求全距R=Xmax-Xmin=98-62=362.决定组距和组数决定组距和组数组数:组数:组距:组距:i =全距全距/组数组数=R/K=36/12=33 列出分组区间列出分组区间表述组限精确组限组中值969896999695.598.4997939593969392.595.49949092
20、90939089.592.4991878987908786.589.4988848684878483.586.4985818381848180.583.4982788078817877.580.4979757775787574.577.4776727472757271.574.4973697169726968.571.4970666866696665.568.4967636563666362.565.4964606260636059.562.49614 登记与计算次数登记与计算次数表表2-7 次数分布表的登记表次数分布表的登记表5 编制次数分布表编制次数分布表 表表2-8 次数分布表次数分布表
21、2.2.3 相对次数分布表相对次数分布表将次数分布表中各将次数分布表中各组的实际次数转化组的实际次数转化为相对次数,即用为相对次数,即用频数比率(频数比率(fN)或百分比(或百分比( )来表示次数,就)来表示次数,就可以制成相对次数可以制成相对次数分布表。分布表。表表2-9 相对次数分布表相对次数分布表2.2.4 累加次数分布表累加次数分布表累加次数是把各组的次数由下而上,或由上而下累加在一起。表表2-10 累加次数分布表累加次数分布表可以将次数、相对次数、累加次数等信息列入一张表中。可以将次数、相对次数、累加次数等信息列入一张表中。相对次数fN累加次数表表2-11 次数分布表次数分布表2.2
22、.5 双列次数分布表双列次数分布表双列次数分布表又称相关次数分布表,双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表是对有联系的两列变量用同一个表表示其次数分布。示其次数分布。 所谓有联系的两列变量,一般是指同所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。组被试在两种实验条件下获得的结果。表表2-12 31人的视听反应时(单位:毫秒)人的视听反应时(单位:毫秒)表表2-13 312-13 31名学生视、听反应时测验结果名学生视、听
23、反应时测验结果2.2.6 不等距次数分布表不等距次数分布表表表2-14 1937年美国家庭收入的分布年美国家庭收入的分布注:由于四舍五入,百分数加起来不等于100%。来源:现场人口调查。收入水平(美元)组距百分数01 0001 00011 0002 0001 00022 0003 0001 00033 0004 0001 00044 0005 0001 00055 0006 0001 00056 0007 0001 00057 00010 0003 0001510 00015 0005 0002615 00025 00010 0002625 00050 00025 000850 000以上12
24、.3 次数分布图次数分布图在编制次数分布表的基础上,可以绘在编制次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加制次数分布图,使一组数据特征更加直观和概括直观和概括,而且还可以对数据的分布而且还可以对数据的分布情况和变动趋势作粗略的分析。情况和变动趋势作粗略的分析。绘制次数分布图计算机程序绘制,如绘制次数分布图计算机程序绘制,如EXCEL、SPSS等。等。2.3.1 直方图直方图直方图直方图 ( histogram )又称为等距直方又称为等距直方图,是图,是以矩形的面积以矩形的面积表示连续性随机表示连续性随机变量次数分布的图形。一般用纵轴表变量次数分布的图形。一般用纵轴表示数据的频数
25、,用横轴表示数据的等示数据的频数,用横轴表示数据的等距分组点,即各分组区间的上下限。距分组点,即各分组区间的上下限。直方图是统计学中常用而且又有特殊直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用意义的一种统计图,有着重要的应用价值。价值。根据例2-2 作直方图图图2-14 100名学生成绩直方图名学生成绩直方图60 66 72 78 84 90 96图图2-15 100名学生成绩组织图名学生成绩组织图2.3.2 次数分布多边形图次数分布多边形图次数分布多边形图(次数分布多边形图(frequency polygon)是一种表示连续性随机变量次数分布的线是一种表示连续性随机变量次
26、数分布的线形图,属于次数分布图。凡是等距分组的形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多可以用直方图表示的数据,都可用次数多边图来表示。边图来表示。绘制方法:以各分组区间的绘制方法:以各分组区间的组中值为横坐组中值为横坐标标,以各组的,以各组的频数为纵坐标频数为纵坐标,描点;将各,描点;将各点以直线连接即构成多边图形。点以直线连接即构成多边图形。图图2-16 100名学生成绩次数多边形图名学生成绩次数多边形图图图2-17 100名学生成绩次数多边形图名学生成绩次数多边形图利用次数分布多边图还可以把几组资利用次数分布多边图还可以把几组资料放在一起进行比较。料放在一起
27、进行比较。但需要注意的是,这时必须把数据的但需要注意的是,这时必须把数据的次数换算成次数换算成百分比百分比。图图2-18 41页数据的次数分布图页数据的次数分布图图图2-19 不正确的比较图不正确的比较图2.3.3 累加次数分布图累加次数分布图60 66 72 78 84 90 96横轴为分组区间,纵轴为累加次数横轴为分组区间,纵轴为累加次数图图2-20 累加直方图累加直方图累加曲线累加曲线将累积次数分布图中的将累积次数分布图中的横坐标横坐标横坐标横坐标以每一分组区以每一分组区间的精确上限或精确下限表示,间的精确上限或精确下限表示,纵坐标纵坐标纵坐标纵坐标以累以累加次数表示加次数表示图图2-2
28、1 累加曲线图累加曲线图累加曲线可用于判断一组数据的大致分布形态。累加曲线可用于判断一组数据的大致分布形态。图2-22 正态分布数据的累加曲线图图2-23 正偏态数据累加正偏态数据累加曲线曲线图图2-24 负偏态数据累加负偏态数据累加曲线曲线2.3.4 直方图与条形图的区别直方图与条形图的区别1. 描述的数据类型不同。条形图描述计数描述的数据类型不同。条形图描述计数数据,直方图描述分组连续数据。数据,直方图描述分组连续数据。2. 标尺分点意义不同。条形图为分类轴,标尺分点意义不同。条形图为分类轴,直方图为刻度值。直方图为刻度值。3. 图形直观形状不同。条形图有间隔,直图形直观形状不同。条形图有
29、间隔,直方图方块之间没有间隔。方图方块之间没有间隔。60 66 72 78 84 90 964. 表示数据的方式不同。条形图用表示数据的方式不同。条形图用直条的直条的长短或高低长短或高低表示数据的多少或大小,而直表示数据的多少或大小,而直方图用方图用面积面积表示数据的多少。表示数据的多少。面积表示百分数面积表示百分数纵坐标纵坐标=百分数百分数/组距组距2.4 计算机绘制统计图表计算机绘制统计图表(1)WORD绘制表格(2)EXCEL绘制条形图-简单条形图、分组条形图、分段条形图、圆形图、线形图、散点图、直方图(3)SPSS绘制直方图、茎叶图、箱图作业2各组自行收集数据绘制次数分布表与图(简单、相对、累积均可)要求:数据真实、图表手画报告要求:附原始数据以及说明谢谢!谢谢!