心 理 统 计第一章 绪论一、心理统计是统计学的原理和数学方法在心理学领域中的应用第一节 心理统计的作用和内容二、心理统计的内容:描述统计:把实验中所得的数据进行概括的整理,从中得出实验者可利用的信息推论统计:《心理统计》将研究对象的全部称为总体,从总体中抽出的参与实验的部分称为样本,推论统计就是从样本的数量特征去推论总体的数量特征 集中量数:数据中具有代表性的指标,如平均数、中数 描述统计 离中量数:数据分散程度的指标,如四分差、标准差、方差心理统计 数据间的相关:表示成对的两组数据间关系的指标 推论统计:从样本的数量特征去推论总体的数量特征第二章 数据的初步整理第一节 实验数据的类型 计数数据:表示在数轴上只占点,如:1,2,3,……数据形式为计数数实验数据 据的变量称为离散型变量 测量数据:是近似值,通过测量工具得到,是用一个区间的中点去代表这个区间,数据的形式为测量的变量,称为连续型变量。
第二节 用表整理实验数据一、心理实验中,常用的表格有原始记录与原始数据表、次数分布表、实验结果表三种所有分组数据特点:分组(上限、下限)、中点(中间数)、次数二、列次数分布表 (1)分组,分组太细没有意义,太粗也不行,通常根据数据的个数的多少分,一般分10—20组全距(R):所有数据中最大值上限与最小值下限之差全距=最大数上限-最小数下限组距(i):每一组最大值上限与每一组最小值的下限之差组距=组上限-组下限 (2)中点,符合X`X`:组中值,指每一组的中间值;X`=(组上限+组下限)/2 p:比例,部分占总体的比例; (3)次数f: 频数,指数据在各组出现的次数; P或%:次数占总体的百分数;三、列实验结果表 (1)累加次数, 符号为cf 通常累加是由下向上累加的 (2)比例, 符号P (3)次数百分数, 符号P或% (4)累加次数百分数,符号cP或cf%第三节 用图表达实验数据一、横坐标常用于表示心理实验中的自变量(刺激变量);纵坐标表示心理实验中的因变量(反应变量)常用的图有直条图、直方图、曲线图(折线图)。
(1)直线图,直条图中的长方形是分开的,只能表示计数数据,离散型变量; (2)直方图,直方图中的长方形是连在一起的,可以表示计数和测量两种形式的数据; (3)曲线图,又称折线图,是用线段连接各组次数点绘制而成,可用于多组数据的比较,多用于测量数据,连续型变量第四节 数据的分布形态一、 双峰现象的产生的原因:曲线出现了高低差不多的两个峰,这时就发生了双峰现象1)分组时组距选择不当,使峰值附近的两个数据个数较多的组被一个数据个数较少的组隔开,叫假双峰,通常适当改变组距,双峰现象就会消失;(2)数据中混有性质不同的两种数据当实验结果出现双峰分布时,分析双峰现象产生的原因,从而将不同质的数据分开第三章 集中趋势的测量一、集中趋势,取得一组数据,计算出能够反映该组数据的具有代表性的数字指标集中量数,表示数据集中趋势的指标,它是一组数据的代表值集中量数比起个别数据来,更能准确地反映所研究的事物和现象的真实情况,是真值的最好的估计值常用的集中量数有:平均数、中数、众数第一节 平均数一、算术平均数在正态分布中,平均数、中数mdn、众数Mo是一样的,在中点位置平均数的计算公式: 分组数据的平均数计算公式:加权平均数计算公式: (分组时几组数据考虑n的权重)平均数是有单位的,其与原始数据的单位一样。
二、平均数特点:(1)算平均数时,全部数据都参加运算,因此每个数据对平均数的大小都有影响,从数学的意义上讲平均数是最严谨的集中量数2)平均数另一个很重要的特点,即平均数是一组数据的重心,每一数据减去平均数所得的差叫离均差该特点定义为:离均差之和恒等于零计三、在以下三种情况不能使用平均数:(1)数据中存在个别极端数值时;(2)数据末端存在只有数位而无数值时,因缺少数据,数据不完全,不能计算平均数;(3)数据中存在两种不同性质的数据,即出现双峰现象时第二节 中数和众数一、中数,符号mdn,是在一组按大小排列的数据中位置居中的那个数,它将数据分为大的小的一半二、中数的特点: (1)中数不是一个很稳定的指标; (2)中数对数据中其他数据数值的变化不敏感三、众数,符号Mo,众数就是在数据中出现次数最多的那个数第三节 平均数、中数、众数的比较一、在正态分布中平均数、中数、众数都相等,位置居于分布的中轴线在偏态分布中,算术平均数总处于曲线偏斜的一端中数的位置位于平均数偏峰值的一边,约为平均数到峰值的三分之一处,中数把曲线下的面积分为大小相等的两部分用平均数作为偏斜方向的指标,当平均数在负数为负偏斜;平均数在正数方向为正偏斜。
当平均数大于中数或众数,曲线为正偏斜,当平均数小于中数或众数,曲线为负偏斜例题:数据为奇数时,居中的数为中数;偶数时,中数为中间两数之和除以2另有特殊情况,如(1) 10 13 15 15 190 ↑ ↑ 14.5 15 15.5 数下限↑ 数上限14.75为该组数据的中数 (2) 10 13 15 15 15 190 ↑ ↑ ↑ 14.5 14.5+1/3 14.5+2/3 15.5 数下限 ↑ 数上限 14.5+1/3为该组数据的中数分组数据的中数计算公式: (mdn为中数,L为组下限,N为数据总个数,fmdn 为中数所在组的数据个数,i为组距)例:分组X` f cf10-1515-2020-2525-3030-3512.5 2 217.5 4 6 22.5 6 1227.5 5 1732.5 5 22Fb 中数所在组以下各组数据个数之和 6fmdn 中数所在组的数据个数 6 中数在20-25这一组 组距 i=组上限-组下限=15.5-9.5=6 计算其中数为 ==20.3有极端值的时候,用平均数不合适,但可以用中数;众数Mo是数据中出现次数最多的那个数;分组的情况下,众数是出现频数最大的那个组的组中值;众数永远耸立于最高点,中数把数据分成两半;众数的代表性最小,稳定性最差。
第四章 离中趋势的测量一、差异量数,数据与数据之间的差异称为离中趋势,表示离中趋势的指标 差异量数大,数据之间差异大,集中量数的代表性就小;差异量数小,数据之间差异小,集中量数的代表性就大二、常用的离中量数有全距、四分差、标准差和方差、离中系数等第一节 全距、百分位距与四分差一、全距,是一组数据中最大数的上限与最小数的下限值的差它是最简单的差异量数,表示数据的离散程度,全距大,差异大,数据分散;全距小,差异小,数据较集中二、百分位距 (1)百分点Rx与百分位Rp 百分位(Rp)又叫百分等级,是将数据从小到大排列,每个数据所在的位置(累加到的序号)与全部数据个数的百分比百分等级就是它的系列位置(从小向大累加)与数据总个数的百分比 百分点Rx,指的是某个百分等级上的具体数值 百分位和百分点是同一事物的两个侧面,百分等级表示的是位置,百分点表示的是该位置上的数值 (2)百分点与百分位的计算公式P10 第10个百分位数,表示10%的人成绩比自己差,90%的人比自己好P50=mdn百分点 R75 成绩处于75%的位置的人所对应的数值。
百分位计算公式: PP 某数值的百分位; LP 该百分位所在组的下限p 百分位 n 数据的个数fbp 百分位所在组下限以下数据个数之和fp 百分位所在组数据个数 i 组距例分组f cf50-5445-49P90 → 40-4435-3930-34P10 → 25-2920-241 47 3 465 43 第一次超过90%的组 470.9=42.310 3815 289 13 第一次超过10%的组 470.1=4.74 4 i=组上限-组下限=29.5-24.5=5三、四分差,为了避免数据两端的极端数据或偏斜的分布对分散程度的影响,研究工作者常常只了解按大小顺序排列的一系列数据中间50%个数据的离散程度,这时要用到的离散程度的指标 四分差,用符号Q表示,表示按大小顺序排列的一组数据中间50%个数据的离散程度的指标四分差的计算公式: Q3 75%的百分点 Q1 25%的百分点把中数的计算公式搞清楚,Q值的计算一般都没问题。
四、通过四分点的数值,了解一组数据的偏斜情况:在对称的分布中,Q2-Q1=Q3-Q2;在正偏态分布中,Q2-Q1<Q3-Q2;在负偏态分布中,Q2-Q1>Q3-Q2 第二节 方差与标准差一、方差,符号S2,又称变异数,是以数据中每一数值与均值的差的平方和的均值作为离散程度的指标 标准差,符号S,它是方差的正的平方根方差和标准差都是差异量数中最重要、最常用的指标二、标准差的计算公式:平均差(AD): (X-):离均差 n:数据的个数方差(S2): 单位变了标准差(S): 单位与原始数据单位一样分组数据标准差: f:各小组数据个数; N:数据总个数 X’:组中值例:X X- (X-)2 10 -10 10015 -5 2520 0 025 5 2530 1。