现代心理与教育统计学复习

上传人:人*** 文档编号:488972367 上传时间:2023-11-12 格式:DOCX 页数:30 大小:114.16KB
返回 下载 相关 举报
现代心理与教育统计学复习_第1页
第1页 / 共30页
现代心理与教育统计学复习_第2页
第2页 / 共30页
现代心理与教育统计学复习_第3页
第3页 / 共30页
现代心理与教育统计学复习_第4页
第4页 / 共30页
现代心理与教育统计学复习_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《现代心理与教育统计学复习》由会员分享,可在线阅读,更多相关《现代心理与教育统计学复习(30页珍藏版)》请在金锄头文库上搜索。

1、1、数据类型厂称名数据计数数据Y离散型数据-顺序数据等距数据测量数据A连续型数据L等比数据2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表 示这个指标的观察结果时,这个指标是一个变量。用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。3、需要研究的同质对象的全体,称为总体。每一个具体研究对象,称为一个个体。从总体中抽出的用以推测总体的部分对象的集合称为样本样本中包含的个体数,称为样本的容量 n。一般把容量n 30的样本称为大样本;而n v 30的样本称为小样本。4、统计量和参数统

2、计指标统计量参数平均数?M标准差SCT相关系数rp回归系数b5、统计误差误差是测得值与真值之间的差值。测得值二真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量 差。由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f/N )或百

3、分比-100%)来表示次数,就可以制成相对次数分布表N(三)累加次数分布表(四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特 点的指标,或同一组被试在两种实验条件下获得的结果。三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析简单次(频)数分布图一一直方图、次数多边形图累加次数分布图一一累加直方图、累加曲线(一)简单次数分布图一一直方图(二)简单次数分布图一次数多边图次数分布多边形图是一种表示连续性随机变量次数分布的线形

4、图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以 直线连接即构成多边图形。(三)累加次数分布图一累加直方图(四)累加次数分布图一一累加曲线四、其他统计图表条形图:用直条的长短来表示统计项目数值大小的图形, 主要是用来比较性质相似的间断型 资料。圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的 面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。线形图用来表示连续型资料。它能表示两个变量之间的函数关系; 一种事物随另一种事物变 化的情况;某种事物随

5、时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量 比较,又可分析发展的趋势。散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。第三章集中量数用来表现数据资料的典型水平或集中趋势。常用的集中量包括算术平均数、加权平均数、中位数和众数等等。、算术平均数一般用M,或者用X表示。算术平均数是最常用的集中量(一)算术平均数的计算公式(二)算术平均数的意义算术平均数是应用最普遍的一种集中量。它是“真值”(true score )的最佳估计值。真值是反映某种现象的真实水平的分数。 由于测量过程中的各种偶然因素的影响,真值往往很难得到。在实际测量中,往往采用“多次测量,取平均数

6、”的方法,用平均数去估计真值。(三)算术平均数的优缺点优点:反应灵敏、有公式严密确定、简明易懂、适合代数运算缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。(四)计算和应用算术平均数的原则同质性原则:算术平均数只能用于表示同类数据的集中趋势。平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。 平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程 度。二、中位数中位数又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用 Md或Mdn表示(一)中位数的计算方法1、原始数据计算法一组数据

7、中无重复数值的情况首先将一组数据按顺序排列2、次数分布表计算法公式中:Lb为中位数所在组的精确下限Xni 2 -fb I2fMd若n为偶数L则哼ffb为中位数所在组下限以下的累积频数n为数据总和fMd为中位数所在组的频数i为组距三众数众数 用Mo表示,有两种定义:次数分布表中,频数最多那一组数据的组中值,即为众数四、算术平均数、中位数、众数三者的关系在正态分布中:X二Md二MO 在正偏态分布中:XMd M O在负偏态分布中:X ”: Md以Mo 五、其它集中量数(一)加权平均数加权平均数是不同比重数据(或平均数)的平均数,一般用表示。其计算公式有两种:Wi X i(二X几w何平龙Wj几何平均数

8、 (geometric meaniX w 二二一)是n个数值连乘积的n次方根g,廣gni X或 表示。计算公式为:当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势Xn-1Xn几何平均数的变式两边取对数,得几何平均数计算的需要从几何平均数中减去基数1 2.应用几何平均数的变式计算按一定 比例变化 的一列数据,一般用来求 平均变化率 如 平均增长率.(三)调和平均数调和平均数(harmonic mean), 用符号MH表示调和平均数的应用 学习速度方面的问题调和平均数在描述速度方面的集中趋势时,优于其他集中量第四章描述数据离散程度的统计量称为差异量。差异量越大,表明数据越分散、不集中;差

9、异量越 小,表明数据越集中,变动范围越小、全距、四分位距和百分位距(一)全距R 全距是一组数据中的 最大值 与该组数据中 最小值 之差,又称极差R=Xmax Xmin(二)百分位差(百分位距)百分位差是指两个百分位数之差(三)四分位距四分位距是第一个四分位数与第三个四分位数之差的一半(四)平均差 平均差 是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通 常用AD或MD表示。AD =原始数据计算公式(五)方差和标准差方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差2 2用S表示,总体的方差用表示。标准差是方差的算术平方根。一般样本的标准差用S表

10、示,总体的标准差用表示。标准差和方差是描述数据离散程度的最常用的差异量1、样本方差及标准差定义公式3、原始数据的方差与标准差计算可以计算几个小组联合在4、总标准差的合成 方差具有可加性的特点。当已知几个小组数据的方差或标准差时, 一起的总的方差或标准差。计算公式公式中S: 为总方差 , 为总标准差Si为各小组标准差2 Enj Sj + EnjXT -ni为各小组数据个数S t 二:y n i5、方差和标准差的性质方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:如果Y = X C 贝収=Sx如果 Y = c贝

11、S C Sx7、标准差的应用差异系数差异系数 是指标准差与其算术平均数的百分比,它是没有单位的相对数。常以CV表SCV 100%X示,其计算公式为:差异系数的作用:比较不同单位资料的差异程度比较单位相同而平均数相差较大的两组资料的差异程度可判断特殊差异情况8、标准差的应用标准分数Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。(1) 标准分数的计算公式及其性质X - XZ = 没有实际单位;S 可正可负,可为零; 一组原始数据中,各个z分数的标准差为1 ; 正态分布的原始数据,转换得到的 Z分数是标准的正态分布(0,1 )。(2)Z分数的作用Z分数可以表明原始分数在团体

12、中的相对位置,因此称为相对位置量数。把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差 为单位、以平均数为参照点的分数。(3 )标准分数的优点可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。明确性:标准分数较原始分数的意义更为明确。合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地 反映事实。第五章相关系数 用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数, 一般样本的相关 系数用r表示,总体的相关系数用p表示。相关系数的取值:-1 r w+1

13、0 I日相关系数的符号:“”表示正相关, “”表示负相关。相关系数不是由相等单位度量而来的, 因此只能比较大小, 不能做任何加、 减、乘、除运算。二、积差相关(一)积差相关及其适用条件皮尔逊积差相关 积差相关适用于: 1、两个变量都是连续数据;两变量总体都为正态分布;两变量之间为线性关系。 2、成对数据,样本容量要大。 积差相关条件的判断方法:连续变量:根据得到数据的方式判断,测量数据。 正态分布:一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可 按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。线性关系:根据相关散布图可判断两个变量之间是否线性关系。(二)

14、相关系数的等距转换及其合并相关系数不是等距数据,更不是比率数据,它只能比较相对大小,不能进行加减乘除运 算。但我们常会遇到需要将取自同一总体的几个样本的相关系数合成、 求平均的相关系数这 一问题。这时,可以先将相关系数 r转换成具有等距单位的Zr值。三、斯皮尔曼等级相关等级相关 是指以等级次序排列或以等级次序表示的变量之间的相关。 (一)斯皮尔曼等级相关的概念及适用条件斯皮尔曼等级相关是等级相关的一种。 它适用于两个以等级次序表示的变量, 并不要求 两个变量总体呈正态分布,也不要求样本的容量必须大于 30当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等 级相关系数。五、质与量的相关(一)点二列相关适用条件一个变量为正态、连续变量,另一个变量为真正的二分名义变量,这两个变量之间的相关, 称为点二列相关。有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。多用于评价是非类测验题目组成的测验内部一致性。(二)二列相关两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量, 表示这两个变量之间 的相关,称为二列相关。将连续变量人为划分为二分变量时,应注意尽量使分界点接近平均数。教育或心理测验中问答题的区分度指标。六、品质相关 两个变量都是按性质划分成几种类别,表示这两个变量之

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号