绪论(一) 什么是教育与心理统计学教育与心理统计学的概念是专门研究如何运用统计学原理和方法,搜集、整理、分析教育与心理科学研究中获得的随机性数 据资料,并根据这些数据资料传递的信息,进行科学推论找出教育与心理活动规律的一门学科二) 教育与心理统计学的基本内容描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法一、二章节)推断统计:通过局部数据所提供的信息,推论总体情况四、五、六、七、八、九章节)多元分析统计:寻找主要影响因素,对相近或相关因素合并或归类三) 教育与心理统计的昨天、今天和明天1904年美国人桑代克写的《心理与社会测量导论》是第一本教育与心理统计的专著四) 预备知识1•随机现象及随机变量的概念随机现象:在相同的条件下,其分数或者其他数据结果可能不止一个,由实验或观测得到的数据, 事先无法确定随机变量:取值之前不能预料取到什么值的变量随机变量分为:称名变量:说明某一事物与其他事物属性上的不同或类别上的差异比如:性别顺序变量:可以按事物的某一属性,把它们按多少或从大到小排列等距变量:变量之间有相等的距离除了有量的大小还有相等单位比如:温度比率变量:有量的大小,相等单位,还有绝对零点。
比如:身高、体重总体指具有某一种特征的一类事物的全体样本指总体中抽取的一部分有代表性的个体个体指构成总体的每一个基本元素2. 常用的符号及其计算法则离散变量:数值只能用自然数和整数表达连续变量:能在一定区间内任意取值的变量二分称名变量:变量只能有两个结果,比如是或否,对或者错笔记部分)第一章常用的统计表与图(一) 次数分布表与图1. 次数分布的概念数据在各个不同数值点上所出现的次数情况(75分在100个人的班级中出现了 8次),或是一批数 据在整个取值范围内各个等距区间中所出现的次数情况(70〜80这个区间内出现了 15次)2. 次数分布图通常的两种表达方式次数直方图和次数多边图3. 简单次数分布表、次数直方图与次数多边图的编制(笔记部分)(二) 几种常用的统计分析图1. 散点图、线形图、条形图、圆形图的涵义一、 散点图散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式在平面直角 坐标系中,横轴一般代表自变量,纵轴一般代表因变量,横轴既可以作为连续性变量的量尺,也可 以作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺二、 线形图线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。
适用于描述某种事物在时 间序列上的变化趋势,也适用于描述一种事物随另一种事物发展变化的趋势模式,还适用于比较不 同的人物团体在同一心理或教育现象上的变化特征及相互联系三、 条形图条形图是用宽度相同的长条来表示各个统计事项之间的数量关系与直方图不同的是,条形图通常 用于描述离散性变量(如属性变量)的统计事项四、 圆形图圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应 比例的一种图示方法各统计事项在总体中的比例乘以圆周角(360度),求出各相应扇形的圆心 角2. 散点图、线形图、条形图、圆形图的编制(放心吧不会让你画的)第二章 常用统计参数(主要在笔记)(一)集中量数(描述数据集中趋势的统计量)1•总体平均数与样本平均数的定义、公式与符号表达观测值的总和除以观测值的总次数所得的商(笔记部分)2. 加权平均数的定义与公式表达(笔记部分)3. 几何平均数的使用条件和基本公式数据按一定比例变化或存在极端数据呈偏态时,比如等距等比变量,或者平均增长率笔记部分)4. 中数的定义和公式位于一组数列中间位置的数优点:不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用缺点:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算(笔记部分)5. 众数的定义和公式次数分布中出现最多的那个数的数值。
优点:能在数据不同质的情况使用,能避免极端值干扰缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算笔记部分)6. 算术平均数的性质及其优缺点优点:反应灵敏,确定严密,简明易解,计算简便并能作进一步的代数演算,较少受抽样变动 影响,是应用最普遍的一种集中量数缺点:易受极端数据影响,出现模糊不清的数据时无法计算,不同质数据不能计算平均数二)差异量数(反应数据离散程度)1. 平均差的计算公式与符号表达(笔记部分)2•总体方差与总体标准差的计算公式与符号表达(笔记部分)3. 样本方差与样本标准差的计算公式与符号表达(笔记部分)4. 差异系数的计算公式与符号表达⑴两个或两个以上的样本所使用的观测工具不同,所测的特质不同2)两个或两个以上的样本使用同一种观测工具,测量同一种特质,但样本间的水平相差较大笔记部分)5. 方差与标准差的性质与意义方差的意义在于反映了一组数据与其平均值的偏离程度标准差是方差的算术平方根,意义在于反映一组数据的离散程度三) 地位量数1. 地位量数的涵义表明原始变量在其所处分布中的地位2. 百分位数的涵义一种相对地位量数,把一个次数分布排序成100个单位,百分位分数是次数分布中在某个特定百分 点中的原始分数。
3. 百分等级分数的涵义一种相对地位量数,事先知道分布中一个原始分数,求这个原始分数在分布中所处的相对位置四) 相关分析(用一些合理指标对相关事物观测值进行统计分析)1. 相关的涵义事物之间存在联系但又不能用因果关系直接解释,称为相关直线相关(线性相关):指两列变量中的一列变量增加(减少)时,另一列变量随之增加(减少),或这一列变量增加时,而另一列变量则相应减少它们之间存在一种直线关系2. 相关系数的概念与符号表示 相关系数是两列变量相关程度的数量化指标,用r表示,-1.00WrW + 1.00正相关:两列变量变动方向相同 负相关:两列变量变动方向相反零相关:两列变量之间没有关系0)+1.00为完全正相关,-1.00为完全负相关,统称完全相关相关系数为0时称零相关3. 相关散点图随着x轴增加y轴增加的是正相关随着x轴增加y轴减小的是负相关毫无规律的是零相关4. 积差相关系数(皮尔逊相关)应用条件及计算公式求线性相关时使用(1) 两列变量必须是成对的,而且样本容量不宜少于30(2) 两列变量必须是等距变量或比率变量(3) 两列变量的总体分布均为正态分布或近似正态分布(笔记部分)5. 斯皮尔曼等级相关应用条件及基本公式求线性相关时使用两个变量的观测值是成对的等级评定资料即可(只有两个变量等级)(笔记部分)6. 肯德尔W系数应用条件及计算公式计算多列等级相关程度时使用,用于两列以上等级变量。
笔记部分)7. 质量相关的含义以及质量相关中点双列相关和双列相关的应用场合质量相关:一列变量按照事物某种属性划分种类,另一列变量则为等距或等比的测量数据点双列相关:适用于一列数据为等距或等比数据,而且其总体分布为正态,另一列为离散型二分称名变量多用于评价是非类测验题组成的测验的内部一致性等问题双列相关:两列变量都是正态等距变量,其中一列变量被人为地分成两类两者之间的区别:不确定观测数据是一个真正的二分变量还是基于正态分布的人为的二分变量,用点二列相关当确认数据分布形态为正态分布,用二列相关第三章概率与分布(一) 概率1•随机现象、随机试验、随机事件随机现象:在一定条件下,事先不能断言会出现哪种结果的现象随机试验:对随机现象的观察随机事件:随机现象中出现的各种可能的结果2. 概率的统计定义在大量重复的N次试验中,当N无限增大时,事件A发生的频率稳定在一个确定的常数附近3. 概率的古典定义若实验由N个有限的基本事件组成,且每次试验中每个基本事件出现的可能相同,若有利事件A发 生的次数为M,则事件的概率=M/N4. 概率的加法定理若A和B是两个互不相容事件(A发生则B不发生)则A和B至少有一个发生的概率为P (A+B)=P(A)+P(B)5. 概率的乘法定理若A和B是两个相互独立事件(A发生不影响B是否发生)则A和B同时发生的概率为 P(A*B)=P(A)*P(B)(二) 二项分布1. 二项式定理(笔记部分)2. 二项分布的均值、方差及标准差的应用(笔记部分)(三)正态分布1. 标准分数的定义又称z分数,是以标准差为单位表示一个原始分数在团体中所处位置。
2. 正态分布的基本性质(笔记部分)3. 正态分布曲线下概率面积的查表计算(笔记部分)4. 正态分布的实际应用(笔记部分)第四章抽样理论与参数估计(一) 抽样的基本概念1. 总体、个体与样本的概念总体指具有某一种特征的一类事物的全体样本指总体中抽取的一部分有代表性的个体 个体指构成总体的每一个基本元素2. 参数与统计量的概念反映总体特征的量数统称为总体参数,简称参数反映样本数据特征的量数统称为样本统计量,简称统计量3. 常用参数与统计量的符号表示(笔记部分)(二) 抽样方法1. 简单随机抽样的方法简单随机抽样需满足两条原则:机会均等:总体中每一个元素,被抽取作为样本元素的概率相等相互独立:总体中任何一个元素是否被抽取与其他元素无关2. 等距抽样的方法这种抽样方法是把总体所包含的各个元素(或个体)编上号码假设共有N个元素,则编出的号码 从1到N,然后可根据拟抽取的样本容量n求得抽样间距k, k=N/n,这时可随机定一个起点a,起点 确定后,从起点开始每间隔k个单位抽取一个,这样抽取的号码序列也就确定了3. 分层抽样的方法所谓分层抽样就是先将总体按照一种或几种特征为几个子总体(类、群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本。
三) 抽样分布1. 正态分布与标准正态分布的转化当正态分布中,U=0, 2=1时,称为标准正态分布2. X2分布的特点(笔记部分)3. t分布与标准正态分布的关系相似:① 平均数u=0且位于曲线中央② 分布密度曲线关于原点0对称③ 当自变量为0时处于最高点④ 曲线与横轴所包围的面积也等于1不同:标准正态曲线不管样本n的大小,分布曲线只有一条;而t分布曲线形状随着n的大小而变化,因 此t分布是一簇曲线随着n的增大,t分布曲线就越来越接近标准正态分布曲线,当nf+s时,t分 布与标准正态分布完全吻合4. F分布的用处及两个主要结论(笔记部分)5. 查X2分布表、t分布表与F分布表求临界值(四) 样本容量的计算1. 样本容量的计算公式(笔记部分)(五) 参数估计1. 参数估计的概念当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部 结果推论总体的情况,称为总体参数估计2. 参数估计的一般思想设总体有参数U,从总体中抽取一样本X , X ,・・・,X ,此时估计U值有两种办法:1 2 n① 计算出样本的一个统计量U,以这个统计量作为U的估计值,这种方法称为参数的点估计。
这个样本估计量U称为U的点估计量② 计算出样本的两个估计量U,U,用区间(U,U )作为U可能的取值范围。