cyu__中科院心理统计

上传人:xins****2008 文档编号:97809208 上传时间:2019-09-06 格式:DOC 页数:23 大小:442.50KB
返回 下载 相关 举报
cyu__中科院心理统计_第1页
第1页 / 共23页
cyu__中科院心理统计_第2页
第2页 / 共23页
cyu__中科院心理统计_第3页
第3页 / 共23页
cyu__中科院心理统计_第4页
第4页 / 共23页
cyu__中科院心理统计_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《cyu__中科院心理统计》由会员分享,可在线阅读,更多相关《cyu__中科院心理统计(23页珍藏版)》请在金锄头文库上搜索。

1、心理统计=陈毅文中国科学院心理研究所社会与经济行为研究中心心理统计n 描述统计n 描述统计学主要研究如何整理科学实验或调查得来的大量数据,通过图表的形式描述一组数据的全貌,并计算出一些统计特征n 推断统计 n 推断统计学是研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表达的推断。 描述统计n 统计图表n 集中量数n 差异量数n 相对量数n 相关量数1-1、统计图表n 数据分组:单变量值分组、组距分组n 次数分布表:次数、累积次数、相对次数、累积相对次数、百分比、累积百分比n 统计图:条形图、圆形图、累积次数分布图、累积百分

2、比图、直方图、次数多边形图、散点图、线形图1-2、集中量数n 平均数n 算术平均数n 加权平均数n 几何平均数n 调和平均数n 众数n 中数算术平均数n 总体平均数n 样本平均数 算术平均数的性质 算术平均数主要适用于等距以上数据,但不适用于类别数据和顺序数据。优点是反应灵敏、计算简单、符合代数方法进一步演算、较少受抽样变动的影响;缺点是易受极端值的影响;加权平均数:用于分组数据1、组距分组数据 设原始数据被分成K组,各组的组中值分别为X1,X2,XK,各组变量值出现的频数分别为F1,F2,FK,则均值为:2、单变量值分组几何平均数调和平均数众数 众数是一组数据中出现次数最多的变量值。用Mo表

3、示,它是一个位置代表值,主要用于测度定类数据的集中趋势,也适用于定序、定距和定比数据的集中趋势的测度值。优点是不受极端值的影响,缺点是可能不唯一中数n 中数也叫中位数,是一组数据中按从小到大排序后,处于中间位置上的变量值。它将全部数据分成两部分,每个部分各包含50%的数据。n 中位数是一个位置代表值,它主要用于测度顺序数据的集中趋势。也适用于等距以上数据。但不适用于类别数据。n 将全部数据排序后,如果项数是奇数,则正中央的那一项即为中位数;如果项数是偶数,则正中央的那两项的平均值即为中位数。1-3、差异量数n 离差与平均差n 方差与标准差n 变异系数离差与平均差离差:也叫离均差,平均差:也称平

4、均离差,是各变量值与其均值离差绝对值的平均数,用MD表示。计算公式为:方差与标准差方差是各变量值与其均值离差平方和的平均数,是测度等距以上数据离散程度的最主要方法。标准差是方差的平方根总体方差和标准差样本方差与标准差方差、标准差的性质:(1)若y=x+c , x和y是随机变量,c为常数, 则(2)若y=cx, c为常数, 则样本方差与总体方差的区别:(1)在计算上,总体方差是用数据个数或总频数去除离差平方和,而样本方差则用样本数据个数或总频数减一去除离差平方和;(2)样本方差是统计量,用S2表示;总体方差是总体参数,用s2表示。(3)当n很大时,S2与s2相差很小,前者是后者的无偏估计。变异系

5、数n 也称离散系数,标准差系数,是一组数据的标准差与其相应的均值之比。n 变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的离散程度。n 变异系数可用于同一团体不同测量的变异的比较,也可用于不同团体同一测量的变异的比较。1-4 相对量数n 百分位数n 百分等级n 标准分数百分位数次数分布中对应于某个特定百分点的原始分数。第m百分位是这样一个值,它使得至少有m%的数据小于或等于这个值,且至少有(100-m)%的数据项大于或等于这个值。百分等级分数 次数分布中低于某个原始分数的次数百分比,用PR表示。 求百分位分数是先确定某个百分点m,然后去求相应的百分位分数Pm 。而求百分等级

6、分数正好相反,事先知道次数分布中的一个原始分数,再求该分数在分布中所处的相对位置。标准分数标准分数也叫Z分数,它是以标准差为单位,可以给出一个原始分数在一组数据中的相对位置。Z分数的应用:n 比较分属性质不同的观测值在各自数据分布中相对位置的高低。n 当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总和或平均值,以表明在总体中的位置。n 表示标准测验分数 z=az+bn 异常值(极端值)的取舍n 由标准分数可以计算出原始分数x=m+zs相关量数n 积差相关n 等级相关n 肯德尔和谐系数n 点二列相关n 二列相关n j 相关相关n 相关的含义n 正相关、负相关和零相关n 相关

7、系数n 如何通过散点图直观地判断两个变量的相关n 计算相关系数时应该注意的问题n 相关系数受样本容量n的影响,样本相关系数需要检验n 存在相关关系不一定存在因果关系n 没有线性相关,不一定没有关系,可能是非线性的。 积差相关n 适用条件:两变量等距、正态并且具有线性关系斯皮尔曼等级相关n 适用条件n 顺序量表的数据n 等距、等比数据而总体非正态n 优缺点n 对总体没有特别要求,适用面广n 与积差相关相比,精度稍差肯德尔和谐系数适合于k个评价者对n个被评价事物进行等级评价的资料。 计算评价者一致性系数点二列相关 适用资料:两列变量中一列为等距或等比的测量数据而且总体分布为正态,另一列变量为类别(

8、名义)变量,分为两类 可用于判别是非选择测验题目的区分度 计算公式二列相关 适用于两列变量都为正态等距变量,但其中一列变量被人为地划分成两类。n 二列相关与点二列相关的主要区别在于二分变量是否正态j 相关n f相关的适用资料是除四分相关之外的四格表资料,是表示两二分变量相关程度最常用的一种相关系数。推断统计n 推断统计基础n 参数估计n 假设检验n 方差分析n 回归分析n 卡方检验n 非参数检验2-1 推断统计基础n 概率基础n 正态分布n 二项分布n 抽样原理与抽样方法n 抽样分布1、概率基础n 试验与事件n 事件的概率定义n 常用排列组合公式n 概率的性质与运算法则n 条件概率与独立事件n

9、 加法公式、乘法公式常用排列组合公式:概率的性质与运算法则概率的性质与运算法则 概率的性质 非负性。对任意事件A, 0 P(A)1 规范性。必然事件的概率为1,不可能事件的概率为0。P(W)1,P(f)0 可加性。若A,B互斥,则P(AB)P(A)P(B) 概率运算 ()( A) 加法公式: P( AB)P(A)P(B)P(AB)条件概率与独立事件条件概率:当某一事件B已知发生时,求事件A发生的概率,称为事件B发生条件下事件A发生的条件概率,记为P(A|B)。 乘法公式: P(AB)=P(B)P(A|B) P(AB)=P(A)P(B|A)独立事件n 两个事件中不论哪个事件发生与否并不影响另一个

10、事件发生的概率,称这两个事件相互独立。n 两个事件A、B是相互独立的,当且仅当,P(AB)=P(A)P(B)n 独立事件与相斥事件的区别2、正态分布n 一般正态分布的图形特点n 标准正态分布n 一般正态分布的标准化转换n 标准正态分布表及其应用图形特点1) f(x)0,整个密度函数都在x轴的上方;2)曲线对称,平均数,中数,众数三者相等,x= m处达到最大值3)曲线的陡缓程度由s决定, s越大,曲线越平缓; s越小,曲线越陡峭。X趋向于无穷时,曲线以x轴为其渐近线。4)正态曲线下面的面积为1,平均数左右各为0.5;5)正态分布曲线下,标准差与概率(面积)有一定的关系: m1 s内,概率为0.6

11、826; m2s内,概率为0.9545; m3s内,概率为0.9973标准正态分布m=0, s=1时,有相应的正态分布N(0,1)称为标准正态分布(Standard normal distribution). 通常用j(x)表示概率密度函数。任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.正态分布表即:标准正态分布函数f(x)的数值表;将一般正态分布化为标准正态分布,通过查表可解决正态分布的概率计算问题。使用正态分布表可作如下计算:1)依据Z分数求概率; 如Z=1时,p=0.34132)知道概率求Z分数;如p=0.2517时,Z=0.683)已知概率或Z分数,求概率密度值f(x)4

12、)知道Z分数,求原始分数,x=.m+Zs3、二项分布n 二项分布的定义及满足的条件n 二项分布的概率计算公式n 二项分布的总体均值与方差n 用二项分布解决实际问题二项分布的定义及满足的条件1)试验中包含了n个相同的试验;2)每一次试验只有两个可能的结果,“成功”和“ 失败”; 3)出现“ 成功”的概率p是相同的,“失败”的概率q也不变; p+q=14)试验是相互独立的。符合上述条件的n次重复独立的试验为n重贝努里试验(Bernoulli trials)或二项试验。二项分布的概率计算公式X表示n次重复独立试验中事件A(成功)出现的次数二项分布的期望值和方差E(X)npD(X)=npq4、抽样原理

13、与抽样方法n 总体、个体、样本、样本容量n 参数与统计量的区别和联系,常见的参数与对应的统计量。n 几种抽样方法:简单随机抽样、分层抽样、整群抽样、系统抽样5、抽样分布n 抽样分布的含义n 样本均值分布及其中心极限定理n 几种常见的抽样分布:样本均值分布、样本方差的分布、样本方差比的分布n 几种常见的理论分布:正态分布、t分布、卡方分布和F分布,并且能熟练查上述四个表。中心极限定理(Central Limit theorem):设从均值为m,方差为s2(有限)的任意一个总体中抽取大小为的样本,当充分大时(n30),样本均值X的抽样分布近似服从均值为m,方差为s2/的正态分布。样本方差的分布设X1,X2,,Xn为来自正态分布N(m,s2)的样本,则从数学上可以推导出正态总体下样本方差S2的分布为:2-2 参数估计n 点估计、区间估计与标准误n 总体平均值的估计n 标准差与方差的估计1、点估计、区间估计与标准误n 点估计、区间估计的定义,二者的优缺点及联系n 一个好的点估计应满足的条件:一致性、无偏性、有效性和充分性n 置信度、置信区间、显著性水平n 标准误:广义-统计量的标准差;狭义-样本均值分布的标准差n 2、总体平均值m的估计n 方差已知n 总体正态或n 总

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号