心理学考研-心理统计资料-统计推断的数学基础.

上传人:今*** 文档编号:105821511 上传时间:2019-10-13 格式:DOCX 页数:13 大小:255.34KB
返回 下载 相关 举报
心理学考研-心理统计资料-统计推断的数学基础._第1页
第1页 / 共13页
心理学考研-心理统计资料-统计推断的数学基础._第2页
第2页 / 共13页
心理学考研-心理统计资料-统计推断的数学基础._第3页
第3页 / 共13页
心理学考研-心理统计资料-统计推断的数学基础._第4页
第4页 / 共13页
心理学考研-心理统计资料-统计推断的数学基础._第5页
第5页 / 共13页
点击查看更多>>
资源描述

《心理学考研-心理统计资料-统计推断的数学基础.》由会员分享,可在线阅读,更多相关《心理学考研-心理统计资料-统计推断的数学基础.(13页珍藏版)》请在金锄头文库上搜索。

1、 点这里,看更多心理学资料 2017考研已经拉开序幕,很多考生不知道如何选择适合自己的考研复习资料。中公考研辅导老师为考生准备了【心理学考研知识点讲解和习题】,希望可以助考生一臂之力。同时中公考研特为广大学子推出考研集训营、专业课辅导、精品网课、vip1对1等课程,针对每一个科目要点进行深入的指导分析,欢迎各位考生了解咨询。第七章 统计推断的数学基础【本章综述】本章首先介绍推论统计的数学基础概率论,作为学习推断统计的基础;接着重点阐释几种典型的概率分布;最后会介绍抽样的原理与抽样方法。【考点分布】统计推断的数学基础单选多选简答综合总分2007年637452008年5979122009年46,

2、56, 5762010年6522011年57, 59, 6362012年47, 5175112013年49, 5042014年6522015年49, 514【本章框架】【复习建议】第一,概率的基本性质,掌握按照概率的加法和乘法原则进行计算就可以;第二,概率分布是重中之重,必须掌握各个概率分布的特点;第三,抽样原理需要同学们透彻理解的,熟悉每一种抽样方法的特点。根据历年的考点分布情况可知本章绝对是非常重要的章节。第一节 概率1. 概率表明随机事件出现可能性大小的客观指标。概率的定义有两种,即后验概率和先验概率。 先验概率:实验的每一种基本事件是有限的并且每一个基本事件出现的可能性相等。在这种条件

3、下,如果基本事件的总数为n,事件A包括m个基本事件,则事件A的概率为,这种概率称为先验概率。(这种情况下,直接计算的比值,是真实概率而不是估计值) 后验概率:在对随机事件进行n次观测时,其中某一事件A出现的次数m与观测次数n的比值。当n趋向于无穷大时,这个比值将稳定在一个常数P上,记作。随着观测次数无限增大,计算出的概率估计值越趋近真实的概率值,它由事件A出现的次数决定,因此称为后验概率或统计概率。注意:概率值在0,1之间。概率接近1的事件其发生的可能性较大,而概率接近0的事件其发生的可能性较小。然而,概率等于1的某个事件,并不能被断定为必然事件,只能说它出现的可能性非常大。同样,概率等于0的

4、事件,也不能说它就是不可能事件,只能说它出现的可能性非常小,以至接近0。2. 概率的加法定理:两个互不相容的事件A、B之和的概率,等于两个事件概率之和。(互不相容事件是指在一次实验或调查中,若事件A发生则事件B就一定不发生,否则二者为相容事件)3. 概率的乘法定理:两个独立事件同时出现的概率等于这两个事件概率的乘积。(独立事件指的是一个事件的出现对另一个事件的出现不发生影响)4. 概率分布类型概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。概率分布依据不同的标准可以分为不同的类型: 离散分布与连续分布(依据随机变量是否连续)离散分布:离散随机变量的概率分布,最常用的离散分布

5、为二项分布,除此之外还有泊松分布和超几何分布等。连续分布:连续随机变量的概率分布,最常用的连续分布为正态分布,除此之外还有负指数分布和威布尔分布等。 经验分布与理论分布(依据分布函数的来源)经验分布:根据实验或观察所获得的数据而编制的次数分布或相对频率分布,它往往是总体的一个样本。理论分布:有两个含义,一是随机变量概率分布的函数,二是按某种数学模型计算出的总体的次数分布。随机变量概率分布的性质由它的特征数来表达,这些特征数主要有期望值,即理论平均数和方差,即理论的标准差的平方。 基本随机变量分布与抽样分布(依据概率分布所描述的数据特征)心理统计中常用的基本随机变量分布有二项分布与正态分布。抽样

6、分布是样本统计量的理论分布。样本统计量有:平均数、两平均数之差、方差、标准差、相关系数、回归系数、百分比率(或概率)等。统计量是基本随机变量的函数,所以抽样分布又称随机变量函数的分布。第二节 概率分布(一) 正态分布1. 正态分布也称常态分布或常态分配,由棣莫弗1733年发现的。高斯、拉普拉斯各自发现正态分布曲线方程,高斯首次提出正态分布曲线,所以有时也称高斯分布。2. 正态分布特征 正态分布曲线函数(密度函数)式中:是圆周率3.14159;是自然对数的底2.71828;X为随机变量取值,负无穷到正无穷大;为理论平均数;为理论方差; y为概率密度,即正态分布的纵坐标。当X=时,。当=1时,中央

7、点的y最高,即y = 0.3989。 正态分布的特征a. 正态分布的形式是对称的(但对称的不一定是正态分布),它的对称轴是经过平均数点的垂线(平均数、中数和众数三者相等),此点处y值最大。左右不同间距的y值不同,各相当间距的面积相等,y值也相等;b. 正态分布的中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但始终不能与基线相交;c. 正态曲线下的面积为1,由于它在平均数处左右对称,所以过平均数的垂线将正态曲线下的面积划分为相等的两部分,各为0.5(注意:正态分布曲线下各对应的横坐标处与平均数之间的面积可用积分公式计算,

8、这个面积可视为概率,即各横坐标值对应的随机变量值出现的概率);d. 正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。如果平均数相同,标准差不同,这是标准差大的正态分布曲线形式低阔,而标准差小的正态分布曲线形式高狭。所有正态分布都可以通过Z分数公式转换成标准正态分布,=0,=1。e. 在正态分布曲线下,标准差与概率(面积)有一定的数量关系(详听老师课程内容)。3. 正态分布表的使用:依据Z分数求概率p;根据概率p求Z分数;已知概率p或Z分数求概率密度y。4. 次数分布是否为正态分布的检验方法:皮尔逊偏态量数法;峰度、偏度检验法;累加次数曲线法;卡方检验中的吻合

9、度检验等。5. 正态分布理论在测验中的应用: 化等级评定为测量数据; 确定测验题目的难易度; 在能力分组或等级评定时确定人数; 测验分数的正态化; 标准分数与正态分布相结合应用。(二)二项分布1. 二项分布是由贝努里创始的,又叫贝努里分布,它是指试验仅有两种不同性质结果的概率分布,即各个变量都可归为两个不同性质中的一个,两个观测值是对立的,因而二项分布又可说是两个对立事件的概率分布。如考试中的通过与不通过等。2. 二项试验 任何一次试验恰好有两个结果,成功与失败; 共有n次试验,并且n是预先给定的任一正整数; 每次试验各自独立,各次试验之间无相互影响; 某种结果出现的概率在任何一次试验中都是固

10、定的。3. 设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,不出现的概率都是q(等于1-p),则对于某事件出现X次(0,1,2,n)的概率分布为:表示在n次试验中有X次成功,成功的概率为p。X =0,1,2,n为正整数,n和p为二项分布概率函数的两个参数。4. 二项分布的性质 二项分布是离散型分布,概率直方图是跃阶式。因为X为不连续变量,用概率条图表示更合适,用直方图表示只是为了更形象。随着n正大,二项分布接近正态分布; 二项分布的平均数与标准差如果二项分布满足pq, np5 (或pq, np5)时,二项分布接近正态分布。这时二项分布的X变量具有如下的性质:,。5. 二项分

11、布的应用主要解决含有机遇性质的问题(三) 样本平均数的分布中心极限定理:对于任意平均数为,标准差为的总体,样本容量为n的样本平均数分布的平均数为,标准差为。n30或趋于无穷大时,样本平均数的分布趋近于正态分布。注意:在涉及样本统计量的分析时,首先要保证各个样本是独立的,各个样本都服从同样的分布。为了保证这一点,取样方法应该用随机抽样的方法。样本平均数的分布以下是指样本平均数为的分布为正态分布及渐近正态分布的两种情况,凡符合这两种情况的分布,都可以根据正态分布的概率进行统计推论。 总体分布为正态,总体方差已知,样本平均数的分布为正态分布,那么:;为样本平均数分布的平均数;为样本平均数分布的方差,

12、常称之为变异误;为样本平均数分布的标准差,为了与总体的标准差区别开,一般称为标准误或平均数的标准误,也有时用SE表示。 总体分布为非正态,但总体方差已知,这时样本足够大时(n30),其样本平均数的分布为渐近正态分布,那么:样本平均数分布的平均数、标准差和方差与相同。当总体分布为正态,方差未知时,样本平均数的分布为t分布。无限多个样本平均数的平均数就是总体平均数,而平均数分布的标准差与样本本身的标准差有以下关系:(每个样本的标准差不同,故样本平均数分布的标准误也不同,只是的估计值) 当总体分布为非正态而其方差又未知时,若满足n30这一条件,那么样本平均数的分布近似t分布。(四) t分布t分布是统

13、计学者高赛特1908年在以笔名“Student”发表的一篇论文中推导的一种分布,有时也叫学生氏分布,这种分布是一种左右对称、峰态比较高狭,分布形状随样本容量n-1的变化而变化的一族分布。其公式如下:;t分布与无关,而与n-1(自由度)有关,t分布的自由度一般用符号df表示,即n-1。自由度:是指任何变量中可以自由变化的数目,是t分布密度函数中的参数(读nu),它代表t分布中独立随机变量的数目。1. t分布的特点: 平均值为0; 以平均值0左右对称的分布,左侧t为负值,右侧t为正值; 变量取值在; 当样本容量趋于时,t分布为正态分布,方差为1。当n-130以上时,t分布接近正态分布,方差大于1,

14、随着n-1的增大而方差渐趋于1;当n-130时,t分布与正态分布相差较大,随着n-1减少,离散程度越大,分布图的中间变低但尾部变高。2. 当总体分布为正态,方差未知时,样本平均数的分布为t分布。无限多个样本平均数的平均数就是总体平均数,而平均数分布的标准差与样本本身的标准差有以下关系:(每个样本的标准差不同,故样本平均数分布的标准误也不同,只是的估计值)3. 当总体分布为非正态而其方差又未知时,若满足n30这一条件,那么样本平均数的分布近似t分布。(五)c2分布1. c2分布是刻画正态变量二次型的一种重要分布。无限多个n个随机变量平方和或标准分数的平方和的分布,即为c2分布。c2(n)如果正态

15、总体的平均数未知,若用样本平均数作为的估计值时:c2(n-1)2.c2分布的特点: c2分布是一个正偏态分布,随着样本容量n的大小变化,其分布曲线的形状不同,n或n-1越小,分布越偏斜。df很大时,接近正态分布,可见c2分布也是一族分布; c2值都是正值; c2分布具有可加性; 如果df2,这时c2分布的平均数:,方差; c2分布是连续型分布,但有些离散型的分布也近似c2分布。3.c2分布在统计分析中应用于计数数据的假设检验以及样本方差与总体方差差异是否显著的检验等。(六)F分布1.设有两个正态分布的总体,其平均数与方差分别为:、及、,从这两个总体中分别随机抽取容量为n1及n2的样本,每个样本都可计算出c2值,这样可得到无限多个c12与c22,每个c2随机变量各除以对应的自由

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号