社会研究方法复习提纲y.doc

资源描述

《社会研究方法复习提纲y.doc》由会员分享，可在线阅读，更多相关《社会研究方法复习提纲y.doc（7页珍藏版）》请在金锄头文库上搜索。

1、社会研究方法复习提纲第一章统计基础一、测量1、测量的概念史蒂文斯：测量就是依据某种法则给物体安排数字测量：就是根据一定的法则，将某种物体或现象所具有的属性或特征用数字或符号表示出来的过程2、测量的分类（按测量水平划分）定类：观测或研究对象的特征从测量的角度只能分为几个不同的类别，而且类与类之间相互排除。（对称性和传递性）定序：研究对象的特征不仅可以区分为几个不同的类，而且类与类之间有高低顺序之分，当然，类与类之间相互排除。（传递性）定距：研究对象的特征不仅可以分类排序，而且可以建立物理的量度单位，但“0”点是人为规定的。定比：研究对象的特征不仅可以分类排序，而且可以建立物理的量度单位，且有自

2、然“0”点。3、测量的评估标准（1）效度的分类效度的概念：测量的有效度或准确度。指测量工具或手段能够准确测出所要测量的概念的程度，或者说能够准确、真实地度量事物属性的程度。内容效度：又称取样效度（sampling validity）或逻辑效度（logica1 validity），是指测量是否能够准确地测到要测量的内容或行为领域准则效度：准则效度又称为实证效度（empirica1 validity）：在统计上，准则效度是指借助于有效的测量标准（效标）对测量的有效性进行评价。准则关联效度又可细分为同时效度（concurrent validity）和预测效度（predictive validity）

3、两类，它们都表示了评估结果与外在标准之间的一致性，二者之间的主要差异在于评估的目的和外在标准的搜集时间不同建构效度：建构效度又理论效度度（empirica1 validity）：建构效度就是指该测量的测量结果是否符合由理论所衍生出来的假设，考察建构效度就是要了解测量工具是否反映了概念和命题的内部结构建构效度又包括两个类型：收敛效度（convergent validity）：区别效度（discriminant validity）此种效度也称之为分歧效度（divergent validity）。表面效度：表面效度是指测量结果的相关者使用者及一般大众对于测量的相关方面所作的主观判断，判断该测量能否达

4、成预期目的。一个具有高表面效度的测量比低表面效度的测量更能赢得测量相关者的配合，减少对测量公平性的抱怨，也更能使得一些决策者、雇主或官员信服并愿意采用该测量（2）信度与效度的关系信度：指测量的可靠性，包含测量值的稳定性与测量内容的一致性。测量值的稳定性是指同一测量经多次施测所得测量值的一致性程度，一致性程度越高稳定性越高。测量内容的一致性指各个测量在功能或性质上是属于同类或趋近于同类。信度与效度的关系：（1）信度低，效度不可能高。因为如果测量的数据不准确，也并不能有效地说明所研究的对象（2）信度高，效度未必高。例如，如果我们准确地测量出某人的经济收入，也未必能够说明他的消费水平。（3）效

5、度低，信度很可能高。例如，即是一项研究未能说明社会流动的原因，但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。（4）效度高，信度也必然高。二、概率1、主观概率：主观概率是观测者对系统出现某个状态的相信程度。2、主观概率与客观概率相比的性质：连通性： or or 传递性： AB,BC,则AC变量的测量类型和包含的信息（定类、定序、定距、定比）一、一致性：所有概率发生的和为1.三、随机变量描述中心趋势的统计量1、中心趋势的测度是用一个数或数值来代表一组数据的平均数2、（1）均值：指一组数据的算术平均数均值的特征：一组数据中的每一个数据都参与均值的计算每一组数据有且仅

6、有一个均值均值可能不是变量的一个实际值奇异值（outlier)会对均值产生非均衡干扰并因此影响到均值的代表性（2）中位数(Median) ：指一组数据按大小顺序排列后位居最中间的一个数值中位数的特征：中位数不受奇异值的影响。最多只有中间两项决定中位数。如果各个数据不是集中在中位数附近，则中位数也不是该组数据中心趋势的一个优良测度。中位数通常表现为实际存在的数据。（3）众数 (Mode) ：指一组数据中出现次数最多的那个数值众数的特征：众数不一定是“中心”或者在中间数的附近一组数据可以没有众数也可以有一个以上的众数只有定类和定序测度的变量众数才是有用的集中趋势的测度3、中心趋势的测度层次

7、均值适合定距和定比水平的变量中位数适合定序、定距、定比水平的变量众数适合定类、定序、定距、定比水平的变量4、均值与中位数的比较：均值受奇异值的影响，而中位数则不受奇异值的影响。四、离散程度的度量离散程度是指数据在均值附近聚集或离散的程度1、全距（Range）：又称极差，是一组数据中最大值与最小值的差。2、方差(Variance)：是数据与均值的离差的平方的平均数标准差：方差的特征：若一组观测数据中的每个观测值都加上常数，则方差不变。用公式表示：一组观测数据中的每个观测值都乘以常数a，则方差为原方差的a2倍，用公式表示:(数据与均值的偏离；方差越大越离散，越小越集中)3、变异系数（Coe

8、fficient of Variation）标准差/平均值，表示离散程度时，无附加条件了（变异系数大，方差大）4、数据的标准化：最大值标准化（每个观测值除以该组观测值中的最大值）极差标准化（每个观测值除以该组数据的极差或组距。用于绩效评估）标准差标准化：指原始数据偏离平均值多少个标准差 ( )第二章参数估计与假设检验一、假设检验的基本概念1、普适概念：关于总体分布或总体参数的推测、论断、假定或设想统称为统计假设，简称假设。依据一定统计规律和程序由样本推断所作假设是否成立的过程称为假设检验。假设检验就是研究者对随机波动是否足够大到能够影响结果的准确性作出判断。2、两种类型的假设原假设（nul

9、l hypothesis）用表示，又称零假设或统计假设，是被检验的假设。备择假设（Alternative hypothesis）用表示，又称对立假设或研究假设，它是在原假设被拒绝时准备接受的假设，它通常是原假设的对立。3、两种类型的错误第一类错误：原假设成立而我们错误地拒绝它。犯第一类错误的概率记作（假设检验的显著性水平）第二类错误：原假设不成立而我们错误地接受它。犯第二类错误的概率，记作二、假设检验所依据的基本原理（实际推断原理或小概率原理）假设检验所依据的基本原理：小概率事件在一次实验中不大可能发生，如果在一次实验中出现了，则有足够的理由怀疑原来对事件提出的假设。该原理称为小概

10、率原理或实际推断原理。它是根据具体问题的要求，规定可以容忍的“充分小”的（）把概率不大于的事件认为是实际不可能的事件。称为统计显著性水平，它是实际不可能出现事件出现的概率的上界，又称为检验有意义的水平。三、检验结果的实际意义检验偏向原假设，歧视备则假设。用假设检验来说明某个结论：建立原假设的原则是将该结论不成立设为原假设。对于决策问题：建立原假设的原则是使第一类错误比第二类错误更为严重。 (原假设与备择假设的地位是不平等的，小概率事件发生时才拒绝原假设，原假设是受保护的，如小概率时间不发生，则接受原假设，但接受原假设不一定代表原假设是正确的)四、一致性检验基本原理：几个样本，就某一

11、特征而言是否来自同一总体，或就检验者感兴趣的的特征而言，这几个样本来自的总体是否具有一致性。有几个样本，这一特征就有几个分类，设共有个样本，即个分类，每个样本容量分别为，而每个样本中，检验特征出现的频数分别为，则个样本联合后，检验特征出现的频率（相对频数）为五、独立性检验：变量A和B是否相互独立 H0：两个变量相互独立Sig. 拒绝原假设第三章 Chi-square 检验一、卡方检验适用条件一、对分类变量或只有有限个取值的离散变量的分布形式进行检验，是非参数检验的一种。二、卡方检验是非参数检验定类、定序T检验是参数检验（必须服从正态分布才能用）总体为参数，样本为统计量第四章回归

12、分析一、O. L. S(普通最小二乘)的基本思想不能使所有点误差都为0，但可以使所有点的误差的平方和具有最小值，这条直线就是要求的O.L.S下的标准回归线。二、回归系数的假设检验（原假设是什么？接受原假设意味着什么？）对于回归方程：其回归系数的假设检验：（原假设）（备择假设）如果接受原假设，则检验统计量服从自由度为（n-2）的t分布，即三、回归模型的假设检验（原假设是什么？接受原假设意味着什么？）一元线性回归模型的假设检验实际上是检验因变量Y关于自变量X的回归是否线性。原假设：备择假设：其中：（残差平方和）（回归平方和）其中：如果接受原假设，统计量服从第一自由度为p（自变量个数）、第

13、二自由度为（N-p-1）（N为样本容量）的F分布。四、拟合优度R Square的含义R2说明了通过样本信息得到的回归直线对样本点的拟合情况，当用它来说明通过样本的估计模型对总体数据的拟合情况时，需对其进行修正。修正后的拟合优度为：其中p为自变量的个数，对于一元线性回归p=1。对于总体而言，Ra2比R2能更好地说明模型对数据的拟合情况。拟合优度的含义：直线或模型概括或拟合数据的程度。与距离观测点较远的直线相比，经过或更接近观测点的回归直线能更好地拟合数据。五、标准回归系数（标准回归系数的作用是什么？）（标准回归系数）标准回归系数的作用：标准回归系数的绝对值愈大，说明自变量对因变量的影响愈大。

14、（消除了因变量y和自变量x1，x2，xn所取单位的影响之后的回归系数，其绝对值的大小直接反映了xi对y的影响程度。标准回归系数的绝对值愈大，说明该自变量对因变量的影响愈大。）六、名义和有序变量的应用（能否作因变量？能否作自变量？如果能如何处理？）名义和有序变量作为因变量不适宜，作为自变量是可以接受的，但是在使用之前前必须将其转换为虚拟变量。（但定类不能做因变量，定序变量也不能直接做因变量，但当变量表示的分类数（变量取值的个数）足够多时，可以考虑使用最小二乖估计的线性回归分析技术。定类和定序变量能做自变量，做自变量转换成虚拟变量，或者将定序变量等同于测量型变量处理。）七、回归结果的解释书P85页，看懂3个表和下面的结果的解释。注意sig. 的规范表述模型概括中给出模型的修正拟合优度为0.874，所有自变量的联合可以解释因变量变异的87.4%。由于分析的结果可知：对模型进行F检验的观测显著性水

展开阅读全文