卢淑华 《社会统计学》讲义

上传人:豆浆 文档编号:47189741 上传时间:2018-06-30 格式:PDF 页数:51 大小:1.52MB
返回 下载 相关 举报
卢淑华 《社会统计学》讲义_第1页
第1页 / 共51页
卢淑华 《社会统计学》讲义_第2页
第2页 / 共51页
卢淑华 《社会统计学》讲义_第3页
第3页 / 共51页
卢淑华 《社会统计学》讲义_第4页
第4页 / 共51页
卢淑华 《社会统计学》讲义_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《卢淑华 《社会统计学》讲义》由会员分享,可在线阅读,更多相关《卢淑华 《社会统计学》讲义(51页珍藏版)》请在金锄头文库上搜索。

1、 1 社会统计学社会统计学讲义讲义 第一章第一章 导论导论 一、社会统计学一、社会统计学 1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推 断的一种专门方法和技术。 研究对象:概括而言是指社会现象的数量方面。 2、选择统计分析方法的原则原则是根据研究目的和资料本身的特点选择。 3、统计分析的作用作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地 分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能) ;(3)可通过样本资 料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这 种推论的把握有多大) 。

2、4、社会统计的基本程序 (1)制定计划; (2)统计调查; (3)统计整理; (4)统计分析; (5)统计报告。 5、几个基本概念 (1)总体与单位 总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。构成总体的 每一个个体称为总体单位,简称单位或个体。3 个基本特征:大量性、同质性和变异性。 (2)标志与变量 总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称 为标志,分为数量标志和品质标志。 可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我 们称之为变量。 (3)指标与指标体系 统计指标是反映总体(或样本总体)的数量

3、特征的概念或范畴。一个完整的统计指标由两部 分构成:指标名称和指标数值。 在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系 的并与之相适应的指标来完整地反映对象总体。指标体系就是一系列有内在联系的统计指标 的集合体。 二、社会调查研究的程序二、社会调查研究的程序 社会学研究之阶段与步骤社会学研究之阶段与步骤 (1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代 感、为国家现代化服务; (2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探2 索性研究; (3)提出一定的想法和建立假设:差异式、函数式; (4)建

4、立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具 有多值性; (5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由 答题式; (6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正; (7)调查实施(抽样调查) :从局部推论到全体 (8)校核与登录 (9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实, 在此基础上对研究内容提出建议和确定进一步的研究方案。 科学研究方法科学研究方法 抽象层抽象层 概念概念 命题命题 理论理论 经验层经验层 研 究 设 计研 究 设 计原则原则 观察 测定 测定 量度 分析 分析 数据数

5、据 搜集 使用计算机对数据记录 储存、管理与分析 三、社会调查研究的特点和统计学的运用三、社会调查研究的特点和统计学的运用 1、社会调查资料的特点特点:随机性、统计规律性 2、统计学的运用运用:以概率论为基础的数理统计学 理论、假设、操作化是统计分析的前提。作用主要表现在经验层次的大面积数据处理方面。 资料分析前要注意使用统计分析的前提是否满足:资料的信度和效度;资料收集的科学 性;资料在总体中的分布是否满足统计分析的要求 etc. 3、统计分析的内容:统计描述和统计推论 在统计描述中,主要有资料的整理、分类和简化成特征研究;在统计推论中,主要有参数估 计、假设检验、回归、列联、方差、等级相关

6、等统计技术。 四、选用统计分析方法四、选用统计分析方法 1、全面调查与非全面调查、全面调查与非全面调查 抽样调查就是在一定条件下,不是抽取总体的全部单位,而是科学、客观的抽取总体中的 一部分单位来加以研究,其目的是获得对于总体性质的正确叙述。对全面调查一般采用统计 描述,是将所观察的数据、资料进行整理、归纳和分析,以期找出某种规律。常用的方法有 次数(频次)分布、统计图、统计表、集中趋势测量、离散趋势测量、相关等。 根据统计资料的统计规律性,运用概率论,正确的从局部推论到总体,这种根据不完全数 据对总体做出正确推论的方法称作统计推论,又称统计归纳。 2、单变量和多变量、单变量和多变量 3、变量

7、变量层次层次 数学运算特性数学运算特性 定类定类 定序定序 定距定距 定比定比 =, ,中位数众数;而在负偏态时则相反,有平均数 Yj,则 称这一配对是异序对。同样,异序对只要求 X 变化方向和 Y 变化方向相同,并不要求 X 变化 大小和 Y 变化大小相等。异序对的总数用符号nd表示。 如果在 X 序列中,我们观察到 Xi= Xj,则这个配对为 X 同分对,用符号xT表示。如果在 Y 序列中,我们观察到iYjY,则称这个配对为 Y 同分对,Y 同分对的总数用符号yT表示。如果我们观察到Xi= Xj时,也观察到iYjY,则称这两个配对为 X 与 Y 同分对,以xyT代表。 对于列联表的资料,计

8、算同序对要用“右下余子式”法;计算异序对要用 “左下余子式”法。 五种不同配对的总的数目是xyyxdsTTTNNT)(总对数。 同序对和异序对数量之差反映了等级相关的程度。 () = + G 系数的取值范围:1, + 1 G 系数具有 PRE 性质: PRE= (+) (+)= () (+)=+ G 系数的检验: 原假设H0:=0(总体等级相关为 0) 备择假设H1:0 统计量 Z=+N(0,1) (n10,n 越大,Z 越趋近于 N(0,1)) G 系数由于不考虑同分对,同分对在相关中的影响没有计及。 (3)肯氏肯氏系数系列系数系列 a(一般式) 11 数据中全是同序对时,a=1;全是异序对

9、时,a=-1。取值范围是1, + 1。 = ( )b(修正式) 当出现同分对时,分母作如下修正: 参见卢书 P.326 = ( ) ( ) b的检验: 当样本容量 n10 时,原假设H0:=0(总体为 0)成立的条件下,n=ns nd近似的 满足标准正态分布 N(0,n2) n N(0,) 其中方差=( )( + ),统计量 Z=,与Z2进行比较并作出结论。 c 当同分对很多的情况下,先做等级的列联表,m=min(r,c)(m 为 r*c 等级列联表中 r 和 c 值 中较小者) = ( )/ (4)d 系数系数 d 系数对等级相关的分母做了两个方向上的修正,给出了dyx和dxy两个系数。 =

10、 + + = + + ny表示仅在 y 方向上的同分对,nx表示仅在 x 方向上的同分对。二者都不包括 x 和 y 方向同时同分的对数。 对 s=ns nd的检验: 原假设H0:s=0(总体) 备择假设H1:s0(总体) 统计量 =N(0,1) 式中= | ()() = +()+()() 其中 n 为样本容量;r,c 为行数和列数; A2:x 边缘分布中,每 2 个频次乘积之和 B2:y 边缘分布中,每 2 个频次乘积之和 A3:x 边缘分布中,每 2 个频次乘积之和 B3:y 边缘分布中,每 2 个频次乘积之和 3、定距、定距-定距(线性相关)定距(线性相关) 12 定距-定距变量的相关关系

11、有可能是线性,也有可能是非线性。线性相关系数 r 用以度量线性 相关关系的强度。 (1)变量 x 和变量 y 不存在线性相关关系则( )( )=0,表示观测点均匀分散 在 4 个象限;反之则( )( )=0,表示变量间存在线性关系。其数值(绝对值) 越大,表示线性相关关系越大,其乘积对样本容量的平均值,就称作协方差。 Cov(x,y)=( )( )表示 x 和 y 两变量观测值相对其各自均值所造成的共同平均偏差。 (2)将变量标准化变量标准化,在求其乘积的平均,就可以进行比较。( )( )=就是相关系数 r。对于总体数据,r 为( )( )=。 相关系数就是标准化了的协方差,在数值上等于协方差

12、除以各自标准差的乘积,取值范围为1, + 1。 =( )( ) ( )( )(3)相关系数的相关系数的 PRE 性质性质 PRE=( )( )( )=PRE 又称判定系数r2,故=,其中 RSSR=,TSS= 判定系数r2表示当知道 x 和 y 有线性相关关系后,可以改善的预测程度,或用 x 解释掉 y 的误差的大小。 = = ( )( ) ( )( ) = () () = r系数与b系数不同的地方, 是r系数假定x与y的关系是对称的, 而r的统计值为1, + 1, 同时 r 的平方值具有削减误差比例的性质,此r2值为决定系数。 相关系数受变量值取值范围的影响很大。相关系数不因坐标原点的改变或单位的变化而变 化(故数据值若较大,可减去一个常数;若过小可以扩大一个倍数,其相关系数不变) 。 (4)相关系数的检验相关系数的检验 原假设H0:=0(总体相关系数为 0) 备择假设H1:0 统计量 = ( )满足自由度为 k=n-2 的 t 分布 给出显著性水平 和 k=n-2,查相关系数检验表得出临界相关系数 若|r|,则 x 与 y 存在线性相关关系,r 在显著性水平 下显著;反之则不存在线性相关 关系,r 在显著性水平 不下显著。 (5)相关系数)相关系数 r 检验与回归系数检验与回归系数 检验的关系检验的关系 13 确认总体线性相关关系存在,也就是确认配置线性回

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号