社会统计学(第一讲)

上传人:今*** 文档编号:106837370 上传时间:2019-10-16 格式:PPT 页数:44 大小:1.67MB
返回 下载 相关 举报
社会统计学(第一讲)_第1页
第1页 / 共44页
社会统计学(第一讲)_第2页
第2页 / 共44页
社会统计学(第一讲)_第3页
第3页 / 共44页
社会统计学(第一讲)_第4页
第4页 / 共44页
社会统计学(第一讲)_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《社会统计学(第一讲)》由会员分享,可在线阅读,更多相关《社会统计学(第一讲)(44页珍藏版)》请在金锄头文库上搜索。

1、社 会 统 计 学 ( Social Statistics ),引子:在学统计学之前,我们需要了解,为什么要学统计学? 统计学是什么? 如何学习统计学?,科学只有当它利用了数学的时候,它才达到了完善的程度。 马克思 对于追求效率的公民而言,统计思维总有一天会和读写能力一样必要。 H.G.Wells 社会统计学是社会学十门必修课中的一门,它与“社会学调查研究方法”结合起来,完整的介绍了当代社会调查研究的科学方法与资料处理技术。社会统计学侧重于介绍资料的收集、整理、分析和推论的处理技术。,社会统计学的发展,统计学的两大流派:数理统计学派和社会统计学派,数理统计学派的原创始人是比利时的A 凯特靳,

2、其最大的贡献就是将法国的古典概率引入统计 学,用纯数学的方法对社会现象进行研究;,社会统计学派的首倡者是德国的K克尼斯,他 认为统计研究的对象是社会现象,研究方法为 大量观察法。,社会统计学的两大流派,社会指标学派,描述统计学派,统计学是什么?概念与内涵,统计学是描述一系列可用于描述、整理和解释资料或数据的统计工具 和技术。 社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法与技术。,统计学的基本分类:描述统计与推断统计,描述统计(Descriptive Statistics):用于整理、描述所收集的数 据的特征,推论统计(Inferential St

3、atistics):利用较小群体的数据(样本)来 推论可能的较大群体(总体), 通过推论统计,我们可以解释数据。,社会统计的方法,1.大量观察法 所谓大量观察,即是就总体中足够多的单位进行调查和 综合分析,用以反映社会总体 的数量特征。,2.大数规律 随机现象出现的基本规律,其一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。,所谓描述统计就是讨论范围仅以搜集资料本身为限,而不予以扩大。,所谓推论统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。,假设检验,参数估计,社会统计工作的程序,制

4、定 计 划,统计调查,统计整理,统计分析,统计报告,如何学习统计学?,树立信心 培养兴趣 由浅入深,逐步推进。,仔细阅读你的教材 按时完成练习。,多多留意报刊、杂志甚至学术期刊上的统计实例。,多多使用统计软件练习数据分析。,第一章 社会学研究与统计分析,第一节 社会学研究的科学性,案例:在校大学生的恋爱行为是否存在性别差异? 谁更需要爱情?男生还是女生?,事实上,社会调查与统计推论是大多数“社会科学”之所以称之为 “科学” 的基石!,概念(Concept):人们对事物本质的认识,是研究的基本单位,具有抽象性。,定义(Definition):将概念呈现、描述出来,从而明确认识对象。,操作化定义(

5、Operational definition):用一系列可以观察、可以测量的指标来模拟或表述定义,使得非量化的概念得以运算并得以操作测量。,开始学习社会统计学之前的知识储备,什么是变量? 变量有哪些层次? 不同类型变量的统计表制作方法?,总体与单位,所谓总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。总体也有人称之为母体。 构成总体的每一个个体称为总体单位,简称单位,也称为个体。,有限总体与无限总体,可加总体与不可加总体,总体在抽样调查及推论统计中,还引出了它与样本总体这个概念的联系与区别。推论统计有“部分推断总体”的特征。通过抽样得到的用以推断总体特征的那个“部分”,在统计学上

6、称为样本或样本总体。样本中所含的单位数,在统计学上称为样本大小,也叫做样本容量。从总体抽选出样本的过程叫抽样,也有叫取样的。,二者是互为存在条件地联结在一起的,二者的地位在某种意义上不是固定不变的。 1、相互依存关系。 2、当研究目的和研究范围变动,总体和个体可以相互转化。,总体的特征: 大量性、同质性和差异性。总体的这三个特征是缺一不可的。 大量性是条件、同质性是基础,差异性是前提。,样本 样本是从总体中抽取的一部分个体所组成的集合,也称子样。 样本容量是指样本所包含的个体数。当样本容量大于30时,为大样本。 样本个数是指从总体中最多可以抽取的不同样本的套数。样本容量用n表示。样本个数用m表

7、示。,总体与样本的关系 1、总体是所要研究的对象,而样本则是所要观测的对象。 2、样本是用来推断总体的。 3、总体和样本的角色是可以改变的。 4、总体与样本都有大量性,同质性和差异性的特征。样本容量用n表示。样本个数用m表示。,变量(Variables)在统计学中表示研究对象的特征,变量下的各种表现形式或不同取值,就是变量值。,变量,变量取值时注意的问题: 完备性 互斥性,单变量分析变量的分布(frequency distribution),分布某个变量的变量值出现的次数或频次,也称频次分布。,例:家庭结构(变量X)可能的取值包括: X1由父母和未婚子女组成的核心家庭 X2由父母和单一已婚子女

8、组成的三代人家庭,即主 干家庭 X3由父母和多对已婚子女所组成的三代人家庭,即 联合家庭,如果我们将调查结果按照被访人的回答,分别归入上述三类,于是有以下三对数据: (X1 ,n1) (X2,n2) (X3,n3) (Xk,nk),其中Xi表示变量X的第i个取值; ni表示该取值所对应的次数 所谓分布,实际上就是这些对数据的集合。,当n代表不同的含义时,表示不同的分布 如: 当n表示概率时,称作概率分布 当n表示频次时,称作频次分布 当n表示百分比时,称作频率或相对频次分布,家庭结构的频次分布 (XX地,XX年XX月),家庭结构的百分比分布 (XX地,XX年XX月,N=2130),0.00 0

9、.01 0.04 0.12 0.21 0.25 0.21 0.12 0.04 0.01 0.00,抛10次硬币正面出现次数的概率分布,第二节 社会调查资料的特点和统计学的运用,一、社会调查资料的特点: (一)随机性 确定性现象:“若A,则必有B”,A与B之间,存在确定性的函数关系。 非确定性现象:若A,则可能有B,或者C;D;E。,f(A),B,A, , , , , , , ,B,A,(二)统计规律性 表面杂乱无章的随机现象,实际上是有内在规律性的。统计规律性表现为大量观察或试验中随机事件发生的频率的稳定性,即一个随机事件发生的频率经常在某个定值附近摆动,而且,试验次数越多,一般摆动越少。,二

10、、统计学的运用 介绍有关社会调查资料收集、整理、分析和推论的统计方法。 社会统计学的特点: 抽象概念向操作化定义,设计好调查问卷; 被测量对象是人,主观意识影响资料收集; 低层次变量占较大比重。 三、统计分析的作用及主要内容 统计分析在社会调查研究中的功用, 主要表现在经验层次的大面积数据处理方面。 统计结果不能轻率的作出因果的结论。 例:(P15-表1-10和表1-11),统计分析内容主要分为: 统计描述和统计推论,第三节 怎样选用统计分析方法,一、全面调查和非全面调查 全面调查是对所研究全部对象进行观察与调查,从而掌握整个单位的全部资料。对全面调查,一般可用统计描述。统计描述是将所观察的数

11、据、资料,进行整理、归纳和分析,以期找到某种规律。 非全面调查是在全部研究对象中只调查其中的一部分。在非全面调查中,以概率抽样法最重要。 抽样调查是在一定条件下,科学、客观的抽取总体中一部分单位来加以研究,其目的是获得对于总体性质的正确叙述。,二、单变量和多变量 单变量主要调查的内容是一个或多个相互独立的概念,需要对每个独立的变量研究其变动情况和频次,及集中和分散的特征。 二变量研究两个变量之间是否存在关系及关系密切程度,及研究结论是否可以推断整体。 多变量研究多种关系,一因多果和一果多因。,单变量分析变量的分布(frequency distribution),分布某个变量的变量值出现的次数或

12、频次,也称频次分布。,例:家庭结构(变量X)可能的取值包括: X1由父母和未婚子女组成的核心家庭 X2由父母和单一已婚子女组成的三代人家庭,即主 干家庭 X3由父母和多对已婚子女所组成的三代人家庭,即 联合家庭,两变量关系命题的研究,两个变量之间是否存在关系?关系的密切程度(强度)如何?,自变量(independent variable):也叫独立变量,由研究者主动操纵,或被研究者界定为不受其他变量影响,独立变化的变量。,因变量(dependent variable):也叫依变量,指受其他变量影响,随其他变量变化的变量。,自变量与因变量是就因果关系而言的,判断自变量与因变量的标准: (1)时间

13、的先后。由于后发生者无法影响先发生者,所以先发生者是自变量; (2)变量的不变性与可变性。在社会研究中常将一些具有固定性、持久性的变量作为自变量。,对于多变量的研究,情况更为复杂,它们除了两两之间可能存在联系,而且还可能存在网状、链状、一因多果或一果多因等多种联系,这些都属于更高层次的统计技巧。,1、定类层次变量(Nominal Variable): 变量取值只有类别属性之分,根据变量值,只能知道研究对象是相同或是不同。从数学运算特征来看,只具有等于或不等于(=、)的性质。例如:性别。,变量层次,2、定序层次变量(Ordinal Variable): 变量取值除了有类别属性之外,还有等级,次序

14、的差别,其数学特性除了(=、)之外,还有大于或小于()之分。例如文化程度、社会经济地位等。,2011中国大学排行榜,3、定距层次变量(Interval Variable):变量取值除了有类别、次序属性之外,取值之间的距离还可以用标准化的距离去量度。其数学特性除了(=、;)之外,还可以进行加或减(+,-)。例如智商。,4、定比层次变量(Ratio Variable):变量取值除了有上述三种属性之外,其取值还可以构成一个有意义的比率,其数学特性除了(=、;+,-)之外,还可以进行除法运算。例如年龄。定比变量和定距变量的差别在于前者有一个真正有意义的零点。,1、高层次的变量包含低层次变量的数学特征。

15、,变量层次的比较,2、在社会学研究中,一般不区分定距和定比变量,而是当作一类,称作定距变量。,4、变量的层次与社会实际衡量之间有可能存在着差距或不一致性。,5、根据研究内容不同,变量的层次也可能不同,3、一个变量的层次并不是唯一的。高层次的变量可以作为低层次变量来使用,但是会使资料的信息使用不完全。,统计分析,全面调查,多变量,单变量,定 距,定 序,定 类,定 距,定 序,定 类,抽样调查,其他非概 率抽样,多变量,定 距,定 序,定 类,单变量,定 距,定 序,定 类,统计描述,统计推论,应用如何制作不同类型的单变量统计表?,1、定类单变量统计表,表1:微博用户的性别统计表 (N=4306

16、),(资料来源:SSI在线样本库,调查地包括北京、上海、广州、深圳、成都、沈阳、西安、杭州八市),表头,表号,标识行,主体行,表尾,2、定序单变量统计表,表2:微博用户的教育程度统计 (N=4306),(资料来源:SSI在线样本库,调查地包括北京、上海、广州、深圳、成都、沈阳、西安、杭州八市),3、定距和定比单变量统计表,定距和定比变量的两种类型: 离散型变量取值为有限个或列为有限个,如子女数 连续型变量取值为有限或无限区间内的任意实数,即变量的取值 连续,如身高,若变量为离散型变量,且取值相对较少,可以按照定类或定序统计表方式统计频次或百分比。 若变量为连续型变量,则需要将变量值分为若干个区间或组,统计每一个组内

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号