社会统计学与spss应用

上传人:小** 文档编号:92302717 上传时间:2019-07-08 格式:PPT 页数:393 大小:6.29MB
返回 下载 相关 举报
社会统计学与spss应用_第1页
第1页 / 共393页
社会统计学与spss应用_第2页
第2页 / 共393页
社会统计学与spss应用_第3页
第3页 / 共393页
社会统计学与spss应用_第4页
第4页 / 共393页
社会统计学与spss应用_第5页
第5页 / 共393页
点击查看更多>>
资源描述

《社会统计学与spss应用》由会员分享,可在线阅读,更多相关《社会统计学与spss应用(393页珍藏版)》请在金锄头文库上搜索。

1、主讲人:石 伟 Email:,社 会 统计学 & SPSS应用,除了上帝,任何人都必须用数据来说话。 美国谚语,统计的思维方法,就像读和写的能力一样,有一天会成为效率公民的必备能力。 英国学者威尔斯,我在课堂上曾一再对戏剧理论专业的学生说,与其玩弄几个空泛的理论概念,不如认真做一点观众调查。理论探讨应该面对着一批切实可行的调查数据进行。这些调查所得的数据即使很粗糙、很不准确,总比脱离实际的词汇之争有意思得多。,观众的反应当然并非艺术的准绳,因此又需要对调查结果进行理性处理,理论家的思辩能力仍然大有用武之地。十六世纪后期的丹麦天文学家第谷(Tycho Brahe)观察天象三十年积累了大量的天文资

2、料,他的助手开普勒(Johannes Kepler)运用数学方法对这一大,堆资料进行理论处理,终于发现了行星运动三定律。我们目前对剧场里的观众反应进行调查,也不仅仅为了票房的盈亏和剧目的轮换,而是面向着审美心理规律的透彻揭示,就像开普勒那样。 余秋雨:戏剧审美心理学,第一章 绪论,一、什么是统计学 统计学是一门研究如何搜集、整理、分析和展示数据的方法科学,其目的是探索数据的内在规律性,以达到对客观事物的科学认识。,数据搜集:例如,调查与实验等 数据整理:例如,分组、排序等 数据分析:例如,平均数、标准差、t检验、方差分析、回归分析等 数据展示:例如,图和表等,二、什么是社会统计学,三、社会统计

3、学的作用 描述统计(descriptive statistics):通过对搜集到的数据的整理与分析,以表、图和各种代表量的形式来描述数据的特征,找出数据的基本规律。,推断统计(inferential statistics):通过对样本数据的统计分析,在一定可靠程度上推测相应的总体的数据特征及规律。,四、SPSS简介及数据编码录入 简介 Statistical Package for Social Science Statistical Program for Social Science Statistical Product & Service Solutions Predictive An

4、alytics Software (PASW, 2009) IBM SPSS Statistics 19,http:/ http:/ http:/bbs.pinggu.org/forum-65-1.html,金融行业 电信行业 政府行业 教育行业 ,客户分析 市场细分 市场调查 市场预测 新产品开发 满意度调查 信用度分析 ,数据录入,问题1:您认为打工的外地人对重庆市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,答案,问题2:您有几个儿子?几个女儿? 1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1的值,变量2的值,2,3,10001

5、1,采用文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。,采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。,例题:某系甲、乙两班同学的性别及统计成绩如下:,测量水平,定类水平,定序水平,定距水平,定比水平,五、数据的测量水平,定类水平(nominal level) 计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类别穷尽和互斥的要求 数据表现为“类别” 具有或的数学特性,定序水平(ordinal

6、level) 对事物分类的同时给出各类别的顺序,数据表现为有序的类别。 比定类水平精确 不能测量出类别之间的准确差值 具有或的数学特性,定距水平(interval level) 具有定类水平和定序水平的性质 数据直接表现为“数值”,不用赋值 具有或的数学特性 可以转变为定序尺度和定类尺度 比定序尺度精确 没有绝对零点,定比水平(ratio level) 有绝对零点 具有定距水平的性质 具有或的数学特性,四种计量尺度的比较,第二章 单变量描述统计,分布、统计表、统计图,集中趋势测量法,离散趋势测量法,第一节 分布、统计表、统计图,一、分布(distribution)的概念,一个变量的各个取值出现

7、的次数或频次,又叫频次分布。 例:家庭结构(X)为,可取3个值: X1核心家庭 X2直系家庭 X3联合家庭 于是有:,(X1, n1) (X2, n2) (X3, n3),分布的一般形式:,当n表示频次时,以上变量值频次对的集合称作频次分布。 当n表示百分比时,以上变量值百分比对的集合称作百分比分布,又称频率或相对频次分布。 当n表示概率时,以上变量值概率对的集合称作概率分布。,二、统计表 以表格的形式来表示变量的分布。 (一)定类变量,注意事项: 百分比统计表必须注明统计总数。 统计表的组成要素:表号、表头(标题等)、标识行、主体行、表尾(资料来源等)。 满足互斥性要求 百分比总和可以为10

8、0.1或99.9,若要保证为100,则改变频次最多项的数字。,(二)定序变量 定序变量的统计表的内容、制作方法与定类变量相同,不同的是定序变量的取值需按顺序排列。,(三)定距、定比变量 离散型变量(如家庭人数等) 连续型变量(如身高等) 对于变量值较少的离散型变量,其制表方法同定序变量的制表方法。,例:某生产车间50名工人日加工零件数(单位:个)如下,试做频数分布表。,对于连续型变量或变量值较多的离散型变量,分组计算频次。 组距:每组的上限与下限之差。对于等组距分组,其计算公式为: i全距/组数 组限:每组的起止范围。每组的最低值为下限,最高值为上限。,例:下表是100个同龄儿童的身高数据,试

9、作频次分布统计表。,练习,例:某生产车间50名工人日加工零件数(单位:个)如下,试做分组(7组)频数分布表。,三、统计图 以图形的形式来表示变量的分布。 1. 定类、定序变量:Pie图(饼图)、bar图(条形图) Pie图的SPSS演示 bar图的SPSS演示,练习,评价下面的统计表是否有误,为什么?,根据以下统计资料,2. 定距、定比变量:histogram(直方图),line(线图) 直方图:以一组无间隔的直条表现频数分布特征的统计图。直方图的每一条形高度分别代表相应组别的频数。 对于等距分组,用频次作为条形高度;对于非等距分组,用频次密度作为条形的相对高度。 频次密度频次/组距,四、表和

10、图的累积表示 累积表或累积图表示的是大于某个变量值的频次(或频率)一共是多少或小于某个变量值的频次(或频率)一共是多少。 向上累积(cf或c):是指位于某一变量值“以上”的频次或频率的总和。 向下累积(cf或c):是指位于某一变量值“以下”的频次或频率的总和。,第二节 集中趋势测量法,一、集中趋势测量法(measures of central tendency) 用一个具有某种典型特征的数值来代表变量,这样的特征值就叫做集中值或集中趋势,对这样的数值的求取就叫做集中趋势测量。,二、集中趋势的类型 众值(mode) 中位值(median) 均值(mean),(一)众值Mo 1.众值的概念 众值指

11、频次分布中最大频次所对应的变量值。 (1)定类、定序变量,Mox2,(2)定距、定比变量 原始数据。例:成绩 分组数据(连续型数据):众值为具有最高频次或频次密度的那一组的组中值bi。例: 无众值。,2.众值的意义 众值的代表性在于其估计或预测每一个研究对象(个案)的值所犯错误总数是最小的。 3.众值的适用范围 适合于任何层次的变量,特别是定类变量。 适合于单峰对称分布,不适合于多峰分布(众值不唯一)。,(二)中位值Md 1.中位值的概念 中位值是指位于一组数据数列中间位置的那个值。 数据数列数据依序排列。 中间位置大于等于中位值的数据个数 小于等于中位数的数据个数。,(1)原始数据,当观察总

12、数N为奇数时,Md为位于(N+1)/2的那个值。,当观察总数N为偶数时,Md取居中位置左右两数的平均值。,(2)频次分布数据,2.中位值的意义 对于含有极端数据的一组数据,中位值更具有代表性。例:收入 3.中位值的适用范围 定序变量及其以上。例:成绩,(三)均值M或 1.均值的概念 2.均值的意义 以均值来估计定距或定比数据中个案的数值,错误最小。 3.均值的适用范围 适用于定距和定比变量。,4.均值的数学性质,(1)各变量值与均值的离差之和等于零。,(2)各变量值与均值的离差平方和最小。,(四)众值、中位值和均值的比较 三值设计的目的都是希望通过一个数值来描述一个变量的整体特征,以便简化资料

13、。它们都反映了变量的集中趋势。,均值受极端值的变化影响,而中位值则不受影响。,练习,以下是甲、乙两村9户家庭人口数的原始数据: 甲村:3;3;4;4;4;5;6;7;8 乙村:3;3;4;4;4;4;5;5;5 (1)计算两村家庭人口数的众值、中位值和均值。 (2)对三种集中值作出讨论。,以下是68名职工婚姻状况的调查:,(1)试作统计表和统计图。 (2)选择适当的集中值并讨论之。,以下是某厂职工教育程度的调查:,(1)试作统计表和统计图。 (2)选择适当的集中值并讨论之。 设以下是某区家庭子女数的统计表:,(1)试作频率统计表、直方图和线图。 (2)试求均值。 设以下是72名离婚者婚龄的统计

14、。,(1)试作频率统计表、直方图和线图。 (2)试求众值、中位值和均值,并简单讨论之。,指出下面的统计表存在的问题,并画一个完整的频次和频率统计表,在表中把真实组限、组距和组中值都列上。 某厂工人的月收入分布,某制鞋厂家为了制定生产计划,调查了100个成年女性穿鞋的尺寸,数据如下:,(1)求这个数据集的平均数、中位数和众数; (2)对这个数据集,用什么指标作为数据集中趋势的度量比较合适?,某市40个百货公司12月份的销售额资料如下(单位:万元):,试根据以上资料编制第一组为50万元60万元的等距数列,并计算出频率和累积频次。,一项研究调查了19名中学教师,他们的月经济收入如下: 1200,12

15、70,1300,1310,1320,1350,1360,1370,1390,1400,1450,1460,1490,1530,1580,1600,3200,4000。 现欲了解他们的平均月经济收入。,下表是39名学生的总评:,随机抽取18名同学对西大进行5点量表的评价(1为非常不满意;2为不满意;3为一般;4为满意;5为非常满意),结果如下: 1,1,1,2,2,2,2,2,2,3,3,3,4,4,4,4,5,5 (1)试作频次分布、频率分布、向上累积频次、向上累积频率、向下累积频次、向下累积频率表。 (2)求中位值; (3)说明中位值的意义。,下面是某班20名学生的某心理特征的得分,请描述这班学生在此心理特征上的数量特征。 12,10,8,9,6,6,23,15,17,5,14,13,7,6,8,19,16,15,13,12,若你是某大公司的人力资源部的经理,公司老板要求你确定公司产品开发工程师的薪酬标准。 (1)你该如何着手开展工作? (2)若你通过调查获得了如下数据,那你确定的薪酬标准是什么?,作业,以下题目请用SPSS完成。 我们在某高校采访了16名大学生,了解他们平时的学习情况,以下数据是大学生每周用于看电视的时间: 15,14,12,9,20,4,17,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号