数据统计分析方法(上)

上传人:ldj****22 文档编号:46704445 上传时间:2018-06-27 格式:PDF 页数:85 大小:1,004.30KB
返回 下载 相关 举报
数据统计分析方法(上)_第1页
第1页 / 共85页
数据统计分析方法(上)_第2页
第2页 / 共85页
数据统计分析方法(上)_第3页
第3页 / 共85页
数据统计分析方法(上)_第4页
第4页 / 共85页
数据统计分析方法(上)_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《数据统计分析方法(上)》由会员分享,可在线阅读,更多相关《数据统计分析方法(上)(85页珍藏版)》请在金锄头文库上搜索。

1、SPSS应用与实证研究方法讲座数据统计分析方法 为北京邮政科学研究设计院准备马广斌马广斌博士2 2目录目录SPSS应用与实证研究方法应用与实证研究方法123如何用数据描述事物如何用数据描述事物4量化事物量化事物如何使用数据揭示事物之间的关联如何用样本对总体进行推断如何使用数据揭示事物之间的关联如何用样本对总体进行推断3 3第一讲:量化事物第一讲:量化事物4 4内容目录?第一部分 量化事物?为什么要量化事物?如何量化事物?第二部分如何用数据描述单个事物?第三部分如何用样本对总体进行推断?第四部分如何使用数据揭示事物之间的关联5 5第一部分 量化事物一、为什么要量化事物 量化的重要意义:量化的重要

2、意义:量化的重要意义:量化的重要意义:如果您不能量化某些事情,那么您就不能理解它;如果您不能量化某些事情,那么您就不能理解它;如果您不能量化某些事情,那么您就不能理解它;如果您不能量化某些事情,那么您就不能理解它;如果您不能理解它,那么您就不能控制它;如果您不能理解它,那么您就不能控制它;如果您不能理解它,那么您就不能控制它;如果您不能理解它,那么您就不能控制它;如果您不能控制它,那么您就不能改进它。如果您不能控制它,那么您就不能改进它。如果您不能控制它,那么您就不能改进它。如果您不能控制它,那么您就不能改进它。6 6一、为什么要量化事物 事物都能量化吗?事物都能量化吗?事物都能量化吗?事物都

3、能量化吗?质、量、度,是所有事物的基本属性;质、量、度,是所有事物的基本属性;质、量、度,是所有事物的基本属性;质、量、度,是所有事物的基本属性;因此任何事物,都是而且应该可量化的;因此任何事物,都是而且应该可量化的;因此任何事物,都是而且应该可量化的;因此任何事物,都是而且应该可量化的; 量化事物是个什么工作?量化事物是个什么工作?量化事物是个什么工作?量化事物是个什么工作?事物变量事物变量量量质质度度第一部分 量化事物7 7一、为什么要量化事物 数据包含的信息很多,但是数据中的数据包含的信息很多,但是数据中的数据包含的信息很多,但是数据中的数据包含的信息很多,但是数据中的信息往往是分散的,

4、单个数据很难直信息往往是分散的,单个数据很难直信息往往是分散的,单个数据很难直信息往往是分散的,单个数据很难直接被应用起来接被应用起来接被应用起来接被应用起来 统计分析就是统计分析就是统计分析就是统计分析就是收集、分析、表述和解收集、分析、表述和解收集、分析、表述和解收集、分析、表述和解释数据,洞察数据中的规律,释数据,洞察数据中的规律,释数据,洞察数据中的规律,释数据,洞察数据中的规律,把数据把数据把数据把数据转化为信息转化为信息转化为信息转化为信息第一部分 量化事物8 8二、如何量化事物 任何数据都必须经过适当形式的综任何数据都必须经过适当形式的综任何数据都必须经过适当形式的综任何数据都必

5、须经过适当形式的综合,浓缩成精简的形式来展示合,浓缩成精简的形式来展示合,浓缩成精简的形式来展示合,浓缩成精简的形式来展示 事物的特征决定了往往只有很少几事物的特征决定了往往只有很少几事物的特征决定了往往只有很少几事物的特征决定了往往只有很少几种变量形式,能最恰当地展示事种变量形式,能最恰当地展示事种变量形式,能最恰当地展示事种变量形式,能最恰当地展示事物;物;物;物; 很多时候,甚至只有一种变量形式很多时候,甚至只有一种变量形式很多时候,甚至只有一种变量形式很多时候,甚至只有一种变量形式可以使用可以使用可以使用可以使用第一部分 量化事物9 9二、如何量化事物 最常用的四种变量形式:最常用的四

6、种变量形式:最常用的四种变量形式:变量测量级别定类变量定类量表最常用的四种变量形式:变量测量级别定类变量定类量表 (Nominal Scale)定序变量定序量表定序变量定序量表 (Ordinal Scale)定距变量定距量表定距变量定距量表 (Interval Scale)定比变量定比量表定比变量定比量表 (Ratio Scale)(级、量表、尺度)(级、量表、尺度)低高低高第一部分 量化事物1010二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 名称级名称级名称级名称级-定类变量定类变量定类变量定类变量 顺序级顺序级顺序级顺序级-定

7、序变量定序变量定序变量定序变量 间隔级间隔级间隔级间隔级-定距变量定距变量定距变量定距变量 比例级比例级比例级比例级-定比变量定比变量定比变量定比变量转换转换转换转换定性定性定性定性定量定量定量定量非数量型非数量型非数量型非数量型数量型数量型数量型数量型离散型随机变量离散型随机变量离散型随机变量离散型随机变量连续型随机变量连续型随机变量连续型随机变量连续型随机变量低低低低高高高高第一部分 量化事物1111二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 1、定类变量 如果所提的问答题的答案只表示类别,不表示任何数量 的顺序或大小,那么对

8、应的变量就叫做定类变量或名义 变量;测量的量表就叫做定类量表或名义尺度。例如:X1=“性别”;其可能取值为“男”或“女”, 或分别用X1=1(男)和X1=2(女)表示 Xi=“费用类别”;其可能取值为“厂修费”,“航修费”,“检验 费”等10多类, 或分别用Xi=1(厂修费),Xi=2(航修费),Xi=10(检验费)表 示第一部分 量化事物1212二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 1、定类变量媒介花费媒介花费信息费有线电视费上网费买书籍订阅报纸买杂志男女性别性别第一部分 量化事物1313二、如何量化事物 最常用的四种变量

9、形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 1、定类变量注意:注意: 如果使用数值标识,只表示类别如果使用数值标识,只表示类别 不表示任何数量的顺序或大小不表示任何数量的顺序或大小 不能作任何加减乘除的运算不能作任何加减乘除的运算第一部分 量化事物1414二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 1、定类变量例如, 在CNNIC的第十六次中国互联网络发展状况网上调查问卷:22您对互联网最反感的方面为: (单选) O 垃圾邮件 O 弹出式广告/窗口 O 网络病毒 O 网络入侵/攻击(包括木马) O 网

10、上不良信息 O 网上虚假信息 O 网上收费陷阱 O 隐私泄露 O 其他(请注明 )第一部分 量化事物1515二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 2、定序变量 如果所提的问答题的答案可以表示重要大小或程度轻重 等顺序的先后,那么对应的变量就叫做定序变量或顺序 变量;测量的量表就叫做定序量表或顺序尺度。例如:X1 =“费用支出”;其可能取值为“低”,“中”和“高”, 或分别用X1 =1(低)、X1 =2(中)和X1 =3(高)表示 Xi =“优先等级排序”;其可能取值为“第一优先”,“第二优先”,“第五优 先”等, 或分别用X

11、i =1(第一优先),Xi =2(第二优先),Xi =5(第五优 先)表示第一部分 量化事物1616二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 2、定序变量第第1第第2第第3高支出中等支出低支出费用支出水平费用支出水平报纸选择优先级别报纸选择优先级别第三优先第四优先第五优先第二优先第一优先第一部分 量化事物1717二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 2、定序变量注意:注意: 按某种特性将观测对象排序按某种特性将观测对象排序 值之间可以比较大小或强弱顺序值之间可

12、以比较大小或强弱顺序 但两个值的差一般没有什么实际意义但两个值的差一般没有什么实际意义第一部分 量化事物1818二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 3、定距变量 如果所提的问答题的答案可以表示绝对数值的大小,那 么对应的变量就叫做定距变量或间隔变量;测量的量表 就叫做定距量表或间隔尺度。定距变量的取值用数字形 式表示。例如X1 =“温度”;其可能取值为任意的实数,如 X1 =20(度);X1 =0(度);X1 =-2(度);等 Xi =“客户满意程度得分”;其可能取值为 Xi =1(很不满意),Xi =2(不太满意),Xi

13、 =3(一般), Xi =4(比较满意),Xi =5(非常满意)第一部分 量化事物19193、定距变量二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:比较满意一般评价不太满意很不满意4321非常满意5读者满意程度读者满意程度0度4度24度38度温度温度第一部分 量化事物2020二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式: 3、定距变量注意:注意: 值之间可以比较大小顺序值之间可以比较大小顺序 可以说明大多少或小多少可以说明大多少或小多少 两个值的差有实际意义两个值的差有实际意

14、义 比值没有意义比值没有意义 零点和测量单位可以任意规定零点和测量单位可以任意规定 适合使用除涉及比值计算的几乎所有统计方法适合使用除涉及比值计算的几乎所有统计方法第一部分 量化事物2121二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:4、定比变量 如果所提的问答题的答案可以表示绝对数值的大小,而 且零点也是有意义的话,那么对应的变量就叫做定比变 量或比率变量;测量的量表就叫做定比量表或比率尺 度。例如X1 =“收入”;其可能取值为任意的正数,如 X1 =1200(元);X1 =800(元);等 Xi =“上网时间”;其可能取值为任意

15、的正数,如 Xi =90(天);Xi =60(天);Xi =0(天);等第一部分 量化事物22224、定比变量二、如何量化事物 最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:最常用的四种变量形式:国内生产总值万元16499400.00 非农业人口万人509.59 在岗职工工资总额万元2580319.00 城乡居民储蓄年末余额万元11483600.00 社会消费品零售额万元7823264.00 固定资产投资总额万元5957854.00 房地产开发投资额万元1606037.00 住宅投资万元1024612.00 保费万元417049.00 医生数人25889.00 公共汽电车客

16、运总数万人次60238.00 年末实有公共运营汽电车辆5836.00 年末实有出租汽车辆31939.00 年末实铺装铺道路面积万平方米4273.00 邮政业务总量万元80372.00 电信业务总量万元621834.00 人均国内生产总值元/人22073.66 进出口总额千美元22850196.64 在岗职工人均工资元/人14453.95 每万人拥有公共汽电车辆7.80 每百人公共图书馆藏书册、件104.08 人口密度人/平方公里1008.00 第三产业占GDP比重47.58天津天津综合状况城市先进 程度人口与产业综合状况城市先进 程度人口与产业指标分类城市经济指标项目单位指标分类城市经济指标项目单位数据来源:中国互联网络信息中心(CNNIC)1370011100940

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号