[精选]资料的基础分析-描述统计

上传人:我**** 文档编号:183301103 上传时间:2021-06-02 格式:PPTX 页数:45 大小:320.42KB
返回 下载 相关 举报
[精选]资料的基础分析-描述统计_第1页
第1页 / 共45页
[精选]资料的基础分析-描述统计_第2页
第2页 / 共45页
[精选]资料的基础分析-描述统计_第3页
第3页 / 共45页
[精选]资料的基础分析-描述统计_第4页
第4页 / 共45页
[精选]资料的基础分析-描述统计_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《[精选]资料的基础分析-描述统计》由会员分享,可在线阅读,更多相关《[精选]资料的基础分析-描述统计(45页珍藏版)》请在金锄头文库上搜索。

1、第八章 资料的基础分析:,描述统计,1,学习目标,了解资料输入计算机之前的处理工作 掌握如何列表(双向交叉列表) 了解如何对资料进行统计分析,2,8.1 数据的确认、编辑和编码,确认 访谈是否以适当的方式 进行,访问员是否造假(回访10%20%) 电话确认 确认此人是否真正接受了调查? 被调查者是否符合条件? 是否按要求的方式调查? 确认调查是否完整? 检查其他问题 确认的目的,3,编辑,对访问员和应答者的错误进行检查 确定访问员是否没有问某些问题或者没有记录某些问题的答案 核实问卷,以保证遵循了规定的跳跃模式 检查开放式问题的答案 要求访问员逐字记录答案,不以任何方式重新释义、表达或插入自己

2、的语言。同时对问题的答案进行“追问”,4,编辑,实地编辑 完整性 清楚性 内容的一致性 明确性 单位的统一性,5,编辑,办公室编辑 更完整、确切地审查和校正回收的资料 重点在于所查出问题的如何处理方面 不完整答卷的对策 大面积不回答,废卷; 个别问题无回答,有效问卷并补救; 相当多问卷对同一问题无回答,有效。 明显回答错误对策 无兴趣答卷的对策 纠正对开放性问题的打乱顺序的回答。,6,编辑,开放式问题的记录 对于开放式问题的回答,访问员记录不当的例子 问题:你为什么在众多的快捷/方便的餐馆中选择经常去肯德基? 回答记录:顾客似乎觉的肯德基有更加美味的食物和一流的服务环境 服务员没有进一步追问的

3、例子 问题:同上 回答记录:因为感觉比较好。,7,编辑,适当的记录和追问的例子 问题:同上 回答记录:因为感觉比较好。那里的服务员态度好,而且环境比较好。,8,编码,编码定义 对一个问题的不同回答进行分组和确定数字代码的过程。大多数问卷中的大多数问题是封闭式的,并且已预先编码。 编码主要是针对开放式问题进行。 编码的原因 文字记录对于定量分析不合适:1)对于用计算机分析,文字不太有效;2)调查分析记录不便于计量,100人有100种回答。编码就是把相似的进行归类。,9,编码,编码过程 列出答案 合并答案:一些形式上不同的答案,在本质上是一致的,可以被合并为一类。 设置编码 4、输入编码 读取每组

4、问题中每个开放式问题的回答。 找出与按步骤2得到的合并类别相符的回答 把每个具体的回答得数字编码填入相应的类别中 在调查表的适当地方,注明每个问题回答的数字编码,10,编码,例:对于您最近一次购买体育用品、运动鞋或 运动服装,您买的是什么? 假设有6位被访者分别购买了一个篮球、一双跑鞋、一副网球拍、一双网球鞋,羽毛球,运动服。 “1”代表运动器材;“2”代表运动服装 “3”代表运动鞋,11,编码明细单,为把资料准确地输入计算机,需要制定一套规则,即编码明细单。 一份说明文件中各个问题(变量)及其答案,与计算机数据文件中的字段、数码位置及数码之间一一对应关系的文件。,12,编码明细单,需要注意的

5、问题: 所有资料转化为数值,不允许有字母或其他字符 每一个数值码占据一列,(单选题和多选题) 无信息的答案赋予标准代码 每条记录的第一个字段都为问卷的编号。 例:P147,13,8.2 资料的初步分析列表,列表:把调查资料按照一定的目的、用表格的形式展现出来; 单项列表:仅计数一个变量不同数值的出现次数的列表; 交叉列表:同时计数两个或两个变量的不同数值联合出现的次数的列表。,14,8.2.1 单因素表格化分析,目的: 1、弄清无回答现象的程度; 2、弄清编误和飞点发生在何处; 3、弄清变量的经验分布; 4、计算主要的描述指标。,15,8.2.1 单因素表格化分析,无回答 无回答数目过多会影响

6、调研的数据分析和最终质量 指定一些特别的数字表示无回答(缺省值) 对于缺省值可用的方法:1保留下来作为单独的一组;2 临时排除含有缺省值的记录;3以其它数值替补缺省值(其中趋势量最常用),16,8.2.1 单因素表格化分析,编误与飞点 作单项列表时,可能发现一些不正常的数值,经查对原值并非如此,这种误差称之为“编误”,可被纠正。 飞点经查对与原值相符,但是与其他的观察值相比,特别大或者特别小,无法纠正。 箱线图有助于发现飞点。(由上四分位数、下四分位数、最大值和最小值决定的),17,8.2.1 单因素表格化分析,频数分布表 对于有飞点的数据宜采用不等组距,并设立开口 单项列表的主要描述量 众数

7、、中位数、平均值和标准差等。(可用相关软件直接进行计算),18,描述性统计,集中趋势测量 类别和顺序量表 等距和等比量表 均值 中位数 众数,19,描述性统计,众数 一串数字中出现次数最多的值。 通过制作频数分布表,可以较容易的找出。 分类变量宜采用众数。 中位数 一组有序值得列里居中的那个值。 其余值中一半要大于这个值,而剩余的一般要小于这个值。n是奇数或偶数。 通过计算累计百分数,20,均值:刻画一组数字的算术平均值。,描述性统计,其中:,fi = 第i组的频数 Xi = 组中值 h = 组数,21,离散程度的计量 标准差,其中,S = 样本标准差 Xi =第i个的观察值 X = 样本均值

8、 n = 样本容量,描述性统计,22,描述性统计,离散程度的计量 方差 标准差的平方 全距 最大值减去最小值,23,例:十名被访者给其电脑速度打分的数据集,被访者 等级 1 4 2 5 3 4 4 2 5 3 6 4 7 3 8 4 9 5 10 4 “1”表示很慢 “5”表示很快,24,对十位被访者的等级分析,25,对十位被访者的等级分析,百分率分布 每个不同的数字出现的频率一般分率计算出来 等级 百分率(%) 2 10 3 20 4 50 5 20 总计 100,累计百分率 次数或百分率的动态总合,26,对十位被访者的等级分析,中位数 通过累计百分率计算 众数 通过百分率计算,均值 极差

9、标准差,27,描述性统计,类别量表:众数,频率或百分率 顺序量表:中位数,累积百分率 等距量表:极差,均值,方差等 等比量表:还可以计算几何平均数 P100,28,8.2.2 多因素列表分析,双向交叉列表 最常用,应用最广泛的一种方法 同时有两个变量参加交叉分组的频数分布表 例如研究家庭收入对汽车保有量的影响:家庭收入在平均数之上的家庭是否比收入在平均数以下的家庭拥有更多的汽车,29,双向交叉列表,表8.9 家庭收入与汽车保有量交叉分组行百分比,表8.10 家庭收入与汽车保有量交叉分组列百分比,30,双向交叉列表,不同的表格形式有不同的含义,表8.9与8.10提供的信息不同 。 交叉列表一般都

10、将自变量沿横向展开,将因变量沿纵向展开,相对频数计算行百分比。 同样可以做出家庭规模与汽车保有量的交叉列表,31,双向交叉列表,表8.11 家庭规模与汽车保有量交叉分组列百分比,32,三向交叉列表,以上的分析发现汽车保有量受到家庭规模和家庭收入的共同影响。如果同时考虑两种因素,汽车保有量会受到什么样的影响?,33,三向交叉列表,三变量的交叉列表的步骤: 1、把其中一个自变量稳定在其各种量值之中的一个量值上,然后对另一自变量与因变量作双向交叉分组; 2、再将第一个自变量稳定在下一个量值上,作另外两个变量的交叉列表,以此类推,直至穷尽第一个自变量的所有量值; 3、最后列出没有第一个自变量介入的另外

11、两个变量的交叉列表。,34,三向交叉列表,表8.13 家庭收入、家庭规模与汽车保有量交叉分组频数,81%及59%的含义。,35,三向交叉列表,由上表可知在家庭规模一定的条件下,家庭收入对汽车保有量有一定的影响,但是无法确定家庭规模和家庭收入两个变量中,哪个变量对汽车保有量的影响大。 可从上表中取出局部双向交叉进行分析 :,36,三向交叉列表,表8.14 按家庭收入和家庭规模交叉分组的拥有 1辆以上汽车的家庭百分比,对于4口以内家庭,收入水平的提升是的某户拥有1辆以上汽车的机会增加0.19-0.04=0.15,而对于4口以上家庭,这种机会却有0.43。 家庭规模的不同就相应的具有不同的机会,说明

12、自变过来之间有交互作用。可以通过算数加权平均法求得不论家庭规模的大小与否,单纯提升某户收入水平,该户拥有1辆以上汽车的机会所增加的百分点。算式是: (0.15780.4322)/(7822)0.21(纵向),37,三向交叉列表,按照同样的道理,因家庭规模扩大拥有1辆以上汽车机会所增加的百分点为: (0.46540.7446)/(5446)0.59(横向) 通过以上两步,可知家庭规模对汽车保有量的影响远比家庭收入水平的影响大。 与表8.9相比较,说明附加自变量的引入有助于修正说明第一个自变量对因变量的影响。,38,三向交叉列表,引入附加自变量也可以显示出原先被隐含的关系等。课本p164 初始结论

13、认为自变量与因变量间存在某种因果关系, 初始结论认为两变量间无关系,,39,数据的图形化,线形图 最简单的图形 饼状图 在市场调研中经常常用 柱形图 1. 简明柱形图 2. 聚类柱形图 3. 堆积柱形图 4. 多行三维柱形图,40,资料的解释和分析,分析与解释 对研究者要求最高的就是资料的分析与解释 事实本身没有用处,只有经过比较和分析才有用 例如:某企业今年的年产值为8000万元。 分析是以某种有意义的形式或次序把收集的资料重新展现出来。(找出资料中有什么信息) 解释是在资料分析的基础上,找出信息之间或手中信息与其它已知信息的联系。(获得结论),41,资料的解释和分析,表8.6 两种产品销售量的比较,公司的营业部经理从表上资料发现,A牌销售量的下降与B牌销售量的上升相似,因此作出结论,A牌产品顾客转向了B牌,并建议这个时刻将A牌退出市场。,上例表明分析适当,解释并一定适当。,42,案例分析,P170,43,CDMA调查报告,44,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号