数据的整理与分析.ppt

上传人:汽*** 文档编号:568570544 上传时间:2024-07-25 格式:PPT 页数:46 大小:1.02MB
返回 下载 相关 举报
数据的整理与分析.ppt_第1页
第1页 / 共46页
数据的整理与分析.ppt_第2页
第2页 / 共46页
数据的整理与分析.ppt_第3页
第3页 / 共46页
数据的整理与分析.ppt_第4页
第4页 / 共46页
数据的整理与分析.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《数据的整理与分析.ppt》由会员分享,可在线阅读,更多相关《数据的整理与分析.ppt(46页珍藏版)》请在金锄头文库上搜索。

1、1 第六章第六章 市场调查资料的整理与分析市场调查资料的整理与分析第一节第一节 调查资料的整理调查资料的整理第二节第二节 调查资料的分析调查资料的分析2 第一节第一节 市场调查资料的整理市场调查资料的整理一、调查资料整理的概念一、调查资料整理的概念二、调查资料整理的内容二、调查资料整理的内容三、调查资料整理的程序三、调查资料整理的程序3 一、调查资料整理的概念资料整理的概念 所谓市场调查资料的整理,就是指运用科所谓市场调查资料的整理,就是指运用科学的方法,对调查所获得的各种原始资料进行学的方法,对调查所获得的各种原始资料进行审核、分类处理和加工综合,使之系统化和条审核、分类处理和加工综合,使之

2、系统化和条理化,从而以集中、简明的方式反映调查对象理化,从而以集中、简明的方式反映调查对象总体情况的工作过程。总体情况的工作过程。4 二、二、调查资料整理的内容调查资料整理的内容 1、调查资料的处理(整理):、调查资料的处理(整理): 包括审核、分类、汇总和制图表。 2、数据管理:、数据管理: 包括资料的输入、传输、存贮、更新与输出。5制定整理方案制定整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理制作统计表或统计图制作统计表或统计图三、三、调查资料整理的程序调查资料整理的程序6问问卷卷审审核核编编码码数据处理图表制作调查问卷整理程序调查问卷整理程序录录入入7 实地审核实地审

3、核 一般方式:一般方式: 复查和回访复查和回访 审核分为审核分为两个层面两个层面 资料审核资料审核 主要内容包括:主要内容包括:资料的时效性资料的时效性准准资料的完整性资料的完整性缺缺资料的正确性资料的正确性误误 1、审、审 核核8 调查资料审核的主要内容调查资料审核的主要内容 (1)时效性)时效性 指所填资料是否是最新资料。 (2)完整性)完整性 看是否有缺损问卷;是否都填写齐全;是否有答案模糊不清的问卷。 (3)正确性)正确性 指审核访谈是否按适当的方式进行,访问员有没有作假行为,调查口径、计算方法等是否符合要求等。9 调查资料审核的主要方法调查资料审核的主要方法 经验判断法经验判断法 例

4、如:如果被调查者年龄填写为132岁,根据经验判断,其填写肯定有误。 逻辑检查法逻辑检查法 例 如:某消费者在前面说“不知道”某调味品,后面却说“每天都在使用”,显然前后矛盾。 计算审核法计算审核法 例如:在家庭收支结构中,家庭总收入远小于总支出和储蓄之和,那肯定有错。10 对不合格答案的的处理办法对不合格答案的的处理办法n第一,第一,退回退回实施现场获取较好的数据。实施现场获取较好的数据。n第二,按第二,按缺失值缺失值处理(前提是退回实施现场处理(前提是退回实施现场的做法无法实现)。的做法无法实现)。n第三,整个第三,整个问卷作废问卷作废(前提是不满意问卷的(前提是不满意问卷的比例很小不足比例

5、很小不足10%;样本量很大;不满意的;样本量很大;不满意的问卷与满意的问卷间没有明显的判别问卷与满意的问卷间没有明显的判别 每份不每份不满意的问卷中,不满意答案的比例很大)。满意的问卷中,不满意答案的比例很大)。 11 注意:下列问卷一般是不能接受的注意:下列问卷一般是不能接受的n第一,所回收的问卷是明显不完整,如第一,所回收的问卷是明显不完整,如缺一缺一页或多页页或多页。第二,问卷从整体或部分看回答。第二,问卷从整体或部分看回答不完全。第三,调查员没有理解访问指南而不完全。第三,调查员没有理解访问指南而误导被访问者回答,结果离题太远,如没有误导被访问者回答,结果离题太远,如没有要求要求跳答跳

6、答。第四,。第四,同一项目的回答,答案几同一项目的回答,答案几乎没有变化乎没有变化;第五,;第五,问卷回收超过规定的截问卷回收超过规定的截止日期。止日期。第六,回答问题的第六,回答问题的被访问者不符合被访问者不符合要求要求。第七,答案字迹模糊不清,无法辨认。第七,答案字迹模糊不清,无法辨认。第八,对开放性的问题回答模棱两可,难以第八,对开放性的问题回答模棱两可,难以清楚表达调查意图。清楚表达调查意图。 12 2、编、编 码码 编码就是给每一个问题及答案分配一编码就是给每一个问题及答案分配一个代号,通常是一个数字、字母或特殊的个代号,通常是一个数字、字母或特殊的符号。将问卷信息转化为统一设计的计

7、算符号。将问卷信息转化为统一设计的计算机可识别的代码,以便于对其进行数据整机可识别的代码,以便于对其进行数据整理和分析。理和分析。 作作 用:用:(1 1)减少数据录入和分析的工作量)减少数据录入和分析的工作量(2 2)将定性数据转化为定量数据)将定性数据转化为定量数据(3 3)减少误差)减少误差13 安安莫勒的编码与数据录入经验之谈莫勒的编码与数据录入经验之谈n安安莫勒是亚特兰大莫勒是亚特兰大SDRSDR公司的数据录入员。公司的数据录入员。2020年来,年来,在管理项目数据录入方面积累了丰富的经验,他认在管理项目数据录入方面积累了丰富的经验,他认为要在客户预算允许的范围内如期完成调研工作,为

8、要在客户预算允许的范围内如期完成调研工作,重要的是避免问卷中出现过多的开放型问题,这些重要的是避免问卷中出现过多的开放型问题,这些问题的答案不能直接输入数字代码,解决的办法是问题的答案不能直接输入数字代码,解决的办法是根据项目分类设计编码,或将反馈内容原样录入电根据项目分类设计编码,或将反馈内容原样录入电脑。脑。莫勒说:莫勒说:“编码是数据录入过程中耗资最大且编码是数据录入过程中耗资最大且最主要的部分最主要的部分”。n “我们读同一文本,对它的编码可能不同。我们读同一文本,对它的编码可能不同。如如果有太多的答案需要编码,分析过程就会令人厌烦,果有太多的答案需要编码,分析过程就会令人厌烦,而且理

9、解详尽答案的花费将是非常之高的而且理解详尽答案的花费将是非常之高的”。14封闭式问题的编码步骤:封闭式问题的编码步骤:n第一,找出问题中的第一,找出问题中的关键词关键词。n第二,用第二,用适当的符号适当的符号代表关键词,通常用代表关键词,通常用拼音或英拼音或英文缩写文缩写作为编码,这样便于识别;对单选题,只用作为编码,这样便于识别;对单选题,只用一个编码,如果是多选题,它的每一个选项都应该一个编码,如果是多选题,它的每一个选项都应该有一个编码,这时可在统一的符号后加上序号作为有一个编码,这时可在统一的符号后加上序号作为各个选项的编码。各个选项的编码。n第三,确定第三,确定编码的取值范围编码的取

10、值范围。单选题编码的取值就。单选题编码的取值就是各选项的序号;多选题编码的取值就是是各选项的序号;多选题编码的取值就是0或或1(选(选中为中为1,未选中为,未选中为0),),确定编码的取值范围有利于确定编码的取值范围有利于检查编码值的输入是否正确。检查编码值的输入是否正确。n第四,检查编码第四,检查编码是否雷同是否雷同,一张调查问卷或调查表,一张调查问卷或调查表中的每一编码都应该是唯一的。中的每一编码都应该是唯一的。n第五,编出编码表,它可与调查问题进行第五,编出编码表,它可与调查问题进行对照对照,以,以免遗漏,也有利于统计汇总免遗漏,也有利于统计汇总 。1516 编码的主要方法编码的主要方法

11、(1 1)顺序编码法)顺序编码法(2 2)分组编码法)分组编码法(3 3)信息组码编码法)信息组码编码法 (4) (4) 助忆编码法助忆编码法 (5)(5) 缩写编码法缩写编码法17n顺序编码法:顺序编码法:又称系列编码法,用一个标准对信息又称系列编码法,用一个标准对信息资料分类,按一定顺序用连续数字或字母进行编码;资料分类,按一定顺序用连续数字或字母进行编码;简洁明了,易于管理。简洁明了,易于管理。 例如:您的性别:例如:您的性别:男男 女女 编码:编码:XB(1、2)n分组编码法:分组编码法:又称区间编码法,把一定位数的代码又称区间编码法,把一定位数的代码单元分成若干个组,每一组数字代表一

12、定意义;使单元分成若干个组,每一组数字代表一定意义;使用相当广泛,容易记忆,处理较方便,有时位数过用相当广泛,容易记忆,处理较方便,有时位数过多,会造成系统维护困难。多,会造成系统维护困难。 例如:例如:1242表示?表示?18n信息组码编码法信息组码编码法 例如:百货组从例如:百货组从1-20、食品组从、食品组从20-40n表意式文字编码法表意式文字编码法(又叫助忆编码法):又叫助忆编码法):指用数字、文字、符号等来表明编码对指用数字、文字、符号等来表明编码对象的属性。象的属性。 例如:例如:20TVC表示表示20英寸彩色电视机英寸彩色电视机n缩写编码法缩写编码法 例如:例如:KG表示千克表

13、示千克19 3、 录录 入入 录入就是由录入员将问卷按照确定录入就是由录入员将问卷按照确定好的编码输入到计算机,目前主要采用好的编码输入到计算机,目前主要采用键盘输入法。键盘输入法。 控制录入质量的方法:控制录入质量的方法:(1 1)重复录入)重复录入(2 2)预算控制)预算控制(3 3)平衡检测)平衡检测20 4、 数据处理数据处理处理方法:处理方法:(1 1)自行直接人工处理)自行直接人工处理(2 2)委托专业机构处理)委托专业机构处理常用软件:常用软件:(1 1)ExcellExcell(2 2)SPSSSPSS(Statistics Package for The (Statistic

14、s Package for The Social ScienceSocial Science“社会科学统计软件社会科学统计软件”) )21 5、统计表与统计图、统计表与统计图n 统计表:把统计数据按统计表:把统计数据按一定的顺一定的顺序序排列在排列在表格上表格上,就形成了统计表。,就形成了统计表。它清楚地、有条理地显示统计资料,它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是直观地反映统计分布特征,是统计统计分析分析的一种的一种重要工具重要工具。22统计表的结构统计表的结构n1)从)从表式表式上看上看n表格包括表格包括总标题总标题、横行标题横行标题、纵栏标题纵栏标题和和指标数指标数值

15、值四个部分。如表四个部分。如表1所示:所示:n2)从)从内容内容上看上看n统计表由统计表由主词栏主词栏和和宾词栏宾词栏两个部分组成。两个部分组成。n主词栏是统计表所要说明的主词栏是统计表所要说明的总体及其组成部分总体及其组成部分;宾词栏是统计表用来宾词栏是统计表用来说明总体数量特征的各个统说明总体数量特征的各个统计指标计指标。n此外,统计表还有补充资料、此外,统计表还有补充资料、注解注解、资料来源资料来源、填表单位、填表人等。填表单位、填表人等。23 20102010年某月某公司各企业劳动生产率年某月某公司各企业劳动生产率 分组分组总产值总产值(万元万元)职工人数职工人数(人人)劳动生产率劳动

16、生产率(元元/人人)P123大型大型中型中型小型小型合计合计横横行行标标题题 主词主词宾词宾词数据资料数据资料( (指标数值指标数值) )纵栏标题纵栏标题总标题总标题例如:例如:24n统计表的设计应注意事项:统计表的设计应注意事项:n1.线条的绘制。线条的绘制。表的表的上下端应以粗线绘制上下端应以粗线绘制,表内纵横线以细线绘制。表格的表内纵横线以细线绘制。表格的左右两端左右两端一般不划线,采用一般不划线,采用“开口式开口式”。n2.合计栏的设置。合计栏的设置。 n3.标题设计。标题设计。以简练而又准确的文字表述统以简练而又准确的文字表述统计资料的内容、资料所属的计资料的内容、资料所属的空间和时

17、间空间和时间范范围。围。 25n4.指标数值的填写指标数值的填写。n当当缺某项数字资料时缺某项数字资料时,可用符号,可用符号“”表示;表示;不不应有数字时用应有数字时用符号符号“”表示。表示。n5.计量单位计量单位。n统计表必须注明数字资料的计量单位。当全表只统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在有一种计量单位时,可以把它写在表头的右上方表头的右上方。如果表中各格的指标数值计量单位不同,可在横如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。行标题后添一列计量单位。n6.注解或资料来源。注解或资料来源。n在统计表下,应在统计表下,应注明资料来源

18、注明资料来源。26常用的统计图常用的统计图n(1)直方图直方图n用用直方形的宽度和高度直方形的宽度和高度来表示次数分布的图形。来表示次数分布的图形。绘制直方图时,绘制直方图时,横轴表示各组组限横轴表示各组组限,纵轴表示次纵轴表示次数数(一般标在左方)和比率(或频率,一般标在(一般标在左方)和比率(或频率,一般标在右方)。右方)。n(2)折线图折线图n折线图可以在直方图的基础上,用折线将各组折线图可以在直方图的基础上,用折线将各组次次数高度的坐标数高度的坐标连接而成,也可以用组中值与次数连接而成,也可以用组中值与次数求坐标点连接而成求坐标点连接而成n(3)曲线图曲线图n用平滑曲线连接各组用平滑曲

19、线连接各组次数坐标点次数坐标点即得分布曲线。即得分布曲线。27直方图直方图28折线图折线图 折线图是在直方图的基础上连接各条形折线图是在直方图的基础上连接各条形顶边的顶边的中点中点成折线图。如下图红笔围成的,成折线图。如下图红笔围成的,即为次数分配曲线图即为次数分配曲线图 :直方图与折线图直方图与折线图30曲线图曲线图31(4)散点图、趋势图)散点图、趋势图32(5)圆形图)圆形图(饼图饼图 Pie )333435数据表示中的错误数据表示中的错误Errors in Presenting Data1. 使用使用花哨花哨(Junk)图表图表2. 数据比较时没有可靠数据比较时没有可靠的相对基准的相对

20、基准3. 压缩纵轴压缩纵轴Compressing the Vertical Axis4. 纵轴上无零点纵轴上无零点No Zero Point on the Vertical Axis36花哨花哨图表图表Chart Junk不准确的表示不准确的表示准确的表示准确的表示1960: $1.001970: $1.601980: $3.101990: $3.80最低工资最低工资0241960197019801990$37压缩纵轴压缩纵轴Compressing Vertical Axis季度销售季度销售季度销售季度销售不准确的表示不准确的表示025501季季2季季3季季 4季季$01002001季季 2季

21、季3季季 4季季$准确的表示准确的表示38纵轴无零点纵轴无零点No Zero Point on Vertical Axis月销售量月销售量月销售量月销售量不准确的表示不准确的表示0204060一一 三三 五五 七七 九九 十一十一$36394245一一 三三 五五 七七 九九 十一十一$准确的表示准确的表示39 第二节第二节 市场调查资料的分析市场调查资料的分析一、调查资料分析的概念一、调查资料分析的概念二、调查资料分析的方法二、调查资料分析的方法40 一、调查资料分析的概念资料分析的概念 n 指对市场调查与预测过程指对市场调查与预测过程中收集到的各种原始数据进行适中收集到的各种原始数据进行适

22、当的处理,使其显示一定的含义,当的处理,使其显示一定的含义,进而反映不同数据之间以及新数进而反映不同数据之间以及新数据与原数据之间的联系,并通过据与原数据之间的联系,并通过分析,得出某些结论。分析,得出某些结论。411 1、描述性统计分析法、描述性统计分析法2 2、解析性统计分析法、解析性统计分析法 (1 1)相关(回归)分析法;)相关(回归)分析法; (2 2)聚类分析法)聚类分析法 (3 3)主成份分析、因子分析)主成份分析、因子分析 二、调查资料分析的方法42 交叉列表分析技术交叉列表分析技术n 交叉列表分析是同时将两个或交叉列表分析是同时将两个或两个以上具有有限类目数和确定值两个以上具

23、有有限类目数和确定值的变量,按照一定顺序对应排列在的变量,按照一定顺序对应排列在一张表中,从中分析变量之间的相一张表中,从中分析变量之间的相关关系,得出科学结论的技术。关关系,得出科学结论的技术。 43例如:电脑的拥有情况和电脑拥有者收入之间的关系例如:电脑的拥有情况和电脑拥有者收入之间的关系例如:电脑的拥有情况和电脑拥有者收入之间的关系例如:电脑的拥有情况和电脑拥有者收入之间的关系拥有情况拥有情况拥有情况拥有情况收入水平收入水平收入水平收入水平行合计行合计行合计行合计高收入水平高收入水平高收入水平高收入水平中等收入中等收入中等收入中等收入低收入低收入有有25215696504没有没有1562

24、40300696列合计列合计4083963961200表表表表 2 2 电脑的拥有情况与收入之间的关系(人数)电脑的拥有情况与收入之间的关系(人数)电脑的拥有情况与收入之间的关系(人数)电脑的拥有情况与收入之间的关系(人数)分分分分 析:从表中可以看出,在拥有电脑的析:从表中可以看出,在拥有电脑的析:从表中可以看出,在拥有电脑的析:从表中可以看出,在拥有电脑的504504504504人中,人中,人中,人中,高收入者有高收入者有高收入者有高收入者有252252252252人,低收入者仅有人,低收入者仅有人,低收入者仅有人,低收入者仅有96969696人,人,人,人,这说明电脑这说明电脑这说明电脑

25、这说明电脑的拥有情况似乎与收入水平有很大的关系的拥有情况似乎与收入水平有很大的关系的拥有情况似乎与收入水平有很大的关系的拥有情况似乎与收入水平有很大的关系。44 三变量交叉列表分析技术三变量交叉列表分析技术n 讨论的三变量交叉列表分析就讨论的三变量交叉列表分析就是在双变量分析的基础上,加入第是在双变量分析的基础上,加入第三个变量做进一步分析,可以补充三个变量做进一步分析,可以补充说明原有两变量分析的结果说明原有两变量分析的结果, ,使之更使之更准确全面。准确全面。45 三变量交叉列表分析的作用三变量交叉列表分析的作用其作用表现在:其作用表现在:(1 1)更精确反映原有二变量之间的联系;)更精确

26、反映原有二变量之间的联系;(2 2)揭示原有的两个变量之间的不相关,也)揭示原有的两个变量之间的不相关,也就是说三变量交叉列表分析结果显示了两者就是说三变量交叉列表分析结果显示了两者之间的相关性是之间的相关性是虚假虚假的;的;(3 3)加入第三个变量后,可能显示原有两变)加入第三个变量后,可能显示原有两变量之间被量之间被隐含隐含的关系;的关系;(4 4)可能说明原有两变量之间的联系没有改)可能说明原有两变量之间的联系没有改变。变。46拥有情况拥有情况受教育程度受教育程度大专以上大专以上大专以下大专以下收入水平收入水平收入水平收入水平高收入高收入中等收入中等收入低收入低收入高收入高收入中等收入中

27、等收入低收入低收入有有65%63%60%40%34%20%没有没有35%37%40%60%66%80%列合计列合计100%100%100%100%100%100%个案数个案数200196196208200200表表表表 3 3 3 3 按按按按“收入水平收入水平收入水平收入水平”和和和和“受教育程度受教育程度受教育程度受教育程度”分类分类分类分类“拥有情况拥有情况拥有情况拥有情况”的三维联表的三维联表的三维联表的三维联表由表显示:大专以上的受访者中无论是高收入,中等收入还是由表显示:大专以上的受访者中无论是高收入,中等收入还是由表显示:大专以上的受访者中无论是高收入,中等收入还是由表显示:大专

28、以上的受访者中无论是高收入,中等收入还是低收入者他们的电脑拥有率都差不多,都在低收入者他们的电脑拥有率都差不多,都在低收入者他们的电脑拥有率都差不多,都在低收入者他们的电脑拥有率都差不多,都在60%60%60%60%以上,而低于大以上,而低于大以上,而低于大以上,而低于大专的受访者中没有拥有电脑的无论是高收入还是中低收入都在专的受访者中没有拥有电脑的无论是高收入还是中低收入都在专的受访者中没有拥有电脑的无论是高收入还是中低收入都在专的受访者中没有拥有电脑的无论是高收入还是中低收入都在60%60%60%60%以上。以上。以上。以上。这说明真正有相关性的变量是这说明真正有相关性的变量是这说明真正有相关性的变量是这说明真正有相关性的变量是“受教育程度受教育程度受教育程度受教育程度”和和和和“拥拥拥拥有情况有情况有情况有情况”,而不是,而不是,而不是,而不是“收入水平收入水平收入水平收入水平”与与与与“拥有情况拥有情况拥有情况拥有情况”,他们之间的他们之间的他们之间的他们之间的相关性是相关性是相关性是相关性是虚假虚假虚假虚假的。的。的。的。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号