市场调查 柯惠新课件 第10章定量调查数据的整理

上传人:清晨86****784 文档编号:213903349 上传时间:2021-11-22 格式:PPT 页数:51 大小:501.50KB
返回 下载 相关 举报
市场调查 柯惠新课件 第10章定量调查数据的整理_第1页
第1页 / 共51页
市场调查 柯惠新课件 第10章定量调查数据的整理_第2页
第2页 / 共51页
市场调查 柯惠新课件 第10章定量调查数据的整理_第3页
第3页 / 共51页
市场调查 柯惠新课件 第10章定量调查数据的整理_第4页
第4页 / 共51页
市场调查 柯惠新课件 第10章定量调查数据的整理_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《市场调查 柯惠新课件 第10章定量调查数据的整理》由会员分享,可在线阅读,更多相关《市场调查 柯惠新课件 第10章定量调查数据的整理(51页珍藏版)》请在金锄头文库上搜索。

1、第十章定量调查数据的整理第十章 定量调查数据的整理 第一节 调查资料的接收和编辑 第二节 调查资料的编码和录入 第三节 调查数据统计预处理 第四节 数据统计任务书的制作学习目标通过本章的学习,学生应该:掌握对调查资料进行接收、检查和校订的基本程序和方法;掌握对调查资料做事前编码、事后编码的方法;理解如何录入数据以及如何对录入的数据进行净化;理解对调查数据进行统计预处理的常用方法;了解数据统计任务书的一般制作方法;掌握进行数据的统计分析之前,如何整理定量调查的资料以及如何对数据作必要的处理。案例导入 前面章节提到的新生代市场监测机构的CMMS,由于调查规模庞大,数据量浩如烟海,必然需要一套严格完

2、整的质量控制和数据处理体系来确保调查数据的质量。 其中,质量控制冲抽样、执行、回收、审查等各阶段细化到方方面面,均有严格的操作程序和规定,后期的复合也采取多阶段全方位的复合模式。 数据处理具体分为四个阶段: 生成录入程序。采用专业软件PTK自动生成CMMS数据录入程序,便于管理和人为降低错误赵成的误差。 数据录入过程。采用专业录入软件SNAP,定期对数据录入结果进行检查,一方面是检查逻辑关系。另一方面是对录入员的录入结果进行抽查。 录入完毕的后期数据处理。输理逻辑关系,与前期数据进行合并、加权,在此期间需对每一件短的处理结果进行详细检查,包括队进行逻辑关系实力前后的数据进行比较,以保证逻辑树立

3、的正确性;对加权前后的数据进行比较,以保证加权过程的正确性;分析数据的年度变动和阅读变动,以发现数据的异常波动等。 与专业的数据呈现软件进行TELMAR捆绑。 第一节 调查资料的接收和编辑一、调查资料的接收二、调查资料的检查三、调查资料的校订一、调查资料的接收 接收调查资料工作的要点如下:认真仔细地管理好数据的收集和问卷的回收工作。在完成的问卷后面纪录问卷完成的日期和接收的日期。在完成的问卷后面纪录下访问员的编号或姓名。 多个项目同时实施时,必须清楚的纪录以下的数字:交付实施的项目数、仍在实施的项目数、已经完成并返回的项目数。 每一份返回的问卷都要纪录一个唯一的、有顺序的识别号码。 必须按识别

4、的号码,准确地记录清楚是谁拿着哪些原始文件。 要让所有参与资料整理工作的人员负有保证工作质量的责任和保证不丢失任何原始文件的责任。二、调查资料的检查 调查资料的检查一般是指对回收问卷的完整性和访问质量的检查。目的是要确定哪些问卷可以接受,哪些问卷要作废。下面情况的问卷一般是不能接受的: 所回收的问卷是明显不完整的; 问卷从整体上是回答不完全的; 问卷的几个部分是回答不完全的; 问卷只有开头的部分才是回答完全的; 回答的模式说明访问员(被访者)并没有理解或遵循访问(回答)指南; 答案几乎没什么变化; 问卷是在事先规定的截止日期以后回收的; 问卷是由不符合要求的被访者回答的。通常检查人员将原始文件

5、(问卷)分成三部分: 可以接受的 明显要作废的 对是否可以接受有疑问的。三、调查资料的校订检查不满意的答案字迹模糊的、不完全的、不一致的、模棱两可的和分叉错误的,校订人员应该用红笔将这些答案圈出来或写出来,使之与问卷中用于纪录数据的方式有明显的区别。 校订的小窍门: 给每个校订人员一份空白问卷,问卷中可能需要排除的项目或段落都用红笔圈出来。 “参照问卷”上用作判断其下面部分是否需要回答的“准则题”也要用红笔清楚地圈出来,同时标记出用于指示其下面部分是否排除的答案。 校订人员可以将完成的问卷和这个“参照问卷”作逐页的比较,以确保没有不恰当的答案。 处理不满意的答案三种处理办法:退回实施现场去获取

6、叫好的数据按缺失值处理;整个问卷作废。 不满意答案的问卷退回实施现场,让访问员再次去接触被访者。 如果将问卷退回现场的做法无法实现,校订人员可能就要把不满意的答案按缺失值处理。 满足以下条件,将有不满意答案的问卷扔掉作废:不满意的问卷(被访者)的比例很小(小于10%);样本量很大;不满意的问卷(被访者)和满意的问卷(被访者)之间没有明显的差别;每份不满意的问卷中,不满意答案的比例很大;关键变量的答案是缺失的。 第二节 调查资料的编码和录入 一、事前编码 二、事后编码 三、数据录入 四、数据净化一、事前编码 编码就是给每一个问答题的每一个可能答案分配一个代号,通常是一个数字。编码可以在设计问卷时

7、进行,也可以在数据收集结束以后进行,分别叫事前编码和事后编码。 事前编码的问卷通常是将每个答案的对应值印在问卷上,数据文件用的纪录格式(列位置)常常放在最右边或放在某处的括弧内。二、事后编码 (一)事后编码的类型事后编码指的是给某个没有事先编码的答案分配一个代码。通常需要事后编码的有:封闭式问答题的“其他”项;开放式问答题。(二)事后编码的要点 事后编码通常可遵循以下要点进行:给编码员提供一份空白的“参照问卷”;对每一个需要事后编码的项目提供一份编码表或编码名单;对每一个项目做一份编码本,内含一页或几张单页;让所有的编码员都在同一地点、使用同一编码本进行工作;提供编码指南,说明什么时候以及怎样

8、设立一个新的代码或合并答案;设立较多较窄的类别要优于较少较宽的类别;保持编码本的整洁和清晰。 编码的目的 是让每一个可接受的答案对应一个唯一的代码。编码指南应该尽可能地具体。 在缺乏非常具体的编码指南时,缺乏经验的编码员或对调查过程不熟悉的编码员可能有两种倾向:一是对每一个与已编码的答案不相似的新答案给一个新码,结果是类别和代码比预料的多得多,也许一个代码只对应一两个个案;二是为了简化工作,将许多答案甚至不相似的答案都归于同一个大类,结果是丢弃了数据中有意义的差异,而这些差异可能是对研究人员有用的。 十分重要的是,要确保编码本的字迹书写整洁、清楚。 (三)编码本 事前编码和事后编码所用的编码本

9、最后合并为一个编码本。编码本不但是编码人员的工作指南,也提供了数据集中变量的必要信息。编码本一般包括变量的以下几方面的信息:所在列的位置(列数);变量的顺序编号;变量名称及变量说明;问答题编号;编码说明。三、数据录入 数据录入指的是将问卷或编码表中的每一项目对应的代码读到磁盘、磁带中,或通过键盘直接输入计算机中。 采用键盘输入就会产生错误,为了将错误限制到最低水平,下面的几点提示可能是有帮助的: 给每个录入员提供一份清楚的纪录格式; 开始录入前几个个案时,研究人员必须在场; 绝不能假定录入员是懂得如何做数据录入的; 如有可能,就对录入的数据进行全面的核查; 如果全面的核查不可行,就采取抽查的方

10、法。 对录入员也要进行培训,明确任务的具体要求及注意事项。 为了保证高度的准确性,有必要对录入的结果进行核查以发现是否有错误。全面的核查要求每一个个案都必须录入两次,采用一台核查机和两个录入员核对。四、数据净化 数据净化主要是尽可能地处理错误的或不合理的数据以及进行一致性检查。 数据净化通常采用统计软件进行,用SAS、SPSS、BMDP等软件,可以很简单方便地寻找超出范围、有极端值或逻辑上不一致的数据。 逻辑上不一致的数据也可以通过这些软件找出来。方法之一是做出交叉表,从中可以很方便地发现逻辑上不合理的数据。表10-3 例示用交叉表寻找逻辑上的不一致经常使用有时使用很少使用根本不使用非常熟悉5

11、1451812比较熟悉43324663有点熟悉44151听说过 但完全不熟悉208从未听说过2120 第三节 调查数据统计预处理 一、缺失值的处理 二、加权处理 三、原始数据或变量的转换一、缺失值的处理 处理缺失值主要有以下四种方法: 用一个样本统计量的值去代替缺失值。最典型的做法是使用变量的平均值。 用从一个统计模型中计算出来的值去代替缺失值。利用由某些统计模型计算得到的比较合理的值来代替,如利用回归模型、判别分析模型等。 将有缺失值的个案整个删除 将有缺失值的个案保留,仅在相应的分析中作必要的排除。这种方法是妥当的:样本量很大;缺失值很少;变量之间不是高度相关的。二、加权处理 其主要的目的

12、是为了使样本更具有代表性,或为了强调某些被访者群体的重要性。 加权处理的效果是在具有某些特征的样本中增加(权重 1)或减少(权重 1)个案的数量。 加权处理最广泛地用于在具体的特征指标方面使样本对目标总体更具有代表性。 加权处理的另一个作用是调整样本,使具有某些特征的被访者被赋予更大的重要性。表10-4 通过加权处理是样本更具代表性年龄 样本(%) 总体(%) 权重15-19148.60.6120-295824.90.4330-392325.51.1140-492.813.94.9650以上2.227.112.3合计100100三、原始数据或变量的转换 原始数据重新分类或重新编码的两种情况:需

13、要将数据分成更有意义的类别;需要将数据合并成更少的几个大类别。 将原始数据重新分类或重新编码合并时,要注意重新构成的类别必须满足以下三点:所有的情况已包括在新的类别之中;各个类别之间没有交叉或重叠;类别间的差异大于类别内的差异。 一种在分类中常用的重要的变量类型叫做“哑变量”或“二值变量”、“二分变量”、“指示变量”、“操作变量”等。这种变量只有两个取值,通常是0和1。一般的规则时,如果一个定类变量有K个类别,那么需要用K-1个亚变量来表示。为什么是K-1而不是K?原因是在K类中,只有K-1类是独立的,因为第K类的信息可以通过K-1类推得出。 重新规定变量的另一个情况是标准化,目的是为了采用不

14、同单位或不同量表的变量在分析中具有可比性。采用一般显著性检验中的标准化方法,可将得分X1,X2,-Xm转换成标准化得分Z1,Z2,-,Zm,公式如下: Zi=Xi-Mean(Xi) / SD(Xi) (i=1,2,-m) 其中Mean(Xi)和 SD(Xi)分别表示变量Xi的平均值和标准差。 第四节 数据统计任务书的制作统计任务书的内容选择统计方法是要考虑的因素常用统计方法的分类一、统计任务书的内容 统计任务书:项目主管或分析师应该将数据处理和统计分析的具体要求详细地列出来,以使计算机程序员或数据处理人员能明确其所需完成的全部统计工作。这份详细地列出全部必须完成的统计工作的可操作的清单。(一)

15、变量标识和变量值标识的编制在数据录入阶段,对变量一般可能只用字母和数字来表示。 (二)所需完成的基本统计数表例如,在“郑州市大瓶装纯水市场调查问卷”中,统计任务书有如下说明: 关于频表数计算出以下变量的频表数:A4,B2,B3,B6,等等。对以下变量计算均值:A4(最近购买的数量),B2(过去的三个月用了多少桶),B3(每桶多少钱),B6(一次性购买了多少长水票),等等。 关于交互分析表(部分说明)将样本分成现用户、潜在用户和非用户三部分表示。分类的原则是:如果B1=1,U=1(现用户)D1=1,U=2(潜在用户)D1=2,U=3(非用户)计算变量U和一下变量的交互分析表:F1,F5,J2,J

16、3,J4。按变量U计算以下变量的分类均值:J5(按各收入段的中间值计算)G1-1G1-23(态度得分),等等。将现用户、潜在用户按三大主要品牌(中美、深氏、沃力)分别分类,等等。(三)所需完成的统计图的形式和数量 关于统计图(部分说明)A11(首项无体式的知名度)的直方图,按知名度从大到小的顺序排列。A5-1至A5-11的平均得分的直方图;以及分别按姓名、年龄、文化程度、收入和职业分类折线图。(四)所需完成的基础统计分析 基础统计分析主要指完成一半的调查报告所需的最低要求的分析。 关于基础统计(部分说明)目前市场容量的估计目前各纯水品牌的市场占有率夏季市场容量的预测三大主要品牌用户基本情况比较 关于基础统计(部分说明)方差分析相关分析: 分别对回归分析: 分别对 (五)所需完成的高级统计分析或模型 对于有些比较专门的或深入地研究,高级统计分析或模型是必要的。二、选择统计方法是要考虑的因素研究的目的和性质研究的方法和数据的性质统计方法的作用和性质研究者和用户的背景三、常用统计方法的分类 常用统计方法可以按单变量技术和多变量技术分为两大类。单变量技术也称之为基础统计分析方法,适用于样本中的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号