第七章调查数据处理知识课件

上传人:yuzo****123 文档编号:141565407 上传时间:2020-08-10 格式:PPT 页数:27 大小:237.50KB
返回 下载 相关 举报
第七章调查数据处理知识课件_第1页
第1页 / 共27页
第七章调查数据处理知识课件_第2页
第2页 / 共27页
第七章调查数据处理知识课件_第3页
第3页 / 共27页
第七章调查数据处理知识课件_第4页
第4页 / 共27页
第七章调查数据处理知识课件_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《第七章调查数据处理知识课件》由会员分享,可在线阅读,更多相关《第七章调查数据处理知识课件(27页珍藏版)》请在金锄头文库上搜索。

1、第七章,调查数据处理 Data Processing,调查资料处理是运用科学的方法,对调查所得的各种原始资料数据进行审查、检验和初步加工综合,使之系统化和条理化,成为适用的信息资料,从而能以集中、简明的方式反映调查对象总体情况的工作过程,调查数据处理的必要性和意义 调查数据信息量大、杂乱无章,须审核与处理,保证信息的一致性、客观性和有效性 可以产生新的资料信息 能够提高信息资料的质量与价值,市场细分的基本假定,“消费者过去的行为是其今后消费倾向的最好说明”。,通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个

2、体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,例如,每当我们用信用卡消费时,商业企业就可以在信用卡结算过程收集商业消费信息,记录下我们进行消费的时间、地点、感兴趣的商品或服务、愿意接收的价格水平和支付能力等数据;当我们在申办信用卡、办理汽车驾驶执照、填写商品保修单等其他需要填写表格的场合时,我们的个人信息就存入了相应的业务数据库,举一个简单的例子,当银行通过对业务数据进行挖掘后,发现一个银行帐户持有者突然要求申请双人联合帐户时,并且确认该消费者是第一次申请联合帐户,银行会推断该用户可能要结婚了,它就会向该用户定向推销用于购买房屋、支付子女学费等长期投资业务,

3、银行甚至可能将该信息卖给专营婚庆商品和服务的公司。,美国著名的国家篮球队NBA的教练,利用IBM公司提供的数据挖掘工具临场辅助决定替换队员,而且取得了很好的效果。系统分析显示魔术队先发阵容中的两个后卫安佛尼.哈德卫(Anfernee Hardaway)和伯兰.绍(Brian Shaw)在前两场中被评为17分,这意味着他俩在场上本队输掉的分数比得到的分数多17分。然而,当哈德卫与替补后卫达利尔.阿姆斯创(Darrell Armstrong)组合时,魔术队得分为正14分。在下一场中,魔术队增加了阿姆斯创的上场时间。,此着果然见效:阿姆斯创得了21分,哈德卫得了42分,魔术队以88比79获胜。魔术队

4、在第四场让阿姆斯创进入先发阵容,再一次打败了热队。在第五场比赛中,这个靠数据挖掘支持的阵容没能拖住热队,但数据挖掘毕竟帮助了魔术队赢得了打满5场,直到最后才决出胜负的机会。目前,NBA球队中大约20个使用了IBM公司开发的该软件系统来优化他们的战术组合。,审核资料,资料分类,数据编码,数据录入,数据处理的步骤,资料审核,内容: 完整性审核 准确性审核 一致性审核 及时性审核,资料审核的主要方法 经验判断 根据已有经验,判断数据的真实、准确 逻辑检查 根据项目之间的内在联系和实际情况,看是否有不合理或前后矛盾 计算审核 对数据资料的计算技术和有关指标之间的相互关系进行审查,看计算方法和计算结果有

5、无错误,前期调查访问的误差,回答不真实 无效问卷 1. 回答不完全,有相当多问题没有填写答案 2. 由不属于调查的目标受访者回答的问卷 3. 回答明显敷衍,没什么变化的问卷 4. 在截止日期之后回收的问卷 5. 缺损的问卷 6. 受访者没有理解问卷内容而错答问题 7. 前后矛盾或有明显错误的问卷 访问员的失职 ,资料分类,资料分类就是根据所得信息资料的性质、特点、用途等将所有资料归入适当的类别,以利于进一步的数据处理和分析,数据编码,编码就是将问卷信息转化为统一设计的计算机可以识别的代码,以便于对其进行资料整理和分析的过程 编码的主要作用 1. 减少数据录入和分析的工作量 2. 将定性数据转化

6、为定量数据 3. 减少误差,编码的基本原则 准确性 完整性 效率高 转换的代码要便于数据的整理与分析 标准化原则,以便于比较,编码设计的内容与分类 编码设计的内容 包括问卷的代码、变量的定义 如某问卷代码是“1051202”,第一位数字“1”表示北京市,后面两位数字“05”表示调查员代号,再后面两位数字“12”为居委会代号,最后两位代码“02”表示该调查员在此居委会成功调查的第2份问卷。 表意式文字编码又称助忆编码法。比如,用20TVC表示20英寸彩色电视机,其中20表示规格,TV表示电视机,C代表彩色。,数据输入前先给个问题或变量起个名称,一般用英文字母或数字的组合。可以用B (Backgr

7、ound)代表“背景”部分,Q (Question)代表“主体问题”,S (Sift)代表“、筛选问题”,编码设计的分类 根据问卷结构不同,分为结构式问卷编码设计和非结构式问卷编码设计 根据问卷类型不同,分为封闭题、半封闭题和开放题编码设计 根据编码设计的时间与方法不同,分为前设计和后设计,编码应注意的问题 1. 设计代码要系统化 2. 编码的内容要保持一致 3. 代码的设计要标准化 (等长,一一对应) 4. 编码是应该预留足够的位置,以适应需要的变化 5. 尽量使编码具有兼容性和通用性,以便于其他系统的信息共享,资料录入,应注意的问题 避免完全依赖计算机、只求速度的想法 要了解所要录入前,要

8、能够充分了解所要录入的调查内容并熟练掌握所使用的计算机软件的功能特点 录入人员要善于总结经验,积累经验 要采用科学合理的录入方法,市场调查资料的整理,排序与分类汇总 市场调查资料的统计分组 (一)基本作用:可以划分现象的类型; 可以揭示现象内部结构; 可以分析现象之间的依存关系 (二)利用Excel数据透视表分为单变量表格与双变量表格,前者称为单向表,后者称为交叉表 ,频数分布 在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为频数分布 绘制统计图 1. 条形图与柱形图 2. 饼形图 3. 直方图分析工具的使用,对比法 可以纵比,即不同时

9、间的同事物的信息资料相比较;也可以横比,如全面同局部比,先进同落后比,同行之间比等等。 化小法,亦称浓缩法 如美国年广告费开支达1400亿美元,可化为美国年广告费开支按全美人均计算,达每人约580美元 替代法 比如,某项生物工程的实施效益,相当于增加良田80万亩。GE伊梅尔特声称,公司未来增长争取达到美国GDP增长的2到3倍,这相当于每年生产一个耐克公司的收入,审核过程中常会遇到以下问题:,1调查作假 在调查问卷中出现不寻常的一致性,可能是由于调查人员对问卷的答案作假造成的。因此,发现这种行为时应仔细检查,剔除作假问卷,及时替补调查问卷,并追究调查人员的责任。2错误的回答 如年龄为300岁,可

10、能是调查人员笔误,需要进一步核实。3不一致的回答 如被调查者在某一问题中回答不吸烟,而在另一问题中却提到每天吸烟两包。4不完全的回答 如被调查者可能列出了所知道的卷烟品牌,而忘记列出最近3个月所买卷烟的品牌。,5难以分辨的回答如果邮寄问卷的答案是手写的,可能由于字迹潦草,一些问题的答案难以分辨,校验人员只好放弃这些答案。6答非所问的回答如:问是否满意电话订货员的服务,答为最喜欢的卷烟品牌是A牌。 7.“不知道”和没有答案在回答“不知道”时,表明被调查者未对所问问题形成一个答案或观点。没有答案则可能是被调查者没有回答或者调查人员忘记记录。不回答的情况一般有3种:(1)被调查者不理解所问问题,不知如何回答;(2)被调查者确实难以给出答案;(3)被调查者不想回答,答成“不知道”或不回答,以避免调查员的进一步询问。对于调查资料中出现的问题,为保证资料的真实性,校验人员应使用红笔统一标记,尽量避免直接修改资料的内容。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号