资料整理与分析讲述

上传人:最**** 文档编号:117930645 上传时间:2019-12-11 格式:PPT 页数:44 大小:624KB
返回 下载 相关 举报
资料整理与分析讲述_第1页
第1页 / 共44页
资料整理与分析讲述_第2页
第2页 / 共44页
资料整理与分析讲述_第3页
第3页 / 共44页
资料整理与分析讲述_第4页
第4页 / 共44页
资料整理与分析讲述_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《资料整理与分析讲述》由会员分享,可在线阅读,更多相关《资料整理与分析讲述(44页珍藏版)》请在金锄头文库上搜索。

1、第九章 资料的整理与分析 学习目标 理解数据控制和检测的重要性 掌握数据录入的过程及其方法 学习将调查数据表格化的方法 学会建立和解释交叉列表(横列表) 掌握统计分析的基本技巧 一、资料整理 确认和编辑 编码 数据录入 数据清理 1. 确认 确认的目的是尽可能确保每份问卷都是有效问卷。 有效是指访谈是否按适当的方式进行,访问员有没有作 假。 确认被调查者是否真正接受了调查? 被调查者是否符合抽样条件? 确认调查是否按要求的方式进行? 确认调查是完整? 其他方面的问题。 2、编辑:现场编辑 现场编辑(field editing)就是初步编辑,其主要 任务是发现资料出非常明显的遗漏和错误,帮助控

2、制和管理实地调查队伍,应在问卷实施后尽快执行 ,以便问卷能在调查员解散之前得到校正。 1 问卷填写是否完整,有无漏答的问题 2 检查每份问卷是否按规定填写,字迹是否 清楚。 3 相关问题是否产生矛盾,不一致的现象, “其他”选项说明是否填写清楚 4 开放式问题是否都有详细的文字记录 5 若发现问卷漏答、矛盾、不合逻辑的问题 超过5题,该份问卷应该作废。 2、编辑:办公室编辑 办公室编辑(in-house editing) 现场编辑的工作最后归结到复查和访问上,办公室的编 辑工作最后归结到对查出的问题如何处理上。 主要问题: 不完整答卷:大面积无回答;个别问题无回答; 相当多的问卷对同一个问题无

3、回答。 明显的错误答案:指那些前后不一致的答案,或答非 所问的答案。 3.编码 编码是对一个问题的不同回答进行分组和确定数字 代码的过程。大多数问卷中的大多数问题是封闭式问题 ,并且已经预先编码。 开放式和半开放式问题的编码 列出答案 合并答案 设置编码 输入如编码 你为什么最喜欢喝彭城啤酒? 1 口感好 2 比较清淡 3 我喜欢这种口味 4 大家都喝这种品牌 5 市场上这种啤酒最畅销 6 不知道 7 朋友们都喝这种啤酒 8 价格便宜 9 因为它是新品牌 10 它是徐州人自己的啤酒 11 它的口味不如别的啤酒重 12 平时在商店购买方便 13 没什么特殊的理由 14 我无所谓 15 大多数人都

4、喝它 16 说不出来 17 我喜欢彭城啤酒这个品牌 答案归 类要 点 回答 项 分好的 数字 编 码 喜欢这 种口 味 1,2 ,3 , 11 1 价格因 素 8 2 从众因 素 4,5 ,7 , 15 3 购买方 便 12 4 不知道6,13 , 14 , 16 5 区域因 素 10 6 品牌喜 好 9,17 7 4.数据录入与清理 数据录入:p239 对录入数据的审核 二、应用于市场调研的统计分析类型 描述分析 Descriptive analysis 推理分析 Inferential analysis 差别分析 Differences analysis 联合分析 Associative

5、analysis 预测分析 Predictive analysis 描述分析 Descriptive analysis Certain measures such as the mean , mode, standard deviation or range are form of descriptive analysis 作用 数据抽象与减缩 方法 次数分布,算术平均数,中位数,众数 ,标准差与全距(极差) 推理分析 Inferential analysis 作用 确定总体参数,进行假设检验 例 估计总体数值 方法 参数估计,假设检验,显著差异检验 差别分析 Differences anal

6、ysis 作用 确定两组间所存在的差异是否显著 例 一个样本中的两个均值之间的差异是否 显著 方法 差异检验,方差分析 联合分析 Associative analysis 作用 确定现象间的关系 例 确定两个变量间是否存在相互关系,如 顾客满意度与企业形象 方法 相关分析方法,交叉表 预测分析Predictive analysis 作用 基于统计模型的预测 例 根据一个变量的数值来预测另一个变量的 数值 方法 时间数列分析,回归分析 1.频数分布 有时营销调研人员需要了解有关单个变量的信息 本品牌的使用者中有多少称得上是品牌忠诚者? 有多少个顾客对新产品很熟悉?多少比较熟悉? 有多少顾客对饭菜

7、的口味满意?多少不满意? l频数分布:了解对一个变量选择不同取值的调查对象 数量。 对一个变量的频数分布会产生频数、百分比、 累积百分比几个数据。 频数分布 作用: F 有助于明确未回答者的多少,同时也能 显示不合格答案的多少; F 可以检验奇异值和极端值; F 根据频数分布可以划出各种统计图形。 频数分布 频数分布 所想购买购买 的户户 型 频频数百分比有效百分比 累积积百分 比 一室一厅厅一卫卫3 2.13 2.19 2.19 两室一厅厅一卫卫39 27.66 28.47 30.66 两室两厅厅一卫卫12 8.51 8.76 39.42 两室两厅厅两卫卫9 6.38 6.57 45.99

8、三室一厅厅一卫卫32 22.70 23.36 69.34 三室一厅厅两卫卫15 10.64 10.95 80.29 三室两厅厅一卫卫4 2.84 2.92 83.21 三室两厅厅两卫卫10 7.09 7.30 90.51 四室两厅厅两卫卫1 0.71 0.73 91.24 措层层2 1.42 1.46 92.70 越层层2 1.42 1.46 94.16 其他8 5.67 5.84 100.00 Total137 97.16 100.00 Missing4 2.84 Total141 100.00 频数分布 2.描述性统计分析 集中趋势统计指标 均值/平均数( mean) 众数(mode) 中

9、位数(median ) 离散程度指标 全距/极差(range ) 方差(variance)和 标准差(standard deviation) 平均数 F反映总体分布的集中趋势; F反映总体现象的共性特征; F是总体分布的重要数量特征值; 平均数的局限性 一个身高180的不会游泳的人想涉水过河,已知河的平均 深度为1米,此人是否过河?为什么? 某人想购买一台冰箱,现有如下信息: 冰箱品牌 A B 平均使用年限 10 10 最多使用年限 20 12 最少使用年限 2 8 陈述总平均平均值差 别有无 录象机是必需品4.65.64.11.6 目前录象机价格太贵5.34.16.1-1.9 国产录象机质量

10、尚可3.94.23.70.5 样本大小500185315 例:人们对与录象机有关的问题的看法 众数M 众数是出现最频繁的数值,是分布中的高峰。 无众数 数据: 10.34.98.911.76.37.7 一个众数 数据: 6.34.98.9 6.3 4.94.9 一个以上的众数 数据: 212828414343 中位数 中位数是指把所有数据按照升序或降序排列后 居中的数值。 如果数据为奇数项,中位数是中间位置的数值 如果数据为偶数项,中位数是中间位置两个数 值的平均数 中位数 数据 :10.34.98.911.76.37.7 顺序 :4.96.37.78.910.311.7 位置 :123456

11、 当总体单位数n为奇数时 当总体单位数n为偶数时 小故事:骗人的“平均数” M:吉斯莫先生有一个小工厂,生产超级小玩意 儿。 M:管理人员由吉斯莫先生、他的弟弟、六个亲 戚组成。工作人员由5个领工和10个工人组成。工 厂经营得很顺利,现在需要一个新工人。 M:现在吉斯莫先生正在接见萨姆,谈工作问题 。 吉斯莫:我们这里报酬不错。平均薪金是每周 300元。你在学徒期间每周得75元,不过很快就可 以加工资。 骗人的“平均数” M:萨姆工作了几天之后,要求见厂长。 萨姆;你欺骗我!我已经找其他工人核对过了,没 有一个人的工资超过每周100元。平均工资怎么可能是 一周300元呢? 吉斯莫:啊,萨姆,不

12、要激动。平均工资是300元。 我要向你证明这一点。 吉斯莫:这是我每周付出的酬金。我得2400元,我 弟弟得1000元,我的六个亲戚每人得250元,五个领工 每人得200元,10个工人每人100元。总共是每周6900 元,付给23个人,对吧? 骗人的“平均数” 萨姆:对,对,对!你是对的,平均工资是每周 300元。可你还是蒙骗了我。 吉斯莫;我不同意!你实在是不明白。我已经把工 资列了个表,并告诉了你,工资的中位数是200元, 可这不是平均工资,而是中等工资。 萨姆:每周100元又是怎么回事呢? 吉斯莫:那称为众数,是大多数人挣的工资。 吉斯莫:老弟,你的问题是出在你不懂平均数、中 位数和众数

13、之间的区别。 萨姆:好,现在我可懂了。我我辞职! 离散程度指标:全距 F测量的是数据的分散程度,就是样本中最大值与最小 值之差。 F 全距直接到奇异值的影响 F 反映标志值的变动范围 F 全距计算简便,易于理解,应用普遍。 F 全距的计算:全距=最大标志值-最小标志值 离散程度指标:标准差 F标准差是各单位标志值与其平均数的离差平 方的算术平均数的平方根,它表示每个标志值 与平均数的平均距离。 例子 教育程度均值中位数众数方差全距 初中1.15 1.00 1.00 0.49 2.00 高中/技校1.23 1.00 1.00 0.58 2.00 中专1.48 1.00 1.00 1.04 4.0

14、0 大专1.79 1.00 1.00 1.52 5.00 大学本科或以上2.05 1.00 1.00 1.90 5.00 Total1.47 1.00 1.00 1.16 5.00 各种统计数量适用的情况 尺度类别尺度顺序尺度等距尺度与 比率尺度 集中趋势众数中位数均值 离散趋势频率或百 分比分布 累计百分 率分布 标准差, 全距 3. 横列表(交叉列表)分析 需要研究的问题: 品牌忠诚者中有多少是男性? 对新产品的熟悉程度与年龄和教育水平有关吗 ? 产品的拥有状况与收入的高低有关吗? 产品的使用量与对户外活动的兴趣有关吗? 3. 横列表(交叉列表)分析 1)横列表分析的意义: 横列表分析就是

15、同时将两个或两个以上的变量,按照一定 的顺序排列在一张表中,从中分析变量间的关系,得出科 学的结论 v 横列表分析及其结果很容易接受和理解; v 许多市场研究项目的数据处理分析可以依赖其得到解决 ; v 通过一系列的横列表分析,可以深入分析和认识复杂的 事物或现象; v 清楚明确的解释能使调研结果很快成为经营管理措施的 有力依据; 横列表中变量(因素)的选择 例:某保险公司对影响保险户开车事故率的因素进行调查, 并对各种因素进行横列表分析。 有无事故百分比% 有39 无61 样本量(人)17800 有无事故男女 有4434 无5666 样本量(人)93208480 39%的保险户在开 车时出现过事故。 男性在开车时出现事故 的百分比高于女性。 距离 事故 男(%)女(%) 1万KM1万KM1万KM1万KM 有49275027 无51735073 样本量(人 ) 717021502430

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号