《腾讯网市场数据分析附统计学知识》由会员分享,可在线阅读,更多相关《腾讯网市场数据分析附统计学知识(121页珍藏版)》请在金锄头文库上搜索。
1、CECE系列讲座之一:系列讲座之一:“市场研究及数据分析市场研究及数据分析市场研究及数据分析市场研究及数据分析”理念及方法概要介绍理念及方法概要介绍理念及方法概要介绍理念及方法概要介绍战略发展部战略发展部Objectives 从从Marketing Reseach的角度将的角度将CE 相关方法进行关联与梳理,旨在提相关方法进行关联与梳理,旨在提供一种全视图,以便根据应用需求选择性使用供一种全视图,以便根据应用需求选择性使用 !提供提供Consumer Insight的基本理论框架,以便将的基本理论框架,以便将Consumer Insight 理念融汇于各方法之中!理念融汇于各方法之中!简介实际
2、操作的基本原则,提高日常操作的效率与效果!简介实际操作的基本原则,提高日常操作的效率与效果! 人群人群购买力购买力需求需求市场市场有效市场有效市场有效市场有效市场是由一群对某一产品/服务有兴趣、有收入和有通路的潜在客户所组成序:市场序:市场产品产品产品产品/ / / /服务服务服务服务根据顾客根据顾客的的需要需要确定:确定:生产生产/ /提供提供特定特定的:的:将:将:有效地提供有效地提供给给目标消费者目标消费者产品产品产品产品/ / / /服务服务服务服务产品产品产品产品/ / / /服务服务服务服务序:营销的本质序:营销的本质优化顾客关系优化顾客关系/员工关系员工关系有效的沟通宣传有效的沟
3、通宣传优化市场渠道优化市场渠道理解人们的需求理解人们的需求和价值取向和价值取向根据理解开发更根据理解开发更好的品牌好的品牌通过创新满足人通过创新满足人们的需要们的需要序:营销的起点序:营销的起点&终点:用户需求终点:用户需求目录目录 What :Marketing Research 是什么?是什么?F Marketing Research 定义F Marketing Research 与营销的关系F Marketing Research 本质F Marketing Research 的角度看CE的几种方法 Why :为什么进行:为什么进行Marketing Research ? How : 如
4、何进行如何进行Marketing Research ?F Marketing Reseach 的分类 F Marketing Research 几个重要操作原则简介 抽样原则 定性大纲设计基本原则 定量问卷设计基本原则 数据分析:多元统计数据分析:多元统计& 数据挖掘基本方法数据挖掘基本方法F Consumer Insight 基本理论框架What(1):Marketing Research定义美国市场研究协会(美国市场研究协会( AMA)对市场研究的定义是:)对市场研究的定义是: 市场研究是将消费者、顾客及公众与厂商通过信息而市场研究是将消费者、顾客及公众与厂商通过信息而联系起来的桥梁,其信
5、息是用来联系起来的桥梁,其信息是用来:n识别、定义市场机会和市场问题识别、定义市场机会和市场问题n产生、改进和评估市场营销活动产生、改进和评估市场营销活动n监测市场营销的表现监测市场营销的表现n提高对市场营销过程的理解提高对市场营销过程的理解What(3):):Marketing Research本质是本质是Consumer Insight 了解消费者了解消费者 信息信息系统科学深入的消费者研究方法系统科学深入的消费者研究方法数据挖掘数据挖掘 (Data Mining ) 统计统计 (Statistic)定义市场研究定义市场研究 创意研讨会创意研讨会(Innovation Workshop)使
6、用和态度研究(使用和态度研究(U&A)市场细分研究市场细分研究(Segmentation) 信息信息理解理解 洞察洞察独特独特的洞察的洞察What (4) :Marketing Research角度看角度看CE的相关方法的相关方法系统科学深入的消费者研究方法系统科学深入的消费者研究方法数据挖掘数据挖掘 (Data Mining )定义市场研究定义市场研究 创意研讨会创意研讨会(Innovation Workshop)U&ASegmentation 信息信息理解理解 洞察洞察独特独特的洞察的洞察信息获取:信息获取: Marketing Research: 以访问为信息主要获取方式 信息来源以用户
7、回忆为主; 用户体验中心用户体验中心: 以观察为信息主要获取方式信息来源以用户实时操作为主; 数据挖掘数据挖掘:以记录用户实际发生的行为为信息主要获取方式; 信息来源以用户长期用户行为监测为主; 信息理解信息理解&应用:应用: Marketing Research:探求问题原因为主(与数据挖掘互补),以解决营销、品牌、运营问题为主; 主要应用包括自身产品+竞品研究; 用户体验中心:用户体验中心:探求互联网产品的使用障碍和流程,提升产品的可用性和易用性;主要应用包括自身产品+竞研究; 数据挖掘:数据挖掘: 以发现问题为主; 主要应用是自身产品研究目录目录 What :Marketing Rese
8、arch 是什么?是什么?F Marketing Research 定义F Marketing Research 与营销的关系F Marketing Research 本质F Marketing Research 的角度看CE的几种方法 Why :为什么进行:为什么进行Marketing Research ? How : 如何进行如何进行Marketing Research ?F Marketing Reseach 的分类 F Marketing Research 几个重要操作原则简介 抽样原则 定性大纲设计基本原则 定量问卷设计基本原则 数据分析:多元统计& 数据挖掘基本方法F Consum
9、er Insight 基本理论框架Why:为什么要使用市场研究:为什么要使用市场研究?决策决策?有市场研究有市场研究 没有市场研究没有市场研究 * 直觉的直觉的* 主观的主观的* 经验的经验的/历史的历史的* 从自身内部出发的从自身内部出发的* 有资讯基础的有资讯基础的* 客观的客观的* 实时的实时的 * 从外到内的从外到内的有风险的有风险的低成本的低成本的迅速迅速有争议的有争议的低风险的低风险的昂贵的昂贵的需要时间的需要时间的一致的一致的了解了解 我们往何处去我们往何处去资金资金/成本成本结构变化结构变化人员变化人员变化竞争对手竞争对手外在环境外在环境消费趋势消费趋势外部环境不确定性.外外部
10、部内内部部Why:市场研究可以提供什么:市场研究可以提供什么?市场市场. 市场容量 市场结构 消费者细分 消费者期望/需求 市场分额 市场短期变化 长期演化趋势 定位定位.消费者如何看待 - 产品 /服务 - 包装,价格,广告 等. 品牌 /企业形象 如何提升产品形象? 如何定位,才能使新产品被消费者更易于接 受?.消费者消费者. 谁是产品/服务的消费者 -核心 / 游离 /潜在. 需求 & 期望 动机 如何才能被满足如何更好和他们沟通 如何维持他们的忠诚 哪里能找到更多消费者自身公司自身公司/企业企业. 我们的强/弱势 主要的市场机会 如何达到它们 如何克服威胁 供应链 通路终端 “内部顾客
11、 如何提升系统的效率?竞争对手竞争对手. SWOT分析 现有的市场活动 这些活动有效吗? 与消费者关系 行销定位 变化的早期预警 未来计划目录目录 What :Marketing Research 是什么?是什么?F Marketing Research 定义F Marketing Research 与营销的关系F Marketing Research 本质F Marketing Research 的角度看CE的几种方法 Why :为什么进行:为什么进行Marketing Research ? How : 如何进行如何进行Marketing Research ?F Marketing Rese
12、ach 的分类 F Marketing Research 几个重要操作原则简介 抽样原则 定性大纲设计基本原则 定量问卷设计基本原则 数据分析:多元统计& 数据挖掘基本方法F Consumer Insight 基本理论框架市场研究的分类市场研究的分类 n 专项研究专项研究n 定量研究定量研究n 定性研究定性研究n 连续性研究连续性研究n 零售网点研究零售网点研究n 媒介监测研究媒介监测研究n 消费者跟踪研究消费者跟踪研究有多少?主要特征是什么?将来怎么样?简而言之简而言之简而言之简而言之什么?为什么?怎么样?定量定量定性定性HARDSOFT市场研究的分类市场研究的分类- 定性定性&定量对比(定
13、量对比(1)How:市场研究的分类:市场研究的分类-定性定性&定量对比(定量对比(2)研究内容研究内容支持体支持体调查方式调查方式分析方法分析方法深广度深广度定定 性性 n动机、态度、决过程动机、态度、决过程n口头表达的信息口头表达的信息n深访、座谈会深访、座谈会n心理分析心理分析, ,经验经验/ /灵感灵感n深度探测深度探测定定 量量 n事实、意见、行为事实、意见、行为n数字、尺度数字、尺度n入户面访、街访、电话、信函入户面访、街访、电话、信函n统计分析统计分析n广度探测,多方面和表面广度探测,多方面和表面定性研究的优点:定性研究的优点:深层次、多角度、多种方式(如投射技术等)获得信息,而且
14、受时间的限制较少。客户可以根据研究的进展,适当的调整研究的重点。项目的总费用相对较低,时间较短。定性研究的不足之处:定性研究的不足之处:不具有以样本推断总体特性,不能统计分析。提供描述性的资料,而非“硬性”的数据市场研究的分类市场研究的分类-定性定性&定量对比(定量对比(3)定量定量 :度量度量, , 分析分析, , 估计估计, , 预测预测 和跟踪和跟踪定性定性 :解释解释, , 产生产生, , 精炼精炼, , 说明说明 和描述和描述普遍性问题普遍性问题: : 先做定性研究还是先做定量研究先做定性研究还是先做定量研究? ?回答回答: : 这取决于你的研究目的,你甚至可以两者都做这取决于你的研
15、究目的,你甚至可以两者都做! !对市场了解甚少对市场了解甚少探索性的定性研究定量研究(U&A)诊断性的定性研究定量研究对市场很有把握对市场很有把握对数据看不明白对数据看不明白量化数据量化数据市场研究的分类市场研究的分类-定性定性&定量对比(定量对比(4)市场研究的分类市场研究的分类-定性定性&定量调查的具体方法定量调查的具体方法定性研究的调查方法定性研究的调查方法 ( ( 数据获取方法数据获取方法 ) ) 深度访谈深度访谈 焦点座谈会焦点座谈会(Focus Group) 神秘客户访谈神秘客户访谈抽样基本原则(抽样基本原则(1)什么才是好的抽样?什么才是好的抽样?有足够的代表性符合统计学基本原理
16、具有充分的可操作性有效率的实施/执行中的偏差越小越好常用的抽样方法?定性研究定性研究不是随机抽样所涵盖的范畴需注意其样本有足够的代表性定量研究定量研究入户访问:分层系统抽样街头访问:配额抽样配额抽样,但不具备理论上的抽样条件预约面访:视具体情况而定,关键是是否取得比较完整的抽样框备注:对于抽样统计学原理,有兴趣的可以备注:对于抽样统计学原理,有兴趣的可以TinaFuTinaFu联系,在此不做详述联系,在此不做详述。 抽样基本原则(抽样基本原则(2 ) 样本量的选取样本量的选取:从理论上讲,样本数越大,抽样误差越小,结果的代表性越好。但是,同时考虑费用和时间因素,大样本量不一定是最有效率的办法。
17、在随机抽样条件下,不同样本规模的抽样误差如下: 置信度样本量80%90%95%99%1505.23%6.72%8.00%10.52%2004.53%5.82%6.93%9.11%2504.05%5.20%6.20%8.15%3003.70%4.75%5.66%7.44%5002.87%3.68%4.38%5.76%定性大纲设计基本原则定性大纲设计基本原则 结构设计原则(漏斗结构结构设计原则(漏斗结构):):From wide to narrow: 例如:从生活方式到产品使用行为&态度From generic to specific 例如:从品类到品牌 问题设计原则问题设计原则:挖掘为什么? 即
18、表象原因背后可能隐藏的深层次的原因(很大程度上取决于对业务的理解)努力使用开放式问题,避免进行引导和给出选择性答案; 注意前后问题的相互干扰性突出重点可以使用投射技术,但不要过多部分专题可以使用Laddering技术:例如从功能利益点到情感利益点的探求,多用于创意的产生定性大纲设计基本原则:定性大纲设计基本原则:Case StudyLifestyle attitude Category/product attitude and usage Brand awareness and usage Brand image Product/brand concept Advertising evalua
19、tion Product/packaging test/evaluation U&ABrand imageConcept testAdv./Concept Test定量问卷设计基本原则:定量问卷设计基本原则:2个基本原则个基本原则UNDERSTANDING可理解:保证回答的准确性可理解:保证回答的准确性WILLINGNESS有意愿:保证回答的真实性有意愿:保证回答的真实性n 问题&答案不要含糊清晰且可以落地;n 问题&答案不能带有倾向性;n 问题&答案不能有双重含义;n 问题与答案不协调具有一致性;n 答案之间具有排他性 n 不要使用行业/专业/技术术语n对于敏感问题(包括涉及社会道德准则、社
20、会地位等等):通过映射第三方得到答案定量问卷常用的问题类型定量问卷常用的问题类型封闭式问题注意点:尽可能穷尽选项,但往往很困难;因此需要增加“其他”选项;如果其他选项占比超过,则说明选项设置有问题;开放式问题 应用场景:往往在封闭题之后,提出相关的追问;评分题主要有5分制、7分制、10分制 :选用几分制取决于需要细化的程度问卷设计:问卷设计:Case Study 您您觉得得拍拍这两年拍拍这两年来情况怎来情况怎样?(问题不清晰)不清晰)1234几乎没有什么变化变化不大变化较大变化很大大家都认为拍拍的这个新功能不错,您觉得怎么样呢?大家都认为拍拍的这个新功能不错,您觉得怎么样呢?(具有引导性)(具
21、有引导性)123459很不满意不太满意一般比较满意非常满意说不清/无所谓拍拍新推出了一项(什么什么样的)功能,您觉得怎么样呢?拍拍新推出了一项(什么什么样的)功能,您觉得怎么样呢?(选项不全)(选项不全)12345很不满意不太满意一般比较满意非常满意您在什么情况下使用手机上网?您在什么情况下使用手机上网?【答案不排他答案不排他】1234乘坐交通工具时 上课上班时 需要找人聊天 需要去查找信息看新闻5678躺在床上休息时 等人等车时吃饭时 其它问卷结构:问卷结构:Case Study General attitudes/beliefsScreening questionsClassificati
22、on dataUsership questionsSensitive questionsIntroductionGeneral survey questions Closing and thanksOrder of asking52736148数据分析:数据分析:“简单数据分析简单数据分析+ 多元统计多元统计+ 数据挖掘数据挖掘”整体视图整体视图简单的数简单的数据分析据分析多元统计多元统计分析分析数据挖掘数据挖掘方法适用性与优势方法适用性与优势主要方法列举主要方法列举n 集中趋势分析:众数、中位数、均数集中趋势分析:众数、中位数、均数n 离散趋势分析:极差、方差、标准差离散趋势分析:极差、方差
23、、标准差n 交叉表交叉表n 剖面指数剖面指数n 数据加权数据加权n简单分析变量间关系n相对应用较广,较容易掌握和使用n对数据和使用者的要求较低 n 相关分析相关分析n 回归回归分析分析n 因子因子分析分析n 聚类聚类分析分析n 对应对应分析分析n 联合联合分析分析n分析变量间的因果关系、相似度等n多用于预测、 用户细分等场景n对数据要求:数据量要足够、数据周期要足够;n对使用者的要求:需要掌握基本的统计学知识和对业务有一定理解;n 神经网络神经网络n 决策树决策树n 等等等等n优势在于可以定制算法满足个性化需求和具备自适应和自学习性;n对数据要求;Oracle数据库支持;对数据量和数据健壮性要
24、求均很高;n对使用者要求:对算法、业务的理解度均高多元统计分析有需要者请参考附件基础统计;数据挖掘有需要者可和多元统计分析有需要者请参考附件基础统计;数据挖掘有需要者可和TinaTina联系联系简单数据分析简介(简单数据分析简介(1 ):集中趋势):集中趋势&离散趋势离散趋势集中趋势(集中趋势(Central Tendency)指标:指标:众数(Mode) :发生率最高的数值;适用于所有的测量水平中位数 (Median):数值排序后正好位于中间位置的数;适用于定序、定距、定比数据算术平均数或均值(Mean): 各数值的简单平均;适用于定距数据与定比数据离散趋势(离散趋势(Measures of
25、 Dispersion)指标:指标:全距或极差(Range): 一个定序型变量最大值与最小值的差上、下四分位数 :方差(Variance):一个变量所有值与其平均值之差的平方的平均数标准差(Standard Deviation):方差的平方根简单数据分析简介(简单数据分析简介(2):交叉表的行列百分比交叉表的行列百分比&交叉表交叉表总体年龄段人数高收入细分市场人数 列百分比 行百分比 指数 down across index % %中收入细分市场人数 列百分比 行百分比 指数 down across index % % 低收入细分市场人数 列百分比 行百分比 指数 down across in
26、dex % %18-65岁18-24岁25-34岁35-49岁50-65岁500125150125100150 100 30 10039 26 31 .2 10466 44 44 14733 22 26.4 8812 8 12 40150 100 30 10036 24 28.8 9642 28 28 9342 28 33.6 11230 20 30 100200 100 40 10050 25 40 10042 21 28 7050 25 40 10058 29 58 145高收入细分市场该年龄段的列百分比高收入细分市场某年龄段的剖面指数= 100%总体市场该年龄段的列百分比指数=100%是
27、等于总体市场指数=120%或以上,则认为显著高于总体水平指数=80%或以下,则认为显著低于总体水平举例:18-24岁的高收入人群的行百分比:26%; 指18-24岁高收入人群在整体高收入中的比例为26%; 18-24岁的高收入人群的列百分比:31.2%;指18-24岁高收入人群在18-24岁人群中的比例为31.2%18-24岁的高收入人群的剖面指数:104 ; 简单数据分析简介(简单数据分析简介(3):数据加权数据加权加权:加权:通过对总体中的各个元素设置不同的数值系数通过对总体中的各个元素设置不同的数值系数(即加权因子即加权因子/权重权重),使元素表现出所希望的相对重要性程度;,使元素表现出
28、所希望的相对重要性程度; 简单地说,就是要简单地说,就是要“让一些人变得比另一些人更重要!让一些人变得比另一些人更重要!”希望这种属性的个体达到的规模希望这种属性的个体达到的规模具有某一属性的个体的现有规模具有某一属性的个体的现有规模权重权重 = 多元统计分析:相关分析多元统计分析:相关分析Case Study总体实物商品 虚拟商品 网游虚拟商品 女装彩妆运动户外电脑硬件 随身听手机充值卡总体1.00 0.99 0.97 0.97 0.99 0.98 0.99 0.83 0.87 0.90 0.99 实物商品0.99 1.00 0.97 0.96 0.99 0.99 0.98 0.19 0.8
29、6 0.89 1.00 虚拟商品0.97 0.97 1.00 1.00 0.93 0.93 0.95 0.42 0.96 0.94 0.97 网游虚拟商品0.97 0.96 1.00 1.00 0.93 0.94 0.95 0.42 0.95 0.95 0.97 女装0.99 0.99 0.93 0.93 1.00 0.99 0.97 0.08 0.80 0.84 0.98 彩妆0.98 0.99 0.93 0.94 0.99 1.00 0.98 0.10 0.80 0.89 0.98 运动户外0.99 0.98 0.95 0.95 0.97 0.98 1.00 0.18 0.85 0.89
30、0.97 电脑硬件0.83 0.19 0.42 0.42 0.08 0.10 0.18 1.00 0.63 0.46 0.21 随身听0.87 0.86 0.96 0.95 0.80 0.80 0.85 0.63 1.00 0.92 0.87 手机0.90 0.89 0.94 0.95 0.84 0.89 0.89 0.46 0.92 1.00 0.90 充值卡0.99 1.00 0.97 0.97 0.98 0.98 0.97 0.21 0.87 0.90 1.00 总体实物商品 虚拟商品 网游虚拟商品 女装彩妆运动户外电脑硬件 随身听手机充值卡总体1.00 0.99 0.98 0.98 0
31、.99 0.97 0.94 0.83 0.95 0.85 0.98 实物商品0.99 1.00 0.98 0.95 0.99 0.94 0.90 0.78 0.93 0.87 0.97 虚拟商品0.98 0.98 1.00 0.98 0.96 0.95 0.92 0.37 0.97 0.92 0.92 网游虚拟商品0.98 0.95 0.98 1.00 0.95 0.98 0.96 0.29 0.99 0.88 0.93 女装0.99 0.99 0.96 0.95 1.00 0.94 0.89 0.40 0.91 0.81 0.98 彩妆0.97 0.94 0.95 0.98 0.94 1.0
32、0 0.99 0.33 0.97 0.85 0.93 运动户外0.94 0.90 0.92 0.96 0.89 0.99 1.00 0.26 0.95 0.83 0.90 电脑硬件0.83 0.78 0.37 0.29 0.40 0.33 0.26 1.00 0.24 0.75 0.57 随身听0.95 0.93 0.97 0.99 0.91 0.97 0.95 0.24 1.00 0.92 0.88 手机0.85 0.87 0.92 0.88 0.81 0.85 0.83 0.75 0.92 1.00 0.75 充值卡0.98 0.97 0.92 0.93 0.98 0.93 0.90 0.
33、57 0.88 0.75 1.00 成成交交量量相相关关系系数数成成交交额额相相关关系系数数多元统计分析:回归多元统计分析:回归&因子分析因子分析Case Study 因子一因子一F1:QQ会员、会员、QQ秀、秀、QQ宠物、宠物、QZONE对对QQ满意度的贡献:满意度的贡献:0,42因子二因子二F2:QZONE、QQ 游戏、游戏、QQ 堂、堂、QQ音速音速对对QQ满意度的贡献:满意度的贡献:0.23因子三因子三F3:移动:移动QQ对对QQ满意度满意度的贡献:的贡献:0.18满意度因子满意度因子&回归分析回归分析QQ 满意度满意度=0.42F1+0.23F2+0.18F3n情感诉求的产品对情感诉
34、求的产品对QQQQ满意度的贡献最大、其次是游戏类产品、功能性诉求的产品贡献最低。满意度的贡献最大、其次是游戏类产品、功能性诉求的产品贡献最低。Consumer Insight :WhySometimes, we do not want to admit or even realize the real reason for our behavior because it is, more often than not irrationalPeople do not always say what they mean or mean what they say (People are compl
35、ex)People become experts at making themselves sound rational defense mechanism. They lie to themselves and to othersPeople are not fully aware of their own underlying motivations or of the forces that determine their own behavior - therefore to ask why can be a waste of timeConsumer Insight(1) : Mot
36、ivation(1) Maslow马斯洛需求原理马斯洛需求原理SecuritySecurity安全需求安全需求Affiliation Affiliation 社交需求社交需求Physiological Physiological 生理需求生理需求Esteem Esteem 尊重需求尊重需求Self actualisationSelf actualisation自我实现自我实现Consumer Insight(1): Motivation(2 ) Universal Needs 自我表现自我表现自由自在自由自在自我放纵自我放纵乐趣与兴奋乐趣与兴奋自我感觉良好自我感觉良好吸引力吸引力和谐和谐爱与被
37、爱爱与被爱归属感归属感尊重尊重安全感安全感传统传统成为领导者成为领导者掌握和驾驭感掌握和驾驭感拥有知识和智慧拥有知识和智慧权权力力秩秩序序关关系系平平衡衡快快乐乐自自我我Consumer Insight(1): Motivation(2 ) Universal Needs 学术理论学术理论定性定性Workshop:在在13个国家的个国家的2000个被访者个被访者在在30个国家的初步定量研究个国家的初步定量研究定量研究定量研究建立所有的需求清单建立所有的需求清单200 个需求个需求70 个需求个需求40 个需求个需求15 个需求个需求Case Study -1.0 -.5 0.0 .5 1.0
38、1.5 2.0-.8-.6-.4-.20.0.2.4.6掌握和驾驭感传统爱和被爱归属感表现自我自我感觉良好QQ安全和谐MSN成为领导者自由自在尊重自我放纵拥有智慧和知识吸引力乐趣与兴奋腾讯TM生活需求品牌Dimension 2Dimension 1n MSN: 更加偏重社会属性,表现为和谐更加偏重社会属性,表现为和谐 与与 安全安全n QQ: 更加偏重自我属性,表现为自我感觉良好、表现自我更加偏重自我属性,表现为自我感觉良好、表现自我n TM : 同时兼有社会和自我的两种属性同时兼有社会和自我的两种属性,表现为表现为 自由自在、尊重、成为领导者自由自在、尊重、成为领导者Case StudynQ
39、QGameQQGame用户的情感诉求用户的情感诉求: :自由自在、自我放纵、乐趣与兴奋、拥有智慧和知识、尊重。自由自在、自我放纵、乐趣与兴奋、拥有智慧和知识、尊重。联众用户的情感诉求:爱和被爱、乐趣和兴趣、和谐。联众用户的情感诉求:爱和被爱、乐趣和兴趣、和谐。中游用户的情感诉求:吸引力、掌握和驾驭、自我感觉良好、安全。中游用户的情感诉求:吸引力、掌握和驾驭、自我感觉良好、安全。新浪游戏用户的情感诉求:表现自我、自由自在、拥有智慧和知识。新浪游戏用户的情感诉求:表现自我、自由自在、拥有智慧和知识。品牌情感诉求*:其他游戏品牌由于样本量低于30,无法进行数据分析。Multi-MeOccasion
40、Based Needs SegmentationAge, gender, SEGLifestageDEMOGRAPHICSConsumer Insight(2):Segmentation BEHAVIOURNEEDSATTITUDESProductPriceServiceBrand/ImageLifestyleInvolvementInterestRisk/ExperimentalismRepertoirePurchase processDecision processConsumer Insight(3) :Brand Locator Model123因子分析因子分析因子分析因子分析品牌定位
41、品牌定位品牌定位品牌定位 重要程度重要程度重要程度重要程度模拟定位模拟定位模拟定位模拟定位4确定消费者区别品牌,选择品牌的主要因素(因子)将每个品牌在这些主要因素上的表现定位衡量这些主要因素对整个产品市场,以及每个品牌分别的相对重要程度模拟品牌定位,确定优化品牌定位的关键所在Consumer Insight(4) : AIDAL ModelAttention 注意注意Interest 兴趣兴趣Desire 欲望欲望Action 行动行动 品牌认知度 品牌美誉度品牌偏好度品牌渗透情况品牌占有率品牌满意度品牌忠诚度品牌意向品牌形象Loyalty 忠诚忠诚Consumer Insight(5) :B
42、rand Equity Model(1)BrandValue品牌价值品牌价值(alternative)Equity品牌资产品牌资产Price价格价格Product产品产品Service服务服务Performance功能表现功能表现Functional 功能利益功能利益BrandValue品牌价值品牌价值=Brand value 品牌价值品牌价值Customer behaviour 消费者行为消费者行为Identification认同感认同感Approval社会认可社会认可Authority 权威性权威性Emotional 情感利益情感利益Affinity亲和力亲和力Barriers阻碍阻碍Lo
43、yal 忠诚忠诚Switch 转换品牌转换品牌Consumer Insight(5) :Brand Equity Model(2 ) Universal Needs 通用需求通用需求Consumer Insight(5) :Brand Equity Model(3 ) Prestige 声望声望Acceptability他人接受度他人接受度Performance功能表现功能表现Affinity亲和力亲和力Approval社会认可社会认可Heritage 历史传承历史传承Innovation 创新性创新性Authority 权威性权威性Nostalgia 美好回忆美好回忆Identificati
44、on 认同感认同感Equity品牌资产品牌资产Trust 信赖感信赖感Bonding 情感连结情感连结Caring 关怀关怀Endorsement 权威认可权威认可知名度知名度熟悉程度熟悉程度Consumer Insight(5) :Case Study Toilet paper 厕纸Toothpaste 牙膏Soft drinks 软饮料Computers 计算机Financial services 金融服务Automotive 汽车Bottled water 瓶装水Source: Research International Database0%50%100%Affinity 亲和力亲和力
45、Performance 功能表现功能表现Batteries 电池Shampoo 洗发水Telecoms 电信Spirits 酒类UtilitiesCoffee 咖啡Retail 零售Dog food 狗粮Airlines 航空服务Chocolate 巧克力某某些些市市场场更更多多地地由由亲亲和和力力驱驱动动Consumer Insight(5) :Case StudyMac 苹果Packard Bell Hewlett-Packard惠普TinyIBMGateway 基汇 Dell戴尔Compaq康柏市场平均值6012072949595105105111112Source: RI case s
46、tudy - UK home PC market数据来源:RI 英国家用电脑市场案例Case Study :我的品牌资产有多强?我的品牌资产有多强? Consumer Insight(5) :Case Study 他人接受度情感连接美好回忆历史传承权威认可创新性信赖感声望关怀QQMSNConsumer Insight(7) :Innovation Workshop 写于最后写于最后 一句话一句话“用户研究理念用户研究理念”和和“业务的理解业务的理解”是两条主线,是一切研究的起点和终点;是两条主线,是一切研究的起点和终点;数据采集方法(观察法、访问法、行为记录法)数据采集方法(观察法、访问法、行
47、为记录法)& & 数据分析方法(简单数据分数据分析方法(简单数据分析、多元统计分析、数据挖掘析、多元统计分析、数据挖掘 )仅仅是为了实现目标的工具,需要针对)仅仅是为了实现目标的工具,需要针对“实实际需要际需要”选择性使用!选择性使用! Know consumer world .了解消费者的世界 seize the future抓住未来“基础基础统计统计”应用简要概述应用简要概述战略发展部战略发展部 TinaFu / 2007目录目录 市场研究使用统计技术的必要性市场研究使用统计技术的必要性 统计技术的基础统计技术的基础F 测量尺度(变量)类型F 数据加权 数据的描述性统计数据的描述性统计:频
48、数分布和基本统计量:频数分布和基本统计量 数据的推断性统计数据的推断性统计:假设检验:假设检验 多元统计技术多元统计技术F 相关分析F 回归分析 F 因子分析F 主成分分析F 聚类分析 F 对应分析F 联合分析市场研究与统计学市场研究与统计学统计学统计学(Statistics)是关于是关于数据资料数据资料的的 的一门学科的一门学科收集收集整理整理分析分析推断推断市场市场(营销营销)研究研究(Marketing Research) AMA-是营销者通过信息与消费者、顾客和公众联系的一种职能。这些信息是营销者通过信息与消费者、顾客和公众联系的一种职能。这些信息用于识别和定义营销问题与机遇,制定、完
49、善和评估营销活动,监测用于识别和定义营销问题与机遇,制定、完善和评估营销活动,监测营销绩效,改进对营销过程的理解。营销绩效,改进对营销过程的理解。-确定解决问题所需的确定解决问题所需的信息信息,设计信息收集方法,管理和实施数据收集,设计信息收集方法,管理和实施数据收集过程,分析结果,就研究结论及其意义进行沟通。过程,分析结果,就研究结论及其意义进行沟通。市场研究的数据分析过程市场研究的数据分析过程问卷设计问卷设计数据录入和查错数据录入和查错探索性分析探索性分析确证确证/结论性分析结论性分析高级分析高级分析分析始于这里!确信问卷覆盖你要达成研究目的所需要的全部内容。巧妇难为无米之炊!设计不严谨、
50、信息不巧妇难为无米之炊!设计不严谨、信息不完备的问卷是任何完备的问卷是任何“强有力强有力”统计工具的统计工具的“毒药毒药”!大量的交叉表数据,对研究结论进行支持。对关键关键/核心题目的数核心题目的数据据(如Topline Data)进行简要分析,粗略把握研究发现,并生成初步的研究结论(可能只是假设)确信您获得了所需要的全部数据信息全部数据信息,并且它们是准确准确无误无误的。一方面,结合高级统计技术进行一些深入的数据挖掘和分析;一方面,将数据信息与营销理论结合,形成研究结论并给出建议。为什么要使用统计技术?为什么要使用统计技术?总体总体(Population)我们想要调查并获得研究我们想要调查并
51、获得研究问题的答案的特定群体问题的答案的特定群体(如如18-49岁每天吸烟至岁每天吸烟至少少10支以上的男性支以上的男性)样本样本(Sample)从总体中尽可能随从总体中尽可能随机抽取出的一个有机抽取出的一个有代表性的子集,他代表性的子集,他们是实际的受访者们是实际的受访者R1R2RN研究目的研究目的: 揭示总体在行为、态揭示总体在行为、态度等我们感兴趣的诸方面的属度等我们感兴趣的诸方面的属性性/特征特征解决方案解决方案: 从总体抽取一个有代从总体抽取一个有代表性的样本表性的样本通过访问分析样本通过访问分析样本通过使用统计量,从样本属性通过使用统计量,从样本属性/特征推断总体的属性特征推断总体
52、的属性/特征特征我们在使用哪些类型的统计技术?我们在使用哪些类型的统计技术?描述性统计学描述性统计学(Descriptive statistics)是将收集到的原始数据资料直接通是将收集到的原始数据资料直接通过图表等形式进行概括或描述过图表等形式进行概括或描述(如交如交叉表叉表),是对数据进行定量分析的不,是对数据进行定量分析的不可或缺的基础可或缺的基础推断性统计学推断性统计学(Inferential statistics)通过来自总体的有限多个样本获得通过来自总体的有限多个样本获得的带有不确定性的信息,来推测整的带有不确定性的信息,来推测整个总体的信息,如参数估计个总体的信息,如参数估计(少
53、用少用)、假设检验假设检验(常用常用)多元统计技术多元统计技术(multivariate technique)关注的是两个或以上变量之间的相关注的是两个或以上变量之间的相互关系互关系(相关系数、协方差、距离等相关系数、协方差、距离等),并基于相互关系进行各种分析,并基于相互关系进行各种分析,如因子分析,聚类分析等如因子分析,聚类分析等目录目录 市场研究使用统计技术的必要性市场研究使用统计技术的必要性 统计技术的基础统计技术的基础F 测量尺度(变量)类型F 数据加权 数据的描述性统计数据的描述性统计:频数分布和基本统计量:频数分布和基本统计量 数据的推断性统计数据的推断性统计:假设检验:假设检验
54、 多元统计技术多元统计技术F 相关分析F 回归分析 F 因子分析F 主成分分析F 聚类分析 F 对应分析F 联合分析市场调研面对消费者,但所测量的并不是消费者本身,而是测量他们的感受、态度、偏好和其他相关的特性。测量尺度测量尺度(变量变量):在调查中,不同被访者给出有差异答案/选项的各个题目/条目;测量尺度测量尺度(Measure scale)测量尺度测量尺度(Statistical Technique)定性变量定性变量(Qualitative Variable)定量变量定量变量(Quantitative Variable)名义尺度名义尺度(nominal scale)有序尺度有序尺度(ord
55、inal scale)定距尺度定距尺度(interval scale)比率尺度比率尺度(Ratio scale)测量尺度类型测量尺度类型名义尺度名义尺度(nominal scale)数字只用做对事物进行识别和分类的标志和标签例如:性别,婚姻状况,国籍/城市等;只允许计算有限的以频率计数为基础的统计指标,如百分比、众数等;有序尺度有序尺度(ordinal scale)数字代表事物拥有某种属性的相对程度/位置,但没有指明差别的大小例如:偏好排序,市场/行业地位等;频率计数,以及基于分位点的统计指标(百分位数,中位数等)定距尺度定距尺度(interval scale)尺度上数字相等的距离代表了被测特
56、性的相等值,即可以比较事物之间差别的大小例如:偏好/态度量表(5-scale/7-scale),重要性评分;零点位置不固定,即尺度可以变换;可以计算通常使用的统计量,但尺度值之间的比率及其它一些特殊统计量不适合计算;比率尺度比率尺度(Ratio scale)可以依据尺度值对事物进行分类、比较等,以及计算相互之间的差值、比率等例如:年龄,收入,工作年数,花费等;有绝对零点,可以计算所有统计量;测量尺度示例测量尺度示例表1. 测量尺度示例 名义尺度 有序尺度 定距尺度 比率尺度测试品牌品类编号到达率排序重要性(5-scale)投放量到达率(%)厦新手机11427574高露洁牙膏22520069联想
57、手机13312565三九胃泰44410051东信手机1535037第5季维C饮料365037金帝巧克力3728330阿迪达斯98115028三九正天丸4925028安吉尔饮水机51052722爱浪音响51115419耐克运动鞋91222514 来源:2003年第1季实效鉴证(武汉)加权加权(Weighting)是什么?是什么?希望这种属性的个体达到的规模希望这种属性的个体达到的规模具有某一属性的个体的现有规模具有某一属性的个体的现有规模权重权重 = 加权:加权:通过对总体中的各个元素设置不同的数值系数通过对总体中的各个元素设置不同的数值系数(即加权因子即加权因子/权重权重),使元素表现出所希望
58、的相对重要性程度;,使元素表现出所希望的相对重要性程度; 简单地说,就是要简单地说,就是要“让一些人变得比另一些人更重要!让一些人变得比另一些人更重要!”100 个被访者个被访者:40个男性60个女性想要让想要让男性:女性=1:1设置权重设置权重男性 = 1.25女性 = 0.83加权后数据:加权后数据:男性:40 x 1.25 = 50女性:60 x 0.83 = 50一个简单的例子:一个简单的例子:为什么要加权?为什么要加权?(1)应用应用1:所调研样本的人口统计结构与总体的实际状况不匹配,通过加权来消除/还原这种变异,达到纠偏的目的;例如,在SH和GZ各调查300样本,城市人口比例“SH
59、:GZ=2:1”(假设),在分析时我们希望将SH和GZ看作一个整体,则此时我们需要给SH样本一个2倍于GZ样本的权重;应用应用2:除了人口统计结构,在一些关键属性上测试样本组的代表性可能也会相对总体的实际状况过高/过低,此时,需要加权进行调整;这类不匹配大多是我们“故意”而为(通过“追加”样本实现),比如设置配额要求被访者中某产品的使用者达到50%,但总体市场中实际使用者仅为10%;有时,则是“非情愿”的出现,比如设置了能反映总体的配额比例,但实际操作却出现了比例偏高/偏低;为什么要加权?为什么要加权?(2)应用应用3:在样本组对比测试中,也会通过加权来调整不同组间的样本属性不相匹配的情形(通
60、常设有相同的配额,但执行有可能会出现差异);通常,加权对结果产生的差异很小,更多的是对结果从准确度上进行修饰;应用应用4:所测试样本出现了较多的缺失值,需要加权来纠正结果;对于面向单一客户的专项研究,在调查前基本都协议有要完成的样本量,故这种情形较少;因子加权:因子加权:对满足特定属性的所有被访者赋予一个权重,通常用于提高样本中具有某种特性的被访者的重要性;例如,研究一种香烟的口味是否需要改变,那么不同程度吸食者的观点也应该有不同的重要性对待:实际应用中,如果“经常/普通吸食者”的基数足够大,往往单独分析而不进行如上的加权处理;目标加权:目标加权:对某一特定样本组赋权,以达到们预期的特定目标;
61、例如,加权的类型加权的类型(1)想要:想要:品牌A的20%使用者 = 品牌B的50%使用者;或 品牌A的20%使用者 = 品牌A的80%非使用者;权重权重频繁吸食者3.0普通吸食者2.0偶尔/不吸食者1.0 轮廓加权:轮廓加权:与因子/目标加权不同(一维的),轮廓加权应用于对测试组的相互关系不明确的多个属性加权;面对多个需要赋权的属性,轮廓加权过程应该同时进行,以尽可能少的对变量产生扭曲;加权的类型加权的类型(2)AchievedKnown proportions of age & sexIf the relationship is known, a weighting matrix can
62、be produced制定一个加权计划制定一个加权计划(1)无论加权的动机是什么,但执行的过程是一样的执行的过程是一样的:依不同属性/指标将样本分为多个组(加权组),然后根据所希望各个组代表的个体规模赋予不同的权重;即明确分析子集/样本组,通常,较多的以人口结构变量、地域变量作为分类指标;明确各个分析子集/样本组中个体的代表性强弱(权重);加权是在数据收集结束后采取的数据“纠偏”行为,但一定要清醒的知道:配额设置不合适、FW执行差或其他错误而造成的“不好”的原始数据收集,即使加权也一定是“无效的”;“提前避免错误提前避免错误/失误发生,总好过事后的任何补救!失误发生,总好过事后的任何补救!”制
63、定一个加权计划制定一个加权计划(2)项目设计项目设计:我们是否有计划进行数据加权?设置什么样的配额 是否有必须的信息用于配额设置?不要设置不必要的配额,即加大FW难度,又增加成本;设置样本结构时,就应该考虑清楚如何去组织这些数据;记住:记住:“提前计划提前计划”,尽可能早的确定加权方案,最好在时间表中预留时间专门用于加权;原始数据原始数据:查数要针对“未加权”数表(或 hole-counts);明确加权遵循的原则,并分析加权对其它人口结构变量或关键指标带来的影响;数据中哪些变量是最重要的,加权只针对它们就足够了吧?与DP充分沟通,确保DP理解加权意图并正确操作;加权数据加权数据:确信“加权”被
64、正确地进行;确信数据准确无误后,才开始将数据转化为支持性图表;加权的负面影响加权的负面影响加权会使数据变得不太稳健是否有基数本身较小的数据加权后基数足够大?检验得到的显著性差异的可靠性如何?进行数据加权,事实上我们已经“低估”了总体的变异程度,对总体信息推断的精确度减低。加权数据的演示加权数据的演示如果数据有“加权”,我们要明确地告诉客户明确地告诉客户:为什么加权?加权方案的实施过程;加权对数据的影响,等等;通常,我们应该:在数表上同时标明同时标明“未加权未加权”和和“加权加权”的基数,在分析报告可灵活处理,但也应有清晰的、一致的标注;未加权基数:表明各个分析子集内数据的可靠性;加权基数:表明
65、各个分析子集的相对规模;目录目录 市场研究使用统计技术的必要性市场研究使用统计技术的必要性 统计技术的基础统计技术的基础F 测量尺度(变量)类型F 数据加权 数据的描述性统计数据的描述性统计:频数分布和基本统计量:频数分布和基本统计量 数据的推断性统计数据的推断性统计:假设检验:假设检验 多元统计技术多元统计技术F 相关分析F 回归分析 F 因子分析F 主成分分析F 聚类分析 F 对应分析F 联合分析描述性统计学描述性统计学(Descriptive statistics)描述性统计学:描述性统计学:是将收集到的原始数据资料直接通过图表等形式进行概括或描述;具体地,描述性统计需要考察数据的分布形
66、态(如频数分布),计算表征数据分布的数字特征(如均值,方差);显然,市场研究中由DP完成的大量交叉表,就是典型的对数据的描述性统计;在营销调研(定量)中,尽管是面对整个市场中具有某些属性的消费者进行抽样,但是由于特别的抽样设计、较大的样本容量和严格定义的被访者,通常认为调研信息能够推断整个市场状况(在一定的抽样误差下);因此,调研报告大量使用的仍然是数据的描述性统计。 频数分布频数分布(Frequency distribution)频数分布:频数分布:是了解一个变量选择不同取值的调查对象的数量,是对数据资料的完整描述。通常用直方图(histogram)来显示频数分布形状;频率分布经常会用到,尤
67、其是由其演变出的各种柱状图/条形图;频数低阔峰右偏型分布均值:43.1%标准差:19.5%测试品牌数:456个广告到达率来源:2003年第3季-2002年第4季实效鉴证无重复发布品牌广告到达率描述性统计量描述性统计量(1)描述性统计量描述性统计量(descriptive statistic):也称为基本统计量(basic statistic),是对数据的频数分布的概括,最常用的统计量包括:描述性统计量描述性统计量(descriptive statistic)集中趋势指标集中趋势指标(measure of location)测量数据分布的中心测量数据分布的中心变异性指标变异性指标(measure
68、 of variability)测量数据的分散程度测量数据的分散程度分布形态指标分布形态指标刻画数据的分布形态相对于正态分布的差异刻画数据的分布形态相对于正态分布的差异描述性统计量描述性统计量(2)均值均值(mean)中位数中位数(median)众数众数(mode)极差极差(range)方差方差(variance)标准差标准差(standard deviation)偏度偏度(skewness)峰度峰度(kurtosis)集中集中趋势趋势指标指标即平均数,mean=1/n*sum(X1:Xn);均值能够利用所有已知信息,但是对异常值(极小或极大值)很敏感;排序后居于中间位置的数值,有序尺度常用;
69、不能充分利用已知的所有变量信息,但不受异常值的影响;出现最频繁的数值,代表分布中的高峰;名义尺度(分组数据)常用变异变异性指性指标标最大值与最小值之差,range=max-min;直接受到异常值影响;离均差(观测值与均值之间的差)平方的均值;var=1/(n-1)*sum(Xi-mean)2);数据分布越分散(远离均值),方差越大;方差的平方根,stdev=SQRT(var);与数据本身有相同的量纲,常用;刻画数据在均值两侧偏差趋势的差异性对称分布:skewness=0,mean=median=mode;右偏分布:skewness0,meanmedianmode; 左偏分布:skewness0
70、,meanmedian3,分布曲线比正态分布突起;kurtosis3,分布曲线比正态分布平缓;目录目录 市场研究使用统计技术的必要性市场研究使用统计技术的必要性 统计技术的基础统计技术的基础F 测量尺度(变量)类型F 数据加权 数据的描述性统计数据的描述性统计:频数分布和基本统计量:频数分布和基本统计量 数据的推断性统计数据的推断性统计:假设检验:假设检验 多元统计技术多元统计技术F 相关分析F 回归分析 F 因子分析F 主成分分析F 聚类分析 F 对应分析F 联合分析推断性统计学推断性统计学(Inferential statistics)推断性统计学:推断性统计学:通过来自总体的有限多个样本
71、获得的带有不确定性的信息,来推测整个总体的信息;推断性统计学有4个理论组成部分基础:概率论;前提:抽样理论;主要内容:估计理论,假设检验理论;假设检验(Hypothesis test)假设检验基本原理:假设检验基本原理:提出一对相互对立的统计假设,以样本信息为决策依据,并以一个设定的概率,对检验假设作出拒绝/不拒绝的决策。假设检验的一个基本假设基本假设是:小概率原理小概率原理,即在一次试验中,小概率事件不可能发生。假设检验包括:假设检验包括:单样本检验,主要针对抽样总体的数字特征(参数)提出统计假设;两样本检验,主要针对两样本之间的相关性或差异性提出统计假设;参数检验(parametric t
72、est),检验统计量(test statistic)服从某个已知分布;非参数检验(nonparametric test),即分布自由检验,底分布可以是任意的;假设检验的一般步骤假设检验的一般步骤建立H0和H1收集数据计算检验统计量选择适当的检验方法选择显著性水平a决定检验统计量的概率决定检验统计量的临界值与显著性水平a比较决定临界值是否位于拒绝域拒绝或不拒绝H0得出市场营销结论假设检验的关键术语假设检验的关键术语(1)零假设零假设(null hypothesis)和备择假设和备择假设(alternative hypothesis):零假设即受到检验的假设,是对一种没有差异、没有影响的状态的描述
73、;拒绝零假设/接受备择假设是有力的,而一次检验接受零假设是不充分的;检验方法:检验方法:单尾检验(one-tailed test)和双尾检验(two-tailed test) 双尾检验:备择假设双方向或无方向表述;只检验差异的存在性,事前无某种支持倾向; 单尾检验:备择假设以单方向表述;对结论有一定的方向性支持,检验力度相对更高;假设检验的关键术语假设检验的关键术语(2)显著性水平显著性水平(level of significance):即第一类错误发生的概率:即第一类错误发生的概率a由抽样数据作出推断,总有可能犯两类错误;第一类错误a (type I error):拒绝了实际上正确的零假设,
74、即“弃真”;第二类错误b (type II error):接受了实际上错误的零假设,即“取伪”;显著性水平a由研究者对拒绝真实零假设可容忍的风险水平设定;在确定分布下,第二类错误b与样本容量n和a存在数量关系;a=0.05的意义是:真实零假设被拒绝的概率只有0.05,或者说,每100次抽样中会有95次出现零假设的情形;拒绝H0:p=P检验统计量落入拒绝域 | H0成立a,即“一次试验小概率事件不可能发生”;两独立样本两独立样本(Independent sample)均值的均值的t检验检验检验目的:检验目的:是差异性检验,如检验在细分市场1和细分市场2中品牌认知或忠诚度是否存在差异。t检验检验(
75、t test)的前提假设:的前提假设:变量服从正态分布,均值已知(或可估计),方差可由样本估计。T 统计量:统计量:通常的营销研究环境:来自任何总体的大样本大样本(大于30,t 统计量无精确值,均值的抽样分布近似正态分布),此时,样本标准差是总体标准差的一个合理估计。从而,T 统计量用正态分布统计量用正态分布Z统计量替统计量替代:代:两独立样本两独立样本(Independent sample)均值的均值的t检验检验得到两独立大样本均值t检验的接受域(accept area)/置信区间(confidence interval),a=0.05,双尾检验:请参阅基于以上公式编辑的自动处理t检验的文件
76、:t test for difference between two percentages.xls目录目录 市场研究使用统计技术的必要性市场研究使用统计技术的必要性 统计技术的基础统计技术的基础F 测量尺度(变量)类型F 数据加权 数据的描述性统计数据的描述性统计:频数分布和基本统计量:频数分布和基本统计量 数据的推断性统计数据的推断性统计:假设检验:假设检验 多元统计技术多元统计技术F 相关分析F 回归分析 F 因子分析F 主成分分析F 聚类分析 F 对应分析F 联合分析统计技术的分类统计技术的分类统计技术统计技术(Statistical Technique)单元统计技术单元统计技术(Un
77、ivariate Technique)多元统计技术多元统计技术(Multivariate Technique)针对单个变量分析,可以是针对单个变量分析,可以是定量数据或非定量数据,可定量数据或非定量数据,可以是单样本或多样本,多种以是单样本或多样本,多种方法可以选择用于推断变量方法可以选择用于推断变量的分布特征的分布特征关注的是两个或以上变量之关注的是两个或以上变量之间的相互关系间的相互关系(相关系数、协相关系数、协方差等方差等)多元统计技术多元统计技术多元统计技术多元统计技术方方差差/协协方方差差分分析析判判别别分分析析典典型型相相关关分分析析联联合合分分析析因因子子分分析析主主成成分分分分
78、析析聚聚类类分分析析对对应应分分析析回回归归分分析析相相关关分分析析对所考察的变量都有自变量对所考察的变量都有自变量(independent variable)和因变量和因变量(dependent variable)之分,即要之分,即要解决的是一组变量对一个解决的是一组变量对一个/多个变量多个变量的影响关系和程度的影响关系和程度不区分自变量和因变不区分自变量和因变量,所有变量同等对量,所有变量同等对待,侧重于了解变量待,侧重于了解变量之间互相关关系之间互相关关系相关分析相关分析(Correlation Analysis)的定义的定义相关分析相关分析 - 了解两个定量了解两个定量(定距定距/定比
79、定比)变量之间是否存在线性关系,及变量之间是否存在线性关系,及其相关程度;例如其相关程度;例如-产品的购买意愿产品的购买意愿/独特性评价与消费者对产品诸属性认知的相关程度如何;独特性评价与消费者对产品诸属性认知的相关程度如何;-产品的诸多属性产品的诸多属性/功能的满意度认知分别在多大程度上影响消费者对产品的整功能的满意度认知分别在多大程度上影响消费者对产品的整体满意度评价;体满意度评价;相关系数相关系数 在相关分析中,表征两个定量变量之间线性相关程度的指在相关分析中,表征两个定量变量之间线性相关程度的指标标/统计量统计量-最常用的是最常用的是Pearson 相关系数相关系数(简单相关系数简单相
80、关系数):-r是一个无量纲数,且是一个无量纲数,且-1 r 模拟的特征考察目前/未来市场上中低挡电脑的主流配置,确定特征水平:特征特征特征水平特征水平价格500060007000品牌AABBXXCPU赛扬 300PII 350K6 350硬盘容量2.1G3.2G4.3G联合分析示例联合分析示例(2)产品模拟产品模拟-利用上述特征及特征水平可以组合出3X3X3X3=81中虚拟产品,但用于消费者评显然是太多了;-采用“正交设计”,可以将要测试的虚拟产品减少到9种:虚拟产品品牌价格CPU硬盘容量AXX5000K6 3503.2GBBB7000赛扬 3003.2GCAA5000赛扬 3002.1GDA
81、A6000PII 3503.2GEXX6000赛扬 3004.3GFAA7000K6 3504.3GGXX7000PII 3502.1GHBB6000K6 3502.1GIBB5000PII 3504.3G联合分析示例联合分析示例(3)数据收集数据收集通过让被访者回答一些精心设计的题目,揭示被访者对各特征的重视程度:-提问:请问您有多大可能会购买以下电脑呢?-采用9分法评价,1-完全不可能,9-非常可能;-依次提问完所有9种产品,得到XX牌电脑:牌电脑:价格价格5000元,采用元,采用K6 350型型CPU,硬盘容量为,硬盘容量为3.2G。虚拟产品购买可能性虚拟产品购买可能性A8F7B2G5C
82、6H6D8I9E4联合分析示例联合分析示例(4)计算特征计算特征/特征水平的效用特征水平的效用-采用哑元法,使用最小二乘法估计模型参数aij;-借助SPSS中的Conjoint模块进行分析,得到:-“相对重要程度”表示该特征在购买中被消费者岁关心的程度;本例,对该消费者而言,CPU型号是最关心的(38.5%),其次是价格;-“特征水平的效用”表示该特征水平对于消费者而言的效用;效用越高,表示该特征水平越受欢迎;本例,该消费者心目中认为AA品牌要好于BB/XX。品牌价格特征水平特征水平的效用特征水平特征水平的效用AA0.88950001.556BB-0.4446000-0.111XX-0.444
83、7000-1.444特征的相对重要程度:15.4%特征的相对重要程度:34.6%CPU硬盘容量特征水平特征水平的效用特征水平特征水平的效用赛扬 300-2.1112.1G-0.444PII 3501.2223.2G-0.111K6 3050.8894.3G0.556特征的相对重要程度:38.5%特征的相对重要程度:11.5%联合分析示例联合分析示例(5)市场预测市场预测联合分析的迷人之处可以对产品的前景进行预测,即-得到产品特征的效用函数后,可以对产品的各种特征组合进行模拟决策;本例,设有研究问题:在价格6000元时,推出何种配置的XX电脑,才能战胜目前市场上的主流产品Y(假设):BB, K6
84、 350, 6000元, 4.3G。而XX电脑可行的配置主要有3种:-X1: K6 350, 4.3G;-X2: PII 350, 4.3G;-X3: PII 350, 3.2G;我们分别计算产品Y, X1, X2, X3对消费者的效用值:-U(Y) = U(价格) + U(品牌) + U(CPU) + U(硬盘) = -0.111+(-0.444)+0.889+0.556=0.889-U(X1) = 0.889-U(X2) = 1.223-U(X3) = 0.556显然,以6000元定价的XX电脑,要想具有比产品Y更强的吸引力,就必须采用X2配置,即PII 350, 4.3G;事实上,作为定量研究,联合分析不是针对某个消费者个体进行的,而是面对很多消费者,因此,分析时应该:-计算每一个消费者个体的效用函数;-利用聚类分析,进行消费者细分;-将细分群体作为同质个体进行研究;谢谢 谢!谢!