数据分析汇报 (第五稿)

上传人:woxinch****an2018 文档编号:44740848 上传时间:2018-06-14 格式:PPT 页数:82 大小:7.82MB
返回 下载 相关 举报
数据分析汇报 (第五稿)_第1页
第1页 / 共82页
数据分析汇报 (第五稿)_第2页
第2页 / 共82页
数据分析汇报 (第五稿)_第3页
第3页 / 共82页
数据分析汇报 (第五稿)_第4页
第4页 / 共82页
数据分析汇报 (第五稿)_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《数据分析汇报 (第五稿)》由会员分享,可在线阅读,更多相关《数据分析汇报 (第五稿)(82页珍藏版)》请在金锄头文库上搜索。

1、深入浅出数据分析深入浅出数据分析目 录一、统计基础统计学是一种收集、处理、分析、解释数据并从数据中得出结论的科学。实际问题收集数据( 取得数据)处理数据( 整理数据)分析数据( 研究数据)解释数据( 结果说明)统计概念目的: (1)对数据集 进行描述; (2)利用样本 数据对总体作出 推断。一、统计基础数据类型定 性品 质定 量一、统计基础数据类型字符型数值型总体总体 样本样本总体:所研究的全部个体的集合样本:总体中的一部分元素参数参数 统计量统计量参数:描述总体特征的概括性数字度量统计量:描述样本特征的概括性数字度量变量变量分类变量:说明事物类别的一个名称顺序变量:说明事物有序类别的一个名称

2、数值型变量:说明事物数字特征的一个名称一、统计基础基本概念一、统计基础基本概念总 体样 本 研究对象的全体。 个体:组成总体的每一 单元,也称为总体单 位。 总体容量:总体中所包 含的全部单位数,通 常用N表示。 总体的一个数据子集。 样本容量:样本中包含的总体单位 个数,通常用n表示。 大样本 n30;小样本 n1或SK0尖峰,K1或SKF临界值,拒绝原假设,表明所检验因素对观测值有显著影响; F值【数据分析】 -【方差分析:无重复双 因素方差分析】【输入区域】:源数据选择“:0.05”二、数据分析方差分析二、数据分析相关分析相关分析是什么相关关系是现象之间确实存在的,但关系值不固定、不严格

3、的依存关系。当一现象数值发生变化时,往往可能出现几个不同的数值在一定的范围内变动着,这些数值分布在它们的平均数周围。(a)正相关 (b)负相关 (c)无相关二、数据分析相关分析r的变化范围在-11之间,即0|r|1。当r=0,表示无相关。|r|=1,表示完全相关。r0,正相关。r0,负相关。当 0|r|0.3,微相关。 0.3 |r|0.5 ,低相关。0.5|r|0.8,显著相关。 0.8|r|1,高度相关。上述标准的划分要求样本数据足够多,这样相关系数所表明的关系程度才是可信的。相关系数rYX(销售额)(广告支出)二、数据分析回归分析回归分析是什么指对具有显著相关关系的变量,根据其相关形态选

4、择一合适的数学方程来表达变量间的平均变动关系的统计分析方法。通过分析与预测对象有联系的现象的变动趋势,推算预测对象未来的数量状态。基础和前提相关 分析回归 分析深入和继续线性回归方差回归逻辑回归定序回归生存回归数值型因变量与自变量品质型因变量与数值型自变量逻辑型因变量与自变量顺序型因变量与自变量生存周期与自变量二、数据分析回归分析二、数据分析回归分析回归分析步骤简单直线回归分析设x为自变量、y为因变量用y代表y实际观察值的平均值,即理论(估计)值。直线方程为:y = a+bx式中:a直线截距,表明变量的基础水平;b直线斜率,又称回归系数,b为正表 明两变量是正相关, b为负表明两变量是负相关。

5、用最小平方法求解b、a两个参数值 ,即:y=0+ 1x1+ 2x2+ 3x3+ ixi+二、数据分析回归分析二、数据分析回归分析学生人数销售额确定好因变量销售额和自变量学生人数后,首先绘制两个变量的散点图,来比较直观的描述变量间的相互关系。这是为了确定数据间是否具有线性分布特征,只有数据具有线性分布特征时,才能够采用线性回归方法。图中可以很直观的看出销售额和学生人数是有一定线性分布特征的。添加趋势线得出回归分析模型。趋势线二、数据分析回归分析回归统计 Multiple R0.950122955 R Square0.90273363 Adjusted R Square0.890575334标准误

6、差13.82931669 观测值10方差分析dfSSMSFSignificance F 回归分析11420014200 74.248366012.54887E-05 残差81530191.25 总计915730 Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0% Intercept60 9.22603481 6.503335532 0.000187444 38.72472558 81.27527442 38.72472558 81.27527442 X Variable 150.58026523 88.61674915

7、6 2.54887E-05 3.661905962 6.338094038 3.661905962 6.338094038常规统计量,回归方程的拟合优度对回归方程的线性关系进行显著性检验回归参数估计相关内容回归分析结果二、数据分析回归分析使用多个统计指标来检验回归模型的优劣拟合优度:回归直线与各观测点的接近程度,需计算判定系数R2或调整的R2。回归方程的拟合优度二、数据分析回归分析回归统计 Multiple R0.950122955 R Square0.90273363 Adjusted R Square0.890575334 标准误差13.82931669 观测值101、Multiple R

8、:因变量和自变量之间相关系数的绝对值,本例R=0.95,说明销售额与人 数正相关; 2、R Square:判定系数R2(也称拟合优度或决定系数)越接近1,表示回归模型拟合效 果越好,本例R2=0.902,说明回归模型效果好; 3、Adjusted R Square:调整判定系数,多元线性回归时有意义,用于衡量加入其他自 变量后模型的拟合程度; 4、标准误差:在对于多个回归模型比较拟合程度时,值越小,拟合程度越好; 5、观测值:估计回归模型的数据个数(n),本例n=10。方差分析dfSSMSFSignificance F回归分析1142001420074.248366012.54887E-05残

9、差81530191.25总计915730 方差分析表是通过F检验来判断回归模型的回归效果,检验因变量和自变量之间的线性 关系是否显著。指标包括df(自由度),SS(误差平方和),MS(均方差),F(F统计量), significance F(P值)。回归方差的显著性检验二、数据分析回归分析1、 F(F统计量), 用于衡量变量间线性关系是否显著,F=74.24;2、 significance F (P值):是在显著水平(常用0.01或0.05)下的F的临界值。P0.05,结果不具有显著统计学意义,0.01P值0.05,具有显著的统计学意义,P值0.01,结果具有极其显著的统计学意义。回归系数表用

10、于回归模型的描述和回归系数的显著性检验。即研究自变量能够有效的解 释因变量的线性变化。回归方差的显著性检验二、数据分析回归分析Coefficients标准误差t StatP-valueLower 95%Upper 95% 下限 95.0% 上限 95.0%Intercept609.226034816.503335532 0.00018744438.72472558 81.27527442 38.72472558 81.27527442X Variable 15 0.5802652388.616749156 2.54887E-053.661905962 6.338094038 3.6619059

11、62 6.3380940381、第一列intercept、X variabile,分别为回归模型中的a(截距)、b(斜率);2、 第二列为a和b的值,可以由此写出线性模型;3、第四、五列分别是回归系数的t检验和相应的P值,P值同样与显著性水平进行比较;4、最后给出的是a和b的95%的置信区间的上、下限。二、数据分析因子分析因子分析是什么因子分析是将多个实测变量转换为少数几个不相关的综合指标(因子)的多元统计方法因子分析能做什么浓缩和提炼数据,以较少的几个因子反映原资料的 大部分信息。 寻求数据的基本结构,从原始数据中提取的几个因 子分别从不同侧面反映某个事物。 二、数据分析因子分析因子分析的应

12、用意义在市场研究中往往会选择多个变量来描述某个事物,如果直接对观测变量进行分析就会增加问题分析的复杂性,而且分析结果的经济意义往往也难以解释。利用因子分析方法从若干观测变量中提取几个因子,再对提取的因子做进一步的分析可以使结果更加清晰,也更易于解释。二、数据分析因子分析通过对提取的因子做聚类分析将受访者分成不同的人群 考察不同人群在人口、社会、经济学等方面的特征,为客户提供 细分市场潜在用户的全方位信息,为客户在目标市场大展鸿图指 明方向 市场细分能够帮助客户寻找并描述自己的目标市场。由于目标市 场与普通市场相比有更多的收益潜力,因此市场细分的研究意义 重大应用领域和解决的典型问题满意度研究需

13、要设计变量数目众多、层次分明的满意度指标体系 ,为了使满意度研究问卷设计的合理、更科学,必须在满意度研 究的预调查阶段对指标设置的合理性进行检验 进行因子分析可以发现哪些指标是可以从指标体系中剔除的,也 可以考察指标的设置是否满足了设计初衷(即指标的分类是否合 理) 根据因子分析的结果可以提取一些关键的指标进行竞争对手之间 的比较,做到有的放矢 通过对提取的因子进行多元回归分析能够在调查之初发现满意度 研究的哪个环节是需要关注的重点二、数据分析因子分析因子分析可以从研究品牌形象的诸多软性和硬性的特性中浓缩和提炼的出少数几个综合因素,使得品牌形象更加鲜明、独树一帜因子分析的结果可以用定位图的方式

14、呈现在品牌形象研究方面,定性研究的方法应用的比较早也相对成熟,但是随着统计学的发展同时也为了适应市场研究领域不断提出的更新要求,定量研究的方法越来越多的应用在了品牌研究方面二、数据分析因子分析因子分析可以从满意度研究的诸多因素中浓缩和提炼出几个互不 相关的综合指标,它们反映了满意度研究不同侧面的内容,同时 也涵盖了原有指标的大部分信息 把提取的因子和忠诚度的有关指标进行相关性的研究,我们可以 发现那些有助于提高用户忠诚度的关键所在,从而使客户的工作 更具有目标性 “继续使用、增加使用、推荐使用”是体现用户忠诚度的三个由低到 高的层次,不同层次的忠诚表现会给企业增加不同程度的收益, 因此忠诚度研

15、究日益成为客户关注的问题之一;从而发现究竟是 哪些因素影响了用户对某种产品或服务的忠诚度,成了市场研究 领域的又一个目标二、数据分析因子分析 因子分析要求变量为等距变量影响购买某种药品的因素二、数据分析因子分析问卷设计形式- 49 -阅读提示:所演示的案例以上页的问题为基础通过因子分析可以把原始变 量浓缩为5个因子因子1:广告和促销的影响因子2:周围人和朋友的影响因子3:疾病自身因子4:医生的影响因子5:报销手段的影响二、数据分析因子分析- 50 -通过因子分析还可以进行地区 间的比较,如左图 从图中可以看出,广告和促销 、医生及报销手段对上海人的 影响明显高于对北京人的影响 相应的,周围人和

16、朋友及疾病 自身的情况对北京人的影响又 明显高于对上海人的影响因子1:广告和促销的影响 因子2:周围人和朋友的影响 因子3:疾病自身 因子4:医生的影响 因子5:报销手段的影响二、数据分析因子分析无论是在自然科学领域还是市场研究领域,聚类分析的关键点通俗的讲就是“物以类聚”、“相似相融”。聚类分析是根据事物彼此不同的属性进行辨认,将具有相似性的事物聚为一类,使得同一类的事物具有高度的相似性,不同类的事物之间具有很大的差异性。二、数据分析聚类分析聚类分析是什么 聚类分析根据分类对象的不同分为:样本聚类和 变量聚类 样本聚类:对Case进行聚类 变量聚类:对Variable进行聚类样本聚类变量聚类二、数据分析聚类分析在市场研究领域,样本聚类分析主要是帮助我们寻找目标消费群体,划分出产品的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号