市场调查资料的整理与分析

上传人:宝路 文档编号:47095960 上传时间:2018-06-29 格式:PPT 页数:47 大小:457.93KB
返回 下载 相关 举报
市场调查资料的整理与分析_第1页
第1页 / 共47页
市场调查资料的整理与分析_第2页
第2页 / 共47页
市场调查资料的整理与分析_第3页
第3页 / 共47页
市场调查资料的整理与分析_第4页
第4页 / 共47页
市场调查资料的整理与分析_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《市场调查资料的整理与分析》由会员分享,可在线阅读,更多相关《市场调查资料的整理与分析(47页珍藏版)》请在金锄头文库上搜索。

1、第六章 市场调查资料的整理与分析陈方英第一节 市场调查资料的整理第二节 市场调查资料的分析小结第一节 市场调查资料的整理一、资料整理的步骤和内容1、步骤2、审查内容 1)资料的真实性 2)资料的准确性 3)资料的完整性 二、资料整理的方法1、行列选择与数据输入2、汇编、制表和绘图 第二节 市场调查资料的分析 定性分析与定量分析 动态分析与静态分析 一、定性分析是与定量分析相对而言的,它是对不能 量化的现象进行系统化理性认识的分析,其 方法依据是科学的哲学观点、逻辑判断及推 理,其结论是对事物的本质、趋势及规律的 性质方面的认识。二、定量分析与预测v定量分析是指从事物的数量特征方面入 手,运用一

2、定的数据处理技术进行数量分析 ,从而挖掘出数量中所包含的事物本身的特 性及规律性,从而挖掘出数量中所包含的事 物本身的特性的分析方法。v分类:静态分析和动态分析(一)数据的静态分析:v含义:分析现象当前的情况或者是本次调查的 情况。v主要方法有:v1、数据的统计描述:v(1)数据的相对程度分析:频数(百分数),倍数 ,v (2)数据的集中趋势:均值和均标准误差,中 位数,众数,v(3)数据的离散程度:方差与标准差, v2、均值比较和T检验v3、方差分析、相关分析、回归分析、因子分 析、聚类分析等相对程度分析 它通过对比的方法反映现象之间的联系 程度,表明现象的发展过程。几分之几:一比几:倍数:

3、百分数:又叫频数(Frequency),是一 个变量在各个变量值上取值的个案数。案例:对50名顾客有关“饮料品牌” 选择的调查不同品牌饮饮料的频频数分布饮饮料品牌频频数比例百分比(%)可口可乐乐旭日升冰茶百事可乐乐汇汇源果汁露露15 11 9 6 90.30 0.22 0.18 0.12 0.1830 22 18 12 18 合计计5011001999年全国国际旅游外汇收入构成 国际际旅游收入(亿亿美元)比重(%)总计总计 长长途交通 游览览 住宿 餐饮饮 商品销销售 娱乐娱乐 邮电邮电 通讯讯 市内交通 其他服务务140.99 41.65 7.49 20.34 15.28 27.71 8.4

4、5 4.11 5.33 10.63100.0 29.6 5.3 14.4 10.8 19.7 6.0 2.9 3.8 7.5资料来源:中国旅游年鉴2000频数数据的集中趋势分析均值(平均值,平均数Mean)表示某变量所有取值的集中趋势或平均水平。包括 简单算术平均和加权算术平均。算术平均值加权平均值案例:v调查泰山游客的满意度,从六个方面入手(吃、住、 行、游、购、娱),用5点量表来测量,其中,1非常不 满意,5非常满意。某游客在吃、住、行、游、购、娱六 方面打分分别为:5,4,4,4,2,1,计算该游客的满意 度的算术平均值和加权平均值v1. 算术平均值:x=(544421)6=3.67v2

5、.加权平均值v(1)确立各个指标的权数:假设:吃0.15、住 0.15、行0.1、游0.3、购0.1、娱0.1v(2)加权平均值:v x=(50.1540.1540.140.320.1 10.1)=3.25众数(Mode)v众数(Mode)是总体中出现次数最多单位的 标志值 无众数 原始数据: 10 5 9 12 6 8一个众数 原始数据: 6 5 9 8 5 5v多于一个众数 原始数据: 25 28 28 36 42 42中位数(Median)v中位数(Median)是把一组数据按递增或递减的顺序排 列,处于中间位置上的变量值就是中位数。 【例】:9个家庭的人均月收入数据 原始数据: 150

6、0 750 780 1080 850 960 2000 1250 1630 排序: 750 780 850 960 1080 1250 1500 1630 2000 位置: 1 2 3 4 5 6 7 8 9中位数1080数据的离散程度分析v方差(Variance):是所有变量值与平均 数偏差平方的平均值,它表示了一组数据分 布的离散程度的平均值。v标准差(Standard Deviation):是方差的 平方根,它表示了一组数据关于平均数的平 均离散程度。v均值标准差(Standard Error of Mean ,S.E. mean):描述样本均值与总体均值之间 平均差异的程度。v方差与标

7、准差越大,表示变量之间的差异 越大,距离平均数这个“中心”的离散趋势越大 。 均值比较和T检验均值比较(Compare Means):比较不同样本之间平均 值是否存在显著性差异。T检验(T-Test):A单一样本的T检验(one-sample T test):研究研究某一样本均值与指定值之间是否存在显著性差异。B两独立样本T检验(Independent-samples T test):独立样本是指两个样本之间彼此独立没有任何关联,两独 立样本各自接受相同的测量。两独立样本T检验的主要目的就是了解这两个样本之间是否存在显著性差异。 C两配对样本T检验(Pared-Samples T test):

8、是根据样本数据对样本来自的两配对总体的均值是否存在显著性差异进行推断。 显著性差异的含义显著性差异(Significant Difference,sig.):就是先 给定一个显著性水平数值,0.05(95%),或0.01(99% ),或0.001(99.9%),v进行均值比较时,零假设为:假设两者之间不存在显 著差异。vSPSS统计检验结果进行均值比较时会给出比较结果的 相伴概率,v如果相伴概率大于0.5,表示大于95%的概率表明两者 之间确实不存在明显差异,则零假设成立;如果相伴概率 小于0.5,表示小于95%的概率表明两者之间确实存在明显 差异,零假设不成立,则表明两者之间确实存在明显差异

9、 。v显著性差异一般用*表示。*表示significance level0,v如果x,y变化的方向相反 ,如吸烟与肺功能的关系, 则称为负相关,r0.95 存在显著性 相关;v |r| 0.8 高度相关;v 0.5 |r|0.9:非常适合v0.8KMO0.9:适合v0.7KMO0.8:一般v0.6KMO0.7:不太适合vKMO0.5:不适合因子分析(Factor Analyze)v在SPSS主菜单中按“AnalyzeData ReductionFactor“顺序逐一单击鼠标键,打开 因子分析主对话框 聚类分析(Cluster Analyze)v聚类分析又称群分析,它是研究(样 品或指标)分类问

10、题的一种统计分析方法 。v在SPSS主菜单中按“AnalyzeData ReductionFactor“顺序逐一单击鼠标键, 打开因子分析主对话框 物以类聚 、人以群 分回归分析(regression analysis) v是确定两种或两种以上变数间相互依赖的定 量关系的一种统计分析方法。运用十分广泛。v按照涉及的自变量的多少 ,可分为一元回归 分析和多元回归分析 v按照自变量和因变量之间的关系类型,可分 为线性回归分析和非线性回归分析 一元回归分析v设预测目标因变量为Y,影响它变化的一个 自变量为X,因变量随自变量的增(减)方向 的变化。一元线性回归分析就是要依据一定数 量的观察样本(Xi,

11、 Yi),i=1,2,n,找出 回归直线方程v Y=a+bX (1)v(三)回归方程需要通过的显著性检验v对于任何给定的一组因变量、自变量观察样本资料,用最 小二乘法都可以计算出回量归方程参数,建立回归方程式。但 是,这样建立的回归方程并非一定有实用意义。 v1相关分析(对于一元线性回归方程来说,也就是回归系 数的t检验),就是借用统计方法用计算自变量、因变量观察样 本资料的相关系数,说明变量之间的线性相关密切程度,并通 过r显著性检验指出这种线性相关密切程度的显著性水平。v2方差分析(ANOVAF,回归方程的F显著性检验)是分 析自变量与因变量线性相关关系对因变量的变异的影响程度, 并通过F

12、显著性检验指出反映自变量与因变量线性相关关系的 回归方程式的显著性水平。只有通过r显著性检验和F显著性检 验,才能说明建立的回归线性方程有实际意义。v3回归系数的显著性检验(t检验):对于一元线 性回归方程来说,回归系数的t检验就是相关系数的显 著性检验。v4模型的拟合优度R2(Goodness of fit)分析:模型 的拟合优度表示所建立的回归方程预测值与实际观察 到的值之间差异的大小,一般用判定系数R2实现, R2 越接近1,表明方程的拟合度越好,所建立的方程与 实际方程越接近。v5回归方程的残差检验。v对于上述回归模型中的随机误差要求满足如下的假设条件:v残差序列要求正态分布的随机性变

13、量,且残差项之间互相 独立:v(1)应当是服从正态分布的随机变量,即满足“正态性“的假 设.v(2)残差的均值为零,即E()=0,我们称满足“无偏性“的假设 .v(3) 残差序列满足随机性:的方差等于=,这就是说,所有 的分布的方差都相同,即满足“共方差性“的假设.v(4) 残差序列互相独立:各个残差间相互独立,即对于任 何两个随机误差和其协方差等于零,即,Cov(,)=0, )这称之为满足 “独立性“的假设.v因此应该进行残差检验,判断回归模型的残差是否满足上 述假设vA残差序列的正态性分布:通过残差序列的 带正态曲线的直方图或累计概率图来分析。直 观观察图形来判断是否为正态分布。vB残差序

14、列的随机性:通过绘制残差序列和 对应的预测值序列的散点图判断,如果残差序 列是随机的,那么残差序列应与预测值序列无 关,残差序列点将随机地分布在经过零的一条 直线上。vC残差序列的独立性分析:回归模型中假设Cov(,)=0,即随机 项是独立的。这一假设是否成立,可以通过回归模型的误差序列 是否相互独立来进行检验。若误差序列各项间相互独立,则序 列各项之间没有相关关系。若序列各项之间有相关关系,误差 序列不满足线性回归模型的基本假设,回归模型就不能表达变 量Y与X之间的真实变动关系。DW(Durbin-Watson)检验可以 检验残差序列的相关性。其检验办法如下:v如果D-W0,表示残差序列存在完全自相关;如果D-W 4,表示残差序列存在完全负相关;如果0D-W2表示残差序 列存在某种程度的正自相关;如果2D-W4,表示残差序列存 在某种程度的负自相关;如果D-W2表示残差序列不存自相 关。在实际应用中,如果D-W接近2就基本认定残差序列具有 独立性vD通过残差序列分析实现样本奇异值( Casewise Diagnostic 或 Outliers)的诊断。 奇异值是样本数据中那些远离均值的样本数据 点,他们会对回归方程的拟合产生较大的偏差 影响,尽量要找出他们并加以排除。一般认为 ,如果某样本点对应的标准化残差值超出了 3+3的范围,就可以判定该样本数据为奇异 值。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号