市场调查资料的整理与分析

资源描述

《市场调查资料的整理与分析》由会员分享，可在线阅读，更多相关《市场调查资料的整理与分析（47页珍藏版）》请在金锄头文库上搜索。

1、第六章市场调查资料的整理与分析陈方英第一节市场调查资料的整理第二节市场调查资料的分析小结第一节市场调查资料的整理一、资料整理的步骤和内容1、步骤2、审查内容 1）资料的真实性 2）资料的准确性 3）资料的完整性二、资料整理的方法1、行列选择与数据输入2、汇编、制表和绘图第二节市场调查资料的分析定性分析与定量分析动态分析与静态分析一、定性分析是与定量分析相对而言的，它是对不能量化的现象进行系统化理性认识的分析，其方法依据是科学的哲学观点、逻辑判断及推理，其结论是对事物的本质、趋势及规律的性质方面的认识。二、定量分析与预测v定量分析是指从事物的数量特征方面入手，运用一

2、定的数据处理技术进行数量分析，从而挖掘出数量中所包含的事物本身的特性及规律性，从而挖掘出数量中所包含的事物本身的特性的分析方法。v分类：静态分析和动态分析（一）数据的静态分析：v含义：分析现象当前的情况或者是本次调查的情况。v主要方法有：v1、数据的统计描述：v(1)数据的相对程度分析:频数（百分数）,倍数 ,v (2)数据的集中趋势：均值和均标准误差，中位数，众数，v(3)数据的离散程度：方差与标准差， v2、均值比较和T检验v3、方差分析、相关分析、回归分析、因子分析、聚类分析等相对程度分析它通过对比的方法反映现象之间的联系程度，表明现象的发展过程。几分之几：一比几：倍数：

3、百分数：又叫频数（Frequency），是一个变量在各个变量值上取值的个案数。案例：对50名顾客有关“饮料品牌” 选择的调查不同品牌饮饮料的频频数分布饮饮料品牌频频数比例百分比(%)可口可乐乐旭日升冰茶百事可乐乐汇汇源果汁露露15 11 9 6 90.30 0.22 0.18 0.12 0.1830 22 18 12 18 合计计5011001999年全国国际旅游外汇收入构成国际际旅游收入（亿亿美元）比重（%）总计总计长长途交通游览览住宿餐饮饮商品销销售娱乐娱乐邮电邮电通讯讯市内交通其他服务务140.99 41.65 7.49 20.34 15.28 27.71 8.4

4、5 4.11 5.33 10.63100.0 29.6 5.3 14.4 10.8 19.7 6.0 2.9 3.8 7.5资料来源：中国旅游年鉴2000频数数据的集中趋势分析均值(平均值，平均数Mean)表示某变量所有取值的集中趋势或平均水平。包括简单算术平均和加权算术平均。算术平均值加权平均值案例：v调查泰山游客的满意度，从六个方面入手（吃、住、行、游、购、娱），用5点量表来测量，其中，1非常不满意，5非常满意。某游客在吃、住、行、游、购、娱六方面打分分别为：5，4，4，4，2，1，计算该游客的满意度的算术平均值和加权平均值v1. 算术平均值：x=(544421)6=3.67v2

5、.加权平均值v（1）确立各个指标的权数：假设：吃0.15、住 0.15、行0.1、游0.3、购0.1、娱0.1v（2）加权平均值：v x=(50.1540.1540.140.320.1 10.1)=3.25众数(Mode)v众数(Mode)是总体中出现次数最多单位的标志值无众数原始数据: 10 5 9 12 6 8一个众数原始数据: 6 5 9 8 5 5v多于一个众数原始数据: 25 28 28 36 42 42中位数(Median)v中位数(Median)是把一组数据按递增或递减的顺序排列，处于中间位置上的变量值就是中位数。【例】：9个家庭的人均月收入数据原始数据: 150

6、0 750 780 1080 850 960 2000 1250 1630 排序: 750 780 850 960 1080 1250 1500 1630 2000 位置: 1 2 3 4 5 6 7 8 9中位数1080数据的离散程度分析v方差（Variance）：是所有变量值与平均数偏差平方的平均值，它表示了一组数据分布的离散程度的平均值。v标准差（Standard Deviation）:是方差的平方根，它表示了一组数据关于平均数的平均离散程度。v均值标准差（Standard Error of Mean ,S.E. mean）:描述样本均值与总体均值之间平均差异的程度。v方差与标

7、准差越大，表示变量之间的差异越大，距离平均数这个“中心”的离散趋势越大。均值比较和T检验均值比较（Compare Means）:比较不同样本之间平均值是否存在显著性差异。T检验（T-Test）：A单一样本的T检验（one-sample T test）：研究研究某一样本均值与指定值之间是否存在显著性差异。B两独立样本T检验(Independent-samples T test)：独立样本是指两个样本之间彼此独立没有任何关联，两独立样本各自接受相同的测量。两独立样本T检验的主要目的就是了解这两个样本之间是否存在显著性差异。 C两配对样本T检验(Pared-Samples T test):

8、是根据样本数据对样本来自的两配对总体的均值是否存在显著性差异进行推断。显著性差异的含义显著性差异（Significant Difference,sig.）:就是先给定一个显著性水平数值，0.05（95%），或0.01（99% ），或0.001（99.9%），v进行均值比较时，零假设为：假设两者之间不存在显著差异。vSPSS统计检验结果进行均值比较时会给出比较结果的相伴概率，v如果相伴概率大于0.5，表示大于95%的概率表明两者之间确实不存在明显差异，则零假设成立；如果相伴概率小于0.5，表示小于95%的概率表明两者之间确实存在明显差异，零假设不成立，则表明两者之间确实存在明显差异

9、。v显著性差异一般用*表示。*表示significance level0，v如果x,y变化的方向相反，如吸烟与肺功能的关系，则称为负相关，r0.95 存在显著性相关；v |r| 0.8 高度相关；v 0.5 |r|0.9：非常适合v0.8KMO0.9：适合v0.7KMO0.8：一般v0.6KMO0.7：不太适合vKMO0.5：不适合因子分析(Factor Analyze)v在SPSS主菜单中按“AnalyzeData ReductionFactor“顺序逐一单击鼠标键,打开因子分析主对话框聚类分析(Cluster Analyze)v聚类分析又称群分析，它是研究（样品或指标）分类问

10、题的一种统计分析方法。v在SPSS主菜单中按“AnalyzeData ReductionFactor“顺序逐一单击鼠标键, 打开因子分析主对话框物以类聚、人以群分回归分析（regression analysis) v是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛。v按照涉及的自变量的多少 ,可分为一元回归分析和多元回归分析 v按照自变量和因变量之间的关系类型，可分为线性回归分析和非线性回归分析一元回归分析v设预测目标因变量为Y，影响它变化的一个自变量为X，因变量随自变量的增（减）方向的变化。一元线性回归分析就是要依据一定数量的观察样本（Xi,

11、 Yi），i=1，2，n，找出回归直线方程v Y=a+bX (1)v（三）回归方程需要通过的显著性检验v对于任何给定的一组因变量、自变量观察样本资料，用最小二乘法都可以计算出回量归方程参数，建立回归方程式。但是，这样建立的回归方程并非一定有实用意义。 v1相关分析（对于一元线性回归方程来说，也就是回归系数的t检验），就是借用统计方法用计算自变量、因变量观察样本资料的相关系数，说明变量之间的线性相关密切程度，并通过r显著性检验指出这种线性相关密切程度的显著性水平。v2方差分析（ANOVAF，回归方程的F显著性检验）是分析自变量与因变量线性相关关系对因变量的变异的影响程度，并通过F

12、显著性检验指出反映自变量与因变量线性相关关系的回归方程式的显著性水平。只有通过r显著性检验和F显著性检验，才能说明建立的回归线性方程有实际意义。v3回归系数的显著性检验（t检验）：对于一元线性回归方程来说，回归系数的t检验就是相关系数的显著性检验。v4模型的拟合优度R2（Goodness of fit）分析：模型的拟合优度表示所建立的回归方程预测值与实际观察到的值之间差异的大小，一般用判定系数R2实现， R2 越接近1，表明方程的拟合度越好，所建立的方程与实际方程越接近。v5回归方程的残差检验。v对于上述回归模型中的随机误差要求满足如下的假设条件:v残差序列要求正态分布的随机性变

13、量，且残差项之间互相独立：v（1）应当是服从正态分布的随机变量,即满足“正态性“的假设.v（2）残差的均值为零,即E()=0,我们称满足“无偏性“的假设 .v（3）残差序列满足随机性：的方差等于=,这就是说,所有的分布的方差都相同,即满足“共方差性“的假设.v（4）残差序列互相独立：各个残差间相互独立,即对于任何两个随机误差和其协方差等于零,即,Cov(,)=0, )这称之为满足 “独立性“的假设.v因此应该进行残差检验，判断回归模型的残差是否满足上述假设vA残差序列的正态性分布：通过残差序列的带正态曲线的直方图或累计概率图来分析。直观观察图形来判断是否为正态分布。vB残差序

14、列的随机性：通过绘制残差序列和对应的预测值序列的散点图判断，如果残差序列是随机的，那么残差序列应与预测值序列无关，残差序列点将随机地分布在经过零的一条直线上。vC残差序列的独立性分析：回归模型中假设Cov(,)=0,即随机项是独立的。这一假设是否成立,可以通过回归模型的误差序列是否相互独立来进行检验。若误差序列各项间相互独立，则序列各项之间没有相关关系。若序列各项之间有相关关系，误差序列不满足线性回归模型的基本假设，回归模型就不能表达变量Y与X之间的真实变动关系。DW(Durbin-Watson)检验可以检验残差序列的相关性。其检验办法如下:v如果D-W0，表示残差序列存在完全自相关；如果D-W 4，表示残差序列存在完全负相关；如果0D-W2表示残差序列存在某种程度的正自相关；如果2D-W4，表示残差序列存在某种程度的负自相关；如果D-W2表示残差序列不存自相关。在实际应用中，如果D-W接近2就基本认定残差序列具有独立性vD通过残差序列分析实现样本奇异值（ Casewise Diagnostic 或 Outliers）的诊断。奇异值是样本数据中那些远离均值的样本数据点，他们会对回归方程的拟合产生较大的偏差影响，尽量要找出他们并加以排除。一般认为，如果某样本点对应的标准化残差值超出了 3+3的范围，就可以判定该样本数据为奇异值。

展开阅读全文

市场调查资料的整理与分析

最新文档