第9章调查资料的统计分析PPT课件

上传人:博****1 文档编号:571182266 上传时间:2024-08-09 格式:PPT 页数:73 大小:1.44MB
返回 下载 相关 举报
第9章调查资料的统计分析PPT课件_第1页
第1页 / 共73页
第9章调查资料的统计分析PPT课件_第2页
第2页 / 共73页
第9章调查资料的统计分析PPT课件_第3页
第3页 / 共73页
第9章调查资料的统计分析PPT课件_第4页
第4页 / 共73页
第9章调查资料的统计分析PPT课件_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《第9章调查资料的统计分析PPT课件》由会员分享,可在线阅读,更多相关《第9章调查资料的统计分析PPT课件(73页珍藏版)》请在金锄头文库上搜索。

1、1第九章第九章 调查资料的统计分析调查资料的统计分析 市场调研市场调研 教学目的教学目的 了解各种资料分析方法的基本原理,了解各种资料分析方法的基本原理,能针对具体调查项目和资料要求选择恰当能针对具体调查项目和资料要求选择恰当的分析方法,掌握初级统计分析方法和假的分析方法,掌握初级统计分析方法和假设检验的基本运用,对高级统计研究方法设检验的基本运用,对高级统计研究方法有一定了解。有一定了解。 2 市场调研市场调研 第一节第一节 统计分析概述统计分析概述第一节第一节 统计分析概统计分析概述述资料的统计分析资料的统计分析 运用数理统计方法,对调查所得数据资料运用数理统计方法,对调查所得数据资料进行

2、定量分析,以揭示事物内在的数量关系、进行定量分析,以揭示事物内在的数量关系、规律和发展趋势。规律和发展趋势。3 市场调研市场调研 第一节第一节 统计分析概述统计分析概述一、统计分析的作用一、统计分析的作用统计分析是进行科学预测未来的重要方法。统计分析是进行科学预测未来的重要方法。对变量关系进行深入分析,通过样本推论总体。对变量关系进行深入分析,通过样本推论总体。统计分析为研究提供一种清晰精确的形式化语统计分析为研究提供一种清晰精确的形式化语言,对原始资料进行简化和描述。言,对原始资料进行简化和描述。例:例:Y=4.38-0.16X4 市场调研市场调研 第一节第一节 统计分析概述统计分析概述二、

3、统计分析类型二、统计分析类型类型类型说明说明举例举例统计方法统计方法数据压缩数据压缩描述典型的被访问者,描述典型的被访问者,描述回答类似程度描述回答类似程度均值、中值、众均值、中值、众值、频率、标准值、频率、标准差、交叉列表差、交叉列表推断推断决定总体参数,决定总体参数,检验假设检验假设估计总体值估计总体值标准误差、零假标准误差、零假设设差别差别确定组与组之间确定组与组之间是否存在差异是否存在差异估计一个样本中两组均估计一个样本中两组均值差异值差异差别的差别的 t 检验、检验、方差分析方差分析相关相关确定联系确定联系确定两个变量是否在确定两个变量是否在系统状态下相关系统状态下相关相关分析相关分

4、析预测预测以统计模型为以统计模型为基础的预测基础的预测给出给出X的数量,估计的数量,估计Y的水平的水平时间序列、回归分时间序列、回归分析析描述描述5 市场调研市场调研 第一节第一节 统计分析概述统计分析概述1 1、描述统计:、描述统计:能够直接统计出数据结果,在分析过程的早能够直接统计出数据结果,在分析过程的早期经常用到,是后续分析的基础;期经常用到,是后续分析的基础;2 2、推断统计:、推断统计:在样本信息的基础上估计总体值;在样本信息的基础上估计总体值;3 3、差别统计:、差别统计:确定总体中真实存在的总的差异程度;确定总体中真实存在的总的差异程度;4 4、相关分析:、相关分析:审查两个(

5、自)变量是否相关和如何相关;审查两个(自)变量是否相关和如何相关;5 5、预测分析:、预测分析:帮助研究者对未来事件进行预测。帮助研究者对未来事件进行预测。6 市场调研市场调研 第一节第一节 统计分析概述统计分析概述三、统计方法的选择三、统计方法的选择1 1、研究问题的性质、研究问题的性质单变量分析:单变量分析:对单一事物状况的分析。常采用频率分对单一事物状况的分析。常采用频率分析、均值。析、均值。双变量分析:双变量分析:对两个变量之间有无关系,以及关系对两个变量之间有无关系,以及关系程度的分析,分为相关关系和因果关系。常采用交程度的分析,分为相关关系和因果关系。常采用交叉列表、相关分析、方差

6、分析或回归分析。叉列表、相关分析、方差分析或回归分析。7 市场调研市场调研 第一节第一节 统计分析概述统计分析概述2 2、数据资料的性质、数据资料的性质定性资料:定性资料:本身不具有可以测量的数值单位,仅根据本身不具有可以测量的数值单位,仅根据一项或几项所描述的特质加以区分的资料。一般采取一项或几项所描述的特质加以区分的资料。一般采取频率分析。频率分析。定量资料:定量资料:本身具有可以测量的数值单位,可以根据本身具有可以测量的数值单位,可以根据变量值连续排列的资料。可采用描述统计、相关分析、变量值连续排列的资料。可采用描述统计、相关分析、回归分析、因子分析、方差分析等所有统计方法。回归分析、因

7、子分析、方差分析等所有统计方法。8第二节第二节 描述统计分析描述统计分析 市场调研市场调研 第二节第二节 描述统计分析描述统计分析1、频数分布:、频数分布:将变量的值按照一定的类别、顺序和将变量的值按照一定的类别、顺序和距离划分成若干组,然后各组出现的次数记录下来,距离划分成若干组,然后各组出现的次数记录下来,构成频数分布。构成频数分布。地点地点1超市超市2百货店百货店3专卖店专卖店4其他其他频数频数2432524641总计总计555一、数据的集中趋势分析一、数据的集中趋势分析9 市场调研市场调研 第二节第二节 描述统计分析描述统计分析2、众数:、众数:在众多数值中,出现次数最多的一个数值。在

8、众多数值中,出现次数最多的一个数值。常用于取值较多的类别变量。常用于取值较多的类别变量。例:例:2,3,5,5,5,6,6,7,9,2,5,5,5,6在上面的数字中,出现次数最多的数是:在上面的数字中,出现次数最多的数是:5例:例:食品(食品(40%),日用品(),日用品(25%)化妆品(化妆品(15%),服装(),服装(20%)众数是:食品众数是:食品10 市场调研市场调研 第二节第二节 描述统计分析描述统计分析3、中位数:、中位数:按大小顺序排列,处在一群数据中央位置按大小顺序排列,处在一群数据中央位置的数值。的数值。常用于顺序变量。常用于顺序变量。例:例:47,42,50,92,68,1

9、12,71,83,108中央位置是:中央位置是:(N+1)/2例:例:47,42,50,92, 68, 112,83,108先作大小排列,求出中央位置:先作大小排列,求出中央位置:N/2, (N/2) +1所对应的那两个数的平均数即为中位数所对应的那两个数的平均数即为中位数11 市场调研市场调研 第二节第二节 描述统计分析描述统计分析4、平均数:、平均数:也称均值。一群数值的总和除以个体数也称均值。一群数值的总和除以个体数目所得的结果。目所得的结果。常用于等距变量和等比变量。常用于等距变量和等比变量。 平均数的资料利用率比较高,被认为是最佳集中平均数的资料利用率比较高,被认为是最佳集中趋势度量

10、值。但非常敏感。趋势度量值。但非常敏感。12 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例如:例如:甲组:甲组:80,80,80,80,80。 X=80乙组:乙组:40,40,80,120,120。X=80丙组:丙组:2,18,25,96,259。X=80离散程度:离散程度:表示变量不同取值的差异情况,测量的表示变量不同取值的差异情况,测量的是数值的离散趋势。是数值的离散趋势。二、数据的离散程度分析二、数据的离散程度分析13 市场调研市场调研 第二节第二节 描述统计分析描述统计分析1、异众比率:、异众比率:非众值次数与全部个体总数的比率。非众值次数与全部个体总数的比率。常常用于类

11、别量表。用于类别量表。例例来源来源城市城市农村农村郊区郊区生物系生物系化学系化学系50135295总数总数480110152288550异众比率异众比率 (50+135)/480 (110+152)/55014 市场调研市场调研 第二节第二节 描述统计分析描述统计分析2、极差或四分位差:、极差或四分位差:最大数值与最小数值之差。最大数值与最小数值之差。常用于等距量表和等比量表。常用于等距量表和等比量表。30 54 63 86 110极差极差 = 110-30= 110-30四分位差四分位差 = 86-54= 86-5415 市场调研市场调研 第二节第二节 描述统计分析描述统计分析3、标准差:、

12、标准差:一组数值与其平均数之差的平方和,除一组数值与其平均数之差的平方和,除以数值个数所得的平方根。以数值个数所得的平方根。常用于等距量表和等比常用于等距量表和等比量表。量表。63,50,46,37,34,28,25,22。平均值平均值=41,则标准差,则标准差=?16 市场调研市场调研 第二节第二节 描述统计分析描述统计分析三、数据的频率分布分析三、数据的频率分布分析家庭汽车数量家庭汽车数量家庭数家庭数12375232合计合计100(一)单因素列表分析(一)单因素列表分析17 市场调研市场调研 第二节第二节 描述统计分析描述统计分析家庭拥有车辆数家庭拥有车辆数频数频数汽车保有量汽车保有量12

13、37523275466合计合计10012718 市场调研市场调研 第二节第二节 描述统计分析描述统计分析收入(百美圆)收入(百美圆)家庭数家庭数家庭数比率(家庭数比率(%)135以下以下135-155155-17532328合计合计100100175-195195-215215-235235-255255-275275-295295-554554以上以上1474662613232814746626119 市场调研市场调研 第二节第二节 描述统计分析描述统计分析同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。(二)双因素列表分析(二)双因素列表分析汽车保有量汽车保

14、有量一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入7525544610020 市场调研市场调研 第二节第二节 描述统计分析描述统计分析低收入低收入高收入高收入合计合计一辆以内一辆以内一辆以上一辆以上合计合计家庭收入家庭收入汽车保有量汽车保有量4875255446100家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。21 市场调研市场调研 第二节第二节 描述统计分析描述统计分析一辆以内一辆以内家庭

15、收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入75255446100同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。622 市场调研市场调研 第二节第二节 描述统计分析描述统计分析同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入752554461002723 市场调研市场调研 第二节第二节 描述统

16、计分析描述统计分析同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入752554461001924 市场调研市场调研 第二节第二节 描述统计分析描述统计分析同时有两个变量参加交叉分组的频数分布表。同时有两个变量参加交叉分组的频数分布表。一辆以内一辆以内家庭收入与汽车保有量交叉分组频数家庭收入与汽车保有量交叉分组频数低收入低收入高收入高收入合计合计一辆以上一辆以上合计合计家庭收入家庭收入752554461004827

17、61925 市场调研市场调研 第二节第二节 描述统计分析描述统计分析低收入低收入高收入高收入一辆以内一辆以内一辆以上一辆以上合计合计家庭收入家庭收入汽车保有量汽车保有量89%59%11%41%100%100%个案数个案数5446家庭收入与汽车保有量交叉分组家庭收入与汽车保有量交叉分组行行百分比百分比低收入低收入高收入高收入一辆以内一辆以内一辆以上一辆以上家庭收入家庭收入汽车保有量汽车保有量64%36%24%76% 家庭收入与汽车保有量交叉分组家庭收入与汽车保有量交叉分组列列百分比百分比合计合计个案数个案数100%100%752526 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将

18、其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。家庭规模四口以内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平4426264632合计708784141381451722482761954467525100家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家

19、庭规模与汽车保有量交叉分组频数(三)三因素列表分析(三)三因素列表分析27 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。家庭规模四口以内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平41413814517224827

20、61954467525100家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数(三)三因素列表分析(三)三因素列表分析合计一辆以内一辆以上合计44262646327087828 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一

21、个变量的所有取值。家庭规模四口以内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平442626463270878482761954467525100家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数(三)三因素列表分析(三)三因素列表分析合计一辆以内一辆以上合计414138145172229 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在

22、下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。家庭规模四口以内四口以上全部家庭一辆以内一辆以上合计一辆以内一辆以上合计低高收入水平4426264632708784141381451722482761954467525家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数(三)三因素列表分析(三)三因素列表分析一辆以内一辆以上合计合计10030 市场调研市场调研 第二节第二节 描述统计分析描述统计分析 将其中一个自变量稳定在一个取值上,对另一个自变量将其中一个

23、自变量稳定在一个取值上,对另一个自变量和因变量作双向交叉分组;再将第一个自变量稳定在下一个和因变量作双向交叉分组;再将第一个自变量稳定在下一个取值上,作另外两个变量的交叉分组,依次类推,直至穷尽取值上,作另外两个变量的交叉分组,依次类推,直至穷尽第一个变量的所有取值。第一个变量的所有取值。(三)三因素列表分析(三)三因素列表分析家庭规模四口以内四口以上全部家庭低高收入水平414131451722482761954467525家庭收入、家庭规模与汽车保有量交叉分组频数家庭收入、家庭规模与汽车保有量交叉分组频数一辆一辆以内以内一辆一辆以上以上合计合计4426264632合计合计70878一辆一辆以

24、内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计100831 市场调研市场调研 第二节第二节 描述统计分析描述统计分析结论:在收入水平相同的情况下,家庭规模对汽车保有结论:在收入水平相同的情况下,家庭规模对汽车保有量有不同的影响。量有不同的影响。家庭规模家庭规模四口以内四口以内四口以上四口以上全部家庭全部家庭一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计96%81%家庭收入、家庭规模与汽车保有量交叉分组百分比家庭收入、家庭规模与汽车保有量交叉分组百分比4%19%100%100%(46)(32)50%

25、7%50%93%100%100%(8)(14)89%59%11%41%100%100%(46)32 市场调研市场调研 第二节第二节 描述统计分析描述统计分析家庭收入、家庭规模与汽车保有量交叉分组百分比家庭收入、家庭规模与汽车保有量交叉分组百分比家庭规模家庭规模四口以内四口以内四口以上四口以上全部家庭全部家庭一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计一辆一辆以内以内一辆一辆以上以上合计合计低低高高收收入入水水平平96%4%4%19%100%100%(46)(32)50%7%50%93%100%100%(8)(14)89%11%11%41%100%100%(5

26、4)(46)结论:在家庭规模相同的情况下,收入对汽车保有量有结论:在家庭规模相同的情况下,收入对汽车保有量有不同的影响。不同的影响。33 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内(四口以内(78)四口以上(四口以上(22)家庭收入家庭收入家庭规模家庭规模4%19%50%93%合计合计11%41%简表:按家庭收入与家庭规模交叉分组的简表:按家庭收入与家庭规模交叉分组的拥有拥有1辆以上辆以上汽车的家庭百分比汽车的家庭百分比结论:对不同规模的家庭综合起来考虑,收入水平的提升结论:对不同规模的家庭综合起来考虑,收入水平的提升将使某户拥有一辆以上汽车的机会增加将使某户拥有一辆以上

27、汽车的机会增加21%(0.15*78+0.43*22)/(78+22)= 0.21低收入(低收入(54)高收入(高收入(46)34 市场调研市场调研 第二节第二节 描述统计分析描述统计分析低收入(低收入(54)高收入(高收入(46)四口以内(四口以内(78)四口以上(四口以上(22)家庭收入家庭收入家庭规模家庭规模4%19%50%93%合计合计11%41%简表:按家庭收入与家庭规模交叉分组的简表:按家庭收入与家庭规模交叉分组的拥有拥有1辆以上辆以上汽车的家庭百分比汽车的家庭百分比结论:对不同的收入水平综合起来考虑,家庭规模的扩大结论:对不同的收入水平综合起来考虑,家庭规模的扩大将使某户拥有一辆

28、以上汽车的机会增加将使某户拥有一辆以上汽车的机会增加59%(0.46*54+0.74*46)/(54+46)= 0.5935 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例一:例一:家庭规模家庭规模介入家庭收入与拥有一辆以上汽车的关系介入家庭收入与拥有一辆以上汽车的关系低收入(低收入(54)高收入(高收入(46)四口以内(四口以内(78)四口以上(四口以上(22)家庭收入家庭收入家庭规模家庭规模4%19%50%93%合计合计11%41%按家庭收入与按家庭收入与家庭规模家庭规模交叉分组的交叉分组的拥有拥有1辆以上汽车的家庭百分比辆以上汽车的家庭百分比结论:引入第三变量后,原结论得到加

29、强(或减弱)结论:引入第三变量后,原结论得到加强(或减弱)(四)变量关系详析(四)变量关系详析36 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例二:例二:居住区域居住区域介入价值取向与拥有旅行车之间的关系介入价值取向与拥有旅行车之间的关系自由主义自由主义是是否否价值取向价值取向是否拥有旅行车是否拥有旅行车9(16%)合计合计价值取向与旅行车拥有状况价值取向与旅行车拥有状况保守主义保守主义11(24%)46(84%)34(76%)55(100%)45(100%)自由主义自由主义北方北方南方南方价值取向价值取向居住区域居住区域5%全体全体价值取向、价值取向、居住区域居住区域与旅行车拥

30、有状况与旅行车拥有状况保守主义保守主义5%41%43%16%24%37 市场调研市场调研 第二节第二节 描述统计分析描述统计分析价值取向、价值取向、居住区域居住区域与旅行车拥有状况与旅行车拥有状况结论:对不同的价值取向综合起来考虑,居住区域的改变将结论:对不同的价值取向综合起来考虑,居住区域的改变将使某户拥有旅行车的机会增加使某户拥有旅行车的机会增加37%。(0.36*55+0.38*45)/(45+55)= 0.37结论:居住区域与旅行车拥有状况有关系,而价值取向结论:居住区域与旅行车拥有状况有关系,而价值取向与之无关系。与之无关系。例二:居住区域介入价值取向与拥有旅行车之间的关系例二:居住

31、区域介入价值取向与拥有旅行车之间的关系自由主义(自由主义(55)北方(北方(61)南方(南方(39)价值取向价值取向居住区域居住区域5%全体全体保守主义(保守主义(45)5%41%43%16%24%38 市场调研市场调研 第二节第二节 描述统计分析描述统计分析价值取向、价值取向、居住区域居住区域与旅行车拥有状况与旅行车拥有状况例二:例二:居住区域居住区域介入价值取向与拥有旅行车之间的关系介入价值取向与拥有旅行车之间的关系自由主义(自由主义(55)北方(北方(61)南方(南方(39)价值取向价值取向居住区域居住区域5%全体全体保守主义(保守主义(45)5%41%43%16%24%结论:引入第三变

32、量后,证明原来的关系是虚假的。结论:引入第三变量后,证明原来的关系是虚假的。南方人倾向保守主义南方人倾向保守主义南方人拥有旅行车多南方人拥有旅行车多保守主义拥有旅行车多保守主义拥有旅行车多39 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内四口以内是是否否家庭规模家庭规模是否拥有外国经济车是否拥有外国经济车6(8%)合计合计家庭规模与外国经济车拥有状况家庭规模与外国经济车拥有状况四口以上四口以上6(27%)72(92%)16(73%)78(100%)22(100%)例三:例三:汽车保有量汽车保有量介入家庭规模与拥有外国经济车之间的关系介入家庭规模与拥有外国经济车之间的关系四口

33、以内四口以内一辆以内一辆以内一辆以上一辆以上家庭规模家庭规模汽车保有量汽车保有量6%全体全体家庭规模、家庭规模、汽车保有量汽车保有量与外国经济车拥有状况与外国经济车拥有状况四口以上四口以上0%25%35%8%27%40 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内(四口以内(78)一辆以内一辆以内一辆以上一辆以上家庭规模家庭规模汽车保有量汽车保有量6%全体全体家庭规模、家庭规模、汽车保有量汽车保有量与外国经济车拥有状况与外国经济车拥有状况四口以上(四口以上(22)0%25%35%8%27%结论:大家庭结论:大家庭必须拥有一辆以上的汽车时,必须拥有一辆以上的汽车时,才比小家庭

34、更可才比小家庭更可能拥有外国经济车。能拥有外国经济车。结论:引入第三变量后,原来的结论受到一个条件的限结论:引入第三变量后,原来的结论受到一个条件的限制。制。例三:例三:汽车保有量汽车保有量介入家庭规模与拥有外国经济车之间的关系介入家庭规模与拥有外国经济车之间的关系41 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内四口以内是是否否家庭规模家庭规模是否拥有客货两用车是否拥有客货两用车3(4%)合计合计家庭规模与客货两用车拥有状况家庭规模与客货两用车拥有状况四口以上四口以上15(68%)75(96%)7(32%)例四:例四:收入水平收入水平介入家庭规模与拥有客货两用车之间的关系

35、介入家庭规模与拥有客货两用车之间的关系四口以内四口以内低低高高家庭规模家庭规模收入水平收入水平4%全体全体家庭规模、家庭规模、收入水平收入水平与客货两用车拥有状况与客货两用车拥有状况四口以上四口以上63%3%71%4%68%42 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例四:例四:收入水平收入水平介入家庭规模与拥有客货两用车之间的关系介入家庭规模与拥有客货两用车之间的关系四口以内(四口以内(78)低低高高家庭规模家庭规模收入水平收入水平4%全体全体家庭规模、家庭规模、收入水平收入水平与客货两用车拥有状况与客货两用车拥有状况四口以上(四口以上(22)63%3%71%4%68%结论

36、:大家庭倾向于拥有客货两用车;而且随着收入水平结论:大家庭倾向于拥有客货两用车;而且随着收入水平的提升,高收入的大家庭更倾向于拥有客货两用车。的提升,高收入的大家庭更倾向于拥有客货两用车。结论:引入收入水平(第三变量)后,原来的结论得到结论:引入收入水平(第三变量)后,原来的结论得到继续支持。继续支持。43 市场调研市场调研 第二节第二节 描述统计分析描述统计分析总结:总结: 初始结论认为自变量与因变量之间存在某种初始结论认为自变量与因变量之间存在某种关系,引入第三变量后,可能导致以下几种结论:关系,引入第三变量后,可能导致以下几种结论:继续支持初始结论继续支持初始结论完全或基本相同,如例四完

37、全或基本相同,如例四初始结论提出的关系减弱(或加强)初始结论提出的关系减弱(或加强)普遍有所普遍有所变化,如例一变化,如例一初始结论被认为是有条件的关系存在初始结论被认为是有条件的关系存在有部分变有部分变化,如例三化,如例三初始结论被认为是虚假关系初始结论被认为是虚假关系完全不同,如例二完全不同,如例二44 市场调研市场调研 第二节第二节 描述统计分析描述统计分析例五:例五:收入水平收入水平介入户主受教育程度与是否使用信贷购车之介入户主受教育程度与是否使用信贷购车之间的关系间的关系高中以下高中以下是是否否户主受教户主受教育程度育程度是否使用信贷购车是否使用信贷购车24(30%)合计合计户主受教

38、育程度与使用信贷购车状况户主受教育程度与使用信贷购车状况大专以上大专以上6(30%)56(70%)14(70%)80(100%)20(100%)低低高高收入水平收入水平12%全体全体户主受教育程度、户主受教育程度、收入水平收入水平与使用信贷购车状况与使用信贷购车状况40%58%27%30%30%高中以下高中以下户主受教户主受教育程度育程度大专以上大专以上45 市场调研市场调研 第二节第二节 描述统计分析描述统计分析低低高高收入水平收入水平12%全体全体户主受教育程度、户主受教育程度、收入水平收入水平与使用信贷购车状况与使用信贷购车状况40%58%27%30%30%户主受教户主受教育程度育程度大

39、专以上大专以上结论:结论:低学历高收入低学历高收入和和高学历低收入高学历低收入倾向于使用信贷购车。倾向于使用信贷购车。高中以下高中以下结论:引入第三变量后,原来没有关系的受教育程度与结论:引入第三变量后,原来没有关系的受教育程度与使用信贷购车之间,变得存在相当程度的关系。使用信贷购车之间,变得存在相当程度的关系。例五:例五:收入水平收入水平介入户主受教育程度与是否使用信贷购车之间的关系介入户主受教育程度与是否使用信贷购车之间的关系46 市场调研市场调研 第二节第二节 描述统计分析描述统计分析北方北方是是否否居住区域居住区域是否拥有客货两用车是否拥有客货两用车11(18%)合计合计居住区域与客货

40、两用车拥有状况居住区域与客货两用车拥有状况南方南方7(18%)49(82%)33(82%)60(100%)40(100%)四口以内四口以内四口以上四口以上4%全体全体居住区域、居住区域、家庭规模家庭规模与拥有客货两用车状况与拥有客货两用车状况3%69%67%18%18%北方北方居住区域居住区域南方南方家庭规模家庭规模例六:例六:家庭规模家庭规模介入居住区域与客货两用车拥有状况之间的关系介入居住区域与客货两用车拥有状况之间的关系47 市场调研市场调研 第二节第二节 描述统计分析描述统计分析四口以内四口以内四口以上四口以上4%全体全体3%69%67%18%18%北方北方居住区域居住区域南方南方家庭

41、规模家庭规模结论:居住区域对拥有客货两用车没有影响,起作用的是家庭结论:居住区域对拥有客货两用车没有影响,起作用的是家庭规模这个因素。规模这个因素。结论:引入家庭规模(第三变量)后,再次肯定了初始结论:引入家庭规模(第三变量)后,再次肯定了初始结论。结论。居住区域、居住区域、家庭规模家庭规模与拥有客货两用车状况与拥有客货两用车状况例六:例六:家庭规模家庭规模介入居住区域与客货两用车拥有状况之间的关系介入居住区域与客货两用车拥有状况之间的关系48 市场调研市场调研 第二节第二节 描述统计分析描述统计分析总结:总结: 初始结论认为两变量之间没有关系,引入初始结论认为两变量之间没有关系,引入第三变量

42、后,可能导致以下几种结论:第三变量后,可能导致以下几种结论:继续支持初始结论继续支持初始结论完全相同,如例六完全相同,如例六揭示了全面关系的存在揭示了全面关系的存在完全不同,如例五完全不同,如例五揭示了有条件的关系存在揭示了有条件的关系存在部分不同部分不同49 市场调研市场调研 第三节第三节 推论统计分析推论统计分析第三节第三节 推论统计分析推论统计分析一、推论统计的概念一、推论统计的概念 所谓推论统计,是指通过样本统计值来估计总体参数所谓推论统计,是指通过样本统计值来估计总体参数值的统计分析技术。值的统计分析技术。 推论统计主要包括参数估计和假设检验两大类。推论统计主要包括参数估计和假设检验

43、两大类。50 市场调研市场调研 第三节第三节 推论统计分析推论统计分析二、参数估计二、参数估计 所谓参数估计,就是根据一个随机样本的统计值来所谓参数估计,就是根据一个随机样本的统计值来估计总体参数值是多少。有点估计和区间估计两种方法。估计总体参数值是多少。有点估计和区间估计两种方法。1 1、点估计、点估计 就是以一个最恰当的样本统计值来代表总体的参数值。例: 我们要想知道某地区青年人的收入水平,可以从该地区抽取一个由若干青年人组成的样本,并计算全部样本月收入的均值是1500元/月。我们可以据此推知,该地区青年人的月收入水平就是1500元。51 市场调研市场调研 第三节第三节 推论统计分析推论统

44、计分析2 2、区间估计、区间估计 就是以两个数值之间的间距(置信区间)来估计总体的参就是以两个数值之间的间距(置信区间)来估计总体的参数值。置信区间的大小与置信度成正比,与显著性水平成反比。数值。置信区间的大小与置信度成正比,与显著性水平成反比。均值区间估计的计算公式:均值区间估计的计算公式:比例区间估计的计算公式:比例区间估计的计算公式: 52 市场调研市场调研 第三节第三节 推论统计分析推论统计分析例例1: 我们在某地区抽取了由青年人构成的样本,样本量为我们在某地区抽取了由青年人构成的样本,样本量为225人,均值为人,均值为1500元,标准差为元,标准差为105元。在置信度为元。在置信度为

45、95%的水平下,请对该地区青年人的收入水平进行估计。的水平下,请对该地区青年人的收入水平进行估计。即,我们的估计是:该地区青年人的平均收入水平是介于即,我们的估计是:该地区青年人的平均收入水平是介于1486.28和和1513.72元元/月之间。这个估计的可信度为月之间。这个估计的可信度为95%,即,即只有只有5%的犯错可能性。的犯错可能性。 53 市场调研市场调研 第三节第三节 推论统计分析推论统计分析例例2: 我们要估计某城镇有多少家庭是夫妻不和的。从一个我们要估计某城镇有多少家庭是夫妻不和的。从一个随机样本(随机样本(n=100)中知道有)中知道有20%的家庭不和。在置信度为的家庭不和。在

46、置信度为95%的水平下,请对该城镇家庭进行估计。的水平下,请对该城镇家庭进行估计。即,我们的估计是:该城镇夫妻不和的比例介于即,我们的估计是:该城镇夫妻不和的比例介于12%和和28%之间。这个估计的可信度为之间。这个估计的可信度为95%,即只有,即只有5%的犯错可的犯错可能性。能性。 54 市场调研市场调研 第三节第三节 推论统计分析推论统计分析三、假设检验三、假设检验 所谓假设检验,就是对未知总体先做出某种假设,所谓假设检验,就是对未知总体先做出某种假设,选取适当样本,根据样本观察到的数据来检验原假设是选取适当样本,根据样本观察到的数据来检验原假设是否正确,以决定是接受还是拒绝原假设的的统计

47、分析技否正确,以决定是接受还是拒绝原假设的的统计分析技术。假设检验分为参数假设检验和非参数假设检验。术。假设检验分为参数假设检验和非参数假设检验。 55 市场调研市场调研 第三节第三节 推论统计分析推论统计分析1 1、假设检验的基本概念、假设检验的基本概念(1)零假设与研究假设 研究假设是研究者根据抽样调查资料而做出的尚待证实的假设,用H1表示;零假设是与研究假设相对立的假设,用H0表示 。(2)显著性水平 所谓显著性水平是指两个群体或变量之间的任何差异不是由于处理因素或需要检验的因素引起的,而是由于偶然因素所导致的概率,用 表示。(3)一端检验与两端检验 在检验零假设时,如果否定域在抽样分布

48、的一端称为一端检验;如果否定域在两端称为两端检验。决定选用一端检验还是两端检验取决于假设检验的方向。56 市场调研市场调研 第三节第三节 推论统计分析推论统计分析2 2、平均数的检验、平均数的检验(1)Z检验法例: 某商店对最近完成了对200名顾客的满意度调查,其中一个问题是“请您认为我们店的服务评分”。对该问题答案很好,比较好,一般,比较差,很差的编码分别是5,4,3,2,1。计算本次调查的平均得分为3.4,样本标准差1.9。在显著性水平为0.05的情况下,该商店的经理能否认定该商店的服务水平高于中等水平? 57 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立

49、假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 该商店经理有95%的把握认为该商店服务水平高于中等水平。58 市场调研市场调研 第三节第三节 推论统计分析推论统计分析(2)t检验法例: 某商店上半年测量的顾客流量为4312人/天,10月份从16天构成的随机样本测量的顾客流量为4396人/天,标准差为210人/天。问能否据此认定10月份的顾客流量较上半年为高? 59 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论;

50、 在0.05的显著性水平下,结果不显著。因此不能认为10月份的顾客流量较上半年高。60 市场调研市场调研 第三节第三节 推论统计分析推论统计分析(3)两个平均数的检验例: 某大学对500名已毕业4年的校友月收入进行调查,其中男校友448人,月平均收入1786元,标准差为29元。女校友52人,月平均收入为1630元,标准差为26元。问在显著性水平为0.05的条件下,能否认为男校友月收入比女校友高? 61 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 因此我们有95

51、%的把握认为男校友的平均月收入高于女校友。62 市场调研市场调研 第三节第三节 推论统计分析推论统计分析3 3、比例数的检验、比例数的检验(1)Z检验法例: 某地区进行晚婚情况调查,随机抽取初婚女子105人,测得其中42人为达到晚婚年龄后初婚的女子。在0.05的显著性水平下,是否与4年前(晚婚率32%)发生了显著变化? 63 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 我们有95%的把握认为该地区晚婚率与4年前未发生显著变化。64 市场调研市场调研 第三节第三

52、节 推论统计分析推论统计分析(2)两个比例数的检验例: 某企业对拟开发的新产品做了市场调查,样本为1000人,其中300名高收入家庭的人中有16%表示愿意购买,700名来自低收入家庭的人中有14%表示愿意购买。问在0.05的显著性水平下,是否可以认为高收入家庭更愿意购买该新产品? 65 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 因此我们有95%的把握认为家庭收入对人们购买该新产品的意愿没有影响。66 市场调研市场调研 第三节第三节 推论统计分析推论统计分析4

53、 4、相关系数检验、相关系数检验例: 某商店对顾客流量与销售额之间的关系进行研究,并随机抽取了10天的客流量与销售额数据(见下表),在0.05的显著性水平下,能否二者之间存在必然联系? 67 市场调研市场调研 第三节第三节 推论统计分析推论统计分析X(万人)(万人)Y(万元)(万元)X2Y2XY245647856732653654454162536164964253694362593625161625683030124240202435合计合计54433202012474968 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)

54、计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 我们有95%的把握认为顾客流量与销售额存在某种必然联系。69 市场调研市场调研 第三节第三节 推论统计分析推论统计分析5 5、X X2 2检验例: 某乳品公司请120个用户评价公司某新产品的三种包装设计。其中选择甲、乙、丙三种设计为最优设计的人分别为60、35、25人。问在0.05的显著性水平下,能否认定甲设计优于其他两种设计? 70 市场调研市场调研 第三节第三节 推论统计分析推论统计分析计算步骤: (1)建立假设; (2)确定显著性水平; (3)计算检验统计量; (4)查表,比较实际值与临界值,并得出结论; 我们有95%的把握

55、认为消费者对三种包装设计偏好有显著差别。71 市场调研市场调研 第三节第三节 推论统计分析推论统计分析6 6、方差分析、方差分析例: 某乳品公司对不同区域的门店销售额进行了调查,样本为30个,其中农村、近郊、城区各10个。调查结果如下表所示。问在0.05的显著性水平下,能否断定销售额不同区域门店的销售具有显著性差别? 72 市场调研市场调研 第三节第三节 推论统计分析推论统计分析区域区域11111111118786765678987766756722222222287859985798182788591899196878990899696931010102销售额销售额区域区域销售额销售额区域区域销售额销售额n3333333333X766852916(X)276.685.291.6599647293684010(X)2/n58675.672590.483905.6N=30X=2534(X)2/n=214038.53(X2)=216910(X)2/n=215171.673 市场调研市场调研 第三节第三节 推论统计分析推论统计分析组间差异平方和(df=2):组内差异平方和(df=27) :总差异平方和(df=29) :组间差异平方和的均值 = 1133.072 = 566.54组内差异平方和的均值 = 1739.427 = 64.39

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号