市场调研10-(2)

上传人:l**** 文档编号:164178576 上传时间:2021-01-27 格式:PPT 页数:38 大小:483.50KB
返回 下载 相关 举报
市场调研10-(2)_第1页
第1页 / 共38页
市场调研10-(2)_第2页
第2页 / 共38页
市场调研10-(2)_第3页
第3页 / 共38页
市场调研10-(2)_第4页
第4页 / 共38页
市场调研10-(2)_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《市场调研10-(2)》由会员分享,可在线阅读,更多相关《市场调研10-(2)(38页珍藏版)》请在金锄头文库上搜索。

1、第九章基本数据分析与SPSS软件,本章内容,(1)频数分布 (2)假设检验 (3)交叉表,本章重点,第一节 频数分布,一、频数分布的概念 记数某变量所有取值的个数,以百分数的形式表示 一个变量的频数分布是关于这个变量的频数统计表,包括与变量相关的频数百分比及累计百分比。 频数分布有助于发现那些不相关或不合理项。 频率(频数占综频数百分比)在对数据进行解释和判断方面更为直观。,二、频数分布中常用的统计量 (1)位置度量:平均数、众数、中位数 从不同角度描述了变量取值的中心趋势,对定类变量选择众数,对定序变量选择中位数,对定距和定比变量选择平均值。 (2)差异度量:极差、四分位极差、方差、标准差

2、差异度量用于定距变量或定比变量的变化性度量。,1、位置度量 平均数:最常用的中心趋势度量指标,平均数是一个平稳值,少量增加或删减样本,数值不会有明显的改变。 1,2,3,4,5,6,7,8,9 均值=5,众数:样本众数是样本对应变量取值中出现次数最多的值,又叫峰值。 1 2 2 3 4 5 2 5 3 2 6 7 众数:2 中位数:当样本对变量的取值按递增或递减排序时,若取值是基数,则中间位置的数值为中位数;若取值是偶数,中间位置两个数值的平均数为中位数。 1 2 3 4 5 6 7 8 9 中位数:5 1 2 3 4 5 6 7 8 9 10 中位数:5.5,2、差异度量 (1)极差:变量取

3、值中最大值和最小值的差,极差受极端值的影响。 1 2 3 4 5 6 7 极差 7-1=6 (2)四分卫极差:变量取值按照由大至小排列时,去掉前1/4和后1/4的取值,所剩下50%变量取值的极差。 1 2 3 4 5 6 7 8 极差 6-3=3,(3)方差:样本方差是样本观察值与平均值之差的平方和的均值,描述样本取值与平均值的离散程度,摆动较小,方差较小,摆动较大,方差较大。,(4)标准差:意义同于方差,比方差更常用。,三、频数分布的SPSS应用 p.169,第二节 假设检验,一、假设检验过程 1. 假设检验的基本步骤,提出原假设 H0 和被择假设 H1,针对调研 问题做出 结论,做出统计

4、判断,即 拒绝或接受 原假设,选择统计 方法和对应 的统计量, 并针对选 定的显著 性水水平, 计算统计量, 确定拒绝域,(1)提出原假设H0和备选假设H1 原假设是有关变量等价、相同或没有差异的判断性描述;被择假设是原假设的对立假设。 市场调研中,如果原假设被拒绝,则认为与备择假设一致的期望结论有统计意义。 假设检验分为单侧和双侧检验,当备择建设的数学表达式是单向严格不等式时,选择单侧检验;当备择假设的数学表达式是等式形式时为双侧检验,例:某新产品的潜在市场需求预计超过原估测规模的20%,该需求量是企业决定是否进行新产品扩散的重要指标。 如何进行假设检验? 提出原假设H0:=2.0,潜在市场

5、需求等于估计规模的20%。 H1:2.0,潜在市场需求超过估计规模的20%。 如果原假设被拒绝,则接受被择假设,即可以实施新产品扩散; 在H0不被拒绝,在没有特殊情况的前提下,暂不做出行动。,(2)选择统计方法和对应的统计量,并针对选定的显著性水平,计算统计量值,确定拒绝域 选定显著性水平是指由于样本结论导致错误的拒绝了原本正确的原假设的概率。对显著性水平的选取受调研预算的限制,一般=0.01或0.05 某种统计方法下对应的样本统计量的分布决定拒绝域,而选择什么样的样本统计量与已知条件和代估参数有关 正态分布:Z检验 t分布:t统计量检验 F分布:F-检验,(3)在显著性水平下,从统计学角度判

6、定是否拒绝原假设。将样本数值带入到拒绝域,检验是否满足拒绝域,并依据数理统计学理论判定是否拒绝原假设。 (4)做出市场调研结论,即由假设检验得出的结论转换为市场调研课题结论的表达。 假设检验的结论:接受或拒绝原假设,拒绝或接受备择假设 市场调研结论:是否该实施某方案,二、参数检验与统计量的分布,1、检验 检验分为单变量的检验和双变量的检验,是关于总体均值的假设检验。,(1)单变量情形。变量X服从均值为0、方差为2的正态分布,均值和方差已知。 H0:= 0 ,H1: 0 检验的样本统计量为 服从正态分布,在显著性水平下, H0的拒绝域为|/2。/2为查正态分布概率表得到的临界值,(2)双变量情况

7、 变量X1服从均值为1,方差为12的正态分布;变量X2服从均值为2,方差为22的正态分布,且均值和方差已知。 H0: 1 = 2 ,H1: 1 2 0 检验统计量为: 它服从正态分布,n1和n2为两个独立样本的样本容量,在显著性水平下, H0的拒绝域为|/2。,2、t检验 t检验分为单变量t检验和双变量t检验,(1)单变量t检验 变量X服从均值为0、方差为2的正态分布,总体方差未知。 H0:= 0 ,H1: 0 检验的样本统计量为 它服从自由度为n-1的t分布,在显著性水平下, H0的拒绝域为|t|t/2(n-1)。 t/2(n-1)为查t分布概率表得到的临界值。,(2)双变量情景 两个总体方

8、差未知但相等,12=22, H0: 1 = 2 ,H1: 1 2 0 检验统计量为: 它服从正态分布,n1和n2为两个独立样本的样本容量,在显著性水平下, H0的拒绝域为|t|t/2(n1+n2-1)。,例:某企业研究促销活动对销售效果的影响,原预计实施促销后,产品的月销售额可增至2万元,促销活动后,研究人员对销售额进行了调查,发现促销后的月销售额只有1.7万元,标准差为0.25万元,能否由此推断促销没有达到预期的效果? H0: =2, H1: t0.05(20-1), 否定H0,接受H1,认为促销未达到预期效果,3、F检验 F检验是在方差未知的条件下,关于两个总体方差相等的假设检验。 F服从

9、自由度为(v1,v2)的F分布。n1、n2分别为两个样本的样本容量,S1、S2分别为样本标准差,临界值取决于自由度。在显著性水平下, H0的拒绝域为FF/2(n1 -1, n2-1), FF1-/2(n1 -1, n2-1), F/2(n1 -1, n2-1)和F1-/2(n1 -1, n2-1)为查t分布概率表得到的临界值。,参数检验总结: (1)关于均值的检验,不论单、双总体,当方差已知时,用z检验,否则用t检验,大样本情景,都可以用z检验 (2)关于方差的检验,双总体方差相等假设需用F检验。,三、非参数检验与统计量的分布,(1)非参数检验适用于定序变量和定类变量的假设检验。常用的方法是卡

10、方检验 (2)卡方检验主要用于对独立样本本身和不同独立样本之间不同因素的差别检验 (3)单变量情形的卡方检验主要用于对频数表中各类对某变量特征的差异性分析,H0:不存在由于变量X而导致的类别差异 H1:存在由于变量X而导致的类别差异 卡方统计量的数学表达式为 2=(Oi-Ei)2/Ei 其中,Oi为单元i的观察(实际)频数,Ei为单元i的理论期望频数,统计量服从卡方分布,期望频数和观察频数之间的差值越大,卡方统计值越大。 在给定显著性水平下,拒绝域为 2 2(n-1) 2(n-1)查卡方分布表中获得临界值,例:9-2(p177) 奶酪口味偏好程度,调查了210人,要求对三种奶酪口味偏好程度进行

11、调查,选出最喜欢的一种,结果如下 根据以上数据统计判断三种口味的奶酪偏好程度是否有显著差异。,采用卡方检验 提出原假设H0:三种口味偏好基本相同 提出被择假设H1:三种口味偏好度有显著差异 在H0下,Ei=(90+45+75)/3=70,i=1,2,3. 统计量x2=(oi-ei)2/Ei=(90-70)2/70+(45-70)2/70+(75-70)2/70=15 服从自由度为3-1=2的卡方分布,在显著性水平0.05下,查表知 , x2 ,拒绝H0,接受H1 三种口味的消费者偏好度有显著差异,火腿口味选的最少,口味偏好度低,第三节 交叉表,一、交叉表的概念 交叉表是一种以表格的形式同时描述

12、两个或多个变量以及结果的统计方法,反映了这些只有有限分类或取值的变量的联合分布。,频数分布一次描述一个变量,交叉表可以同时描述两个或两个以上的变量。 交叉表方法的起点是单变量数据,之后依研究目的将这些数据分成多个细目。 例:频数 P.178,交叉表描述的是变量的关系,但不一定是因果关系 交叉表的优点与局限 优点: (1)分析结果很容易直观的被管理人员理解 (2)明了的解释加强了调研结果与管理行为的联系 (3)有助于理解复杂问题 (4)可将复杂的数据简单化 缺点: (1)需要考虑多个变量,样本容量就应当相当大 (2)很难确保对所有的相关变量进行了分析,不一定能找到真正的关系,二、与交叉表有关的统

13、计量 卡方统计量用来验证交叉表中变量间的关联程度以及这种关联程度的统计显著性。 原假设H0:两个变量特征相互无影响 备择假设H1:两个变量特征相互影响,卡方统计量的数学表达式 Oij为单元(i,j)的观察频数 Eij为单元(i,j)的期望频数,其计算公式为 Eij=ninj/n ni为交叉表某行总频数,nj为交叉表某列总频 数,n为样本容量 卡方统计服从卡方分布x2(r-1)(s-1),r为第一个变量下的类别数,s为第二个变量下的类别数 在给定显著水平和已知自由度的情况下,当卡方统计量的计算值大于卡方分布的临界值,拒绝原假设,接受备择假设,变量间有关联。,例:9-4 因特网使用率与上网者的性别有关吗?p180 第一步:计算期望频数 Eij=ninj/n 计算卡方值 X2=3.333 第二步:确定自由度,在给定的显著水平下,得到用于检验的临界值 自由度: df=(r-1)(s-1), X20.05=3.841 第三步:做出结论,3.3333.841,接受原假设,网络使用率与性别无关,三、假设检验和交叉表的SPSS应用 1、SPSS操作流程 P. 181 2、解读表格,本章小结,频数分布 位置度量(平均数、众数、中位数) 差异度量(极差、四分位极差、样本方差、标准差) 参数检验、非参数检验 交叉表,2021,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号