第2讲列联分析与方差分析课件

上传人:汽*** 文档编号:568705808 上传时间:2024-07-26 格式:PPT 页数:65 大小:2.54MB
返回 下载 相关 举报
第2讲列联分析与方差分析课件_第1页
第1页 / 共65页
第2讲列联分析与方差分析课件_第2页
第2页 / 共65页
第2讲列联分析与方差分析课件_第3页
第3页 / 共65页
第2讲列联分析与方差分析课件_第4页
第4页 / 共65页
第2讲列联分析与方差分析课件_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《第2讲列联分析与方差分析课件》由会员分享,可在线阅读,更多相关《第2讲列联分析与方差分析课件(65页珍藏版)》请在金锄头文库上搜索。

1、第第2 2讲讲 列联分析和方差分析列联分析和方差分析第一第一 节节 交叉列联表分析交叉列联表分析一、拟合优度检验二、二维交叉分析三、多维交叉分析一、拟合优度检验 研究调研数据与原假设拟合的程度或一致的程度二、交叉分析 如:收入等级和文化程度、专业和性别、地区和广告创意、年龄和阅读书籍习惯等三、 检验 一、拟合优度检验一、拟合优度检验原假设:儿童对电视台提供的六种儿童节目没有偏好。原假设:赌场的骰子没有做手脚。原假设:四季中,旅游产品销售春秋季为旺季。节目编号观测频次185280355410540630合计300SPSS(SPSS(案例)有两种准备数据的方式案例)有两种准备数据的方式DATAWe

2、ight cases ;analyzenonparametric testchi-square一、拟合优度检验一、拟合优度检验一、拟合优度检验一、拟合优度检验二、交叉列表分析二、交叉列表分析(一)交叉列表分析概念(一)交叉列表分析概念就是同时将两个或两个以上有一定联系的变量及其变量值,按照一定的顺序交叉排列在一张表中,从中分析变量之间的相关关系并得出科学结论的一种数据分析技术。二、交叉列表分析二、交叉列表分析例1、某城市人口关于受教育程度与收入水平之间关系分析:小学以下中学大专本科研究生合计高收入81112263794中高收入1622569098282中等收入28369211276344中低收

3、入485552347196最低收入4226133084合计1421502252652181000(二)二维交叉列表基本分析方法行边行边缘数缘数列边列边缘数缘数二、交叉列表分析二、交叉列表分析二、交叉列表分析二、交叉列表分析(案例)(案例)计算实际卡方值比较实际卡方值和理论卡方值之间关系根据原假设做出判断二、交叉列表分析二、交叉列表分析(案例)(案例)二、交叉列表分析二、交叉列表分析(案例(案例1 1)一公司二公司三公司四公司合计赞成68755779279反对32453331141合计10012090110420例2:某集团公司有4个分公司,对是否推行某项决策有两种意见:赞成和反对,试分析各分公

4、司意见是否不同?实际值实际值一公司二公司三公司四公司合计赞成66806073反对34403037合计期望值期望值二、交叉列表分析二、交叉列表分析(案例)(案例)二、交叉列表分析二、交叉列表分析(案例(案例2 2)(三)多维交叉列表分析(三)多维交叉列表分析第一节第一节 交叉列联表分析交叉列联表分析一、交叉列联表分析概念就是同时将两个或两个以上有一定联系的分类变量及其变量值,按照一定的顺序交叉排列在一张表中,从中分析变量之间的相关关系并得出科学结论的一种数据分析技术。交叉列表分析交叉列表分析例1、某城市人口关于受教育程度与收入类别之间关系分析:小学以下中学大专本科研究生合计最高收入8111226

5、3794中高收入1622569098282中等收入28369211276344中低收入485552347196低收入4226133084合计1421502252652181000二、交叉列表基本分析方法行边行边缘数缘数列边列边缘数缘数交叉列表分析交叉列表分析(以行计算)(以行计算)教育程度小学以下中学大专本科研究生合计收入最高收入9%12%13%28%39%100%中高收入6%8%20%32%35%100%中等收入8%10%27%33%22%100%中低收入24%28%27%17%4%100%低收入50%31%15%4%0%100%称为称为5*55*5列联交叉表列联交叉表交叉列表分析交叉列表分

6、析(以列计算)(以列计算)教育程度小学以下中学大专本科研究生社会阶层最高收入6%7%5%10%17%中高收入11%15%25%34%45%中等收入20%24%41%42%35%中低收入34%37%23%13%3%低收入30%17%6%1%0%合计100%100%100%100%100%一般原则:以自变量为基准计算百分数交叉列表分析交叉列表分析三、交叉列表卡方分析交叉列表分析交叉列表分析(两个函数)(两个函数)交叉列表分析交叉列表分析(案例(案例1 1)一公司二公司三公司四公司合计赞成68755779279反对32453331141合计10012090110420例2:某集团公司有4个分公司,对

7、是否推行某项决策有两种意见:赞成和反对,试分析各分公司意见是否不同?实际值实际值一公司二公司三公司四公司合计赞成66806073反对34403037合计期望值期望值交叉列表分析交叉列表分析(案例)(案例)计算实际卡方值比较实际卡方值和理论卡方值之间关系根据原假设做出判断交叉列表分析交叉列表分析(案例)(案例)交叉列表分析交叉列表分析(案例(案例2 2)例3:欲研究不同收入群体对某种特定商品是否有相同的该买习惯,市场调研人员调查了四个不同的收入组共527人,结果如表:实际值实际值期望值期望值低收入组偏低收入组偏高收入组高收入组合计经常购买25404746158有时购买36261937118不购买

8、69517457251合计130117140140527第二节第二节 方差分析方差分析(analysis of variance,ANOVA)(analysis of variance,ANOVA)方差分析方差分析(analysis of variance, ANOVA)(analysis of variance, ANOVA)定义: 就是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。注:其实质是研究分类型自变量对数值型因变量的影响。一、方差分析的步骤一、方差分析的步骤方差分析的步骤建立原假设和备择假设;构造统计检验量(F统计检验量);计算统计检验量的值并进行检验

9、;计算均值计算误差平方和 从原问题或调查角度阐述结论。二、单因素方差分析(案例与基本概念)二、单因素方差分析(案例与基本概念)消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了规模大致一样的几家企业调查其投诉率,协会想知道这几个行业之间的服务质量是否有显著差异。行业零售业旅游业航空公司家电制造5768314466394951492921654045347734564058535144因素:所要检验的对象;水平:因素的不同表现;观测值:每个因子水平下的得到的样本数据;自变量(分类型)因变量(数值型)单因素方差分析(误差分解)单因素方差分析(误差分解)行业零售业旅游业航空公司家电制造投诉次

10、数5768314466394951492921654045347734564058535144平均数49483559总平均数47.86956522组间误差:来自不同水平的数据误差;组内误差:来自水平内部的数据误差;总误差:全部数据误差大小的平方和;单因素方差分析(误差分解)单因素方差分析(误差分解)行业零售业旅游业航空公司家电制造投诉次数5768314466394951492921654045347734564058535144平均数49483559总平均数47.8695652230单因素方差分析(误差分解)单因素方差分析(误差分解)组间误差:来自不同水平的数据误差,自由度为(k-1);组内误

11、差:来自水平内部的数据误差,自由度为(n-k);总误差:全部数据误差大小的平方和,自由度为(n-1)。总误差(SST)组内误差(SSw)组间误差(SSb)单因素方差分析(案例)单因素方差分析(案例)行业零售业旅游业航空公司家电制造投诉次数5768314466394951492921654045347734564058535144平均数49483559总平均数47.86956522单因素方差分析(案例)单因素方差分析(案例)行业零售业旅游业航空公司家电制造投诉次数5768314466394951492921654045347734564058535144平均数49483559总平均数47.869

12、56522单因素方差分析(方差分析表)单因素方差分析(方差分析表)方差分析表方差分析表误差来源平方和SS自由度均方F值P值F临界值组间SSbk-1MSbMSb/MSw组内SSwn-kMSw总和SSTn-1方差分析表误差来源平方和SS自由度均方F值P值F临界值组间1456.6083485.563.410.0383.13组内270819142.53总和4164.60822单因素方差分析(案例单因素方差分析(案例2 2)例例 某公司在一次新产品的研究中,试验三种不同的包装对新产品销售的影响。从某城市随机选取5个相似商店,将样本配以不同包装进行销售,试分析包装对新产品的销售是否有显著影响。不同包装甲包

13、装乙包装丙包装商店1101510商店2142012商店312176商店48812商店5111510单因素方差分析(案例单因素方差分析(案例2 2)例例 某公司在一次新产品的研究中,试验三种不同的包装对新产品销售的影响。从某城市随机选取5个相似商店,将样本配以不同包装进行销售,试分析包装对新产品的销售是否有显著影响。SUMMARY组观测数求和平均方差列 1555115列 25751519.5列 3550106单因素方差分析(案例单因素方差分析(案例2 2)例例、某公司在一次新产品的研究中,试验三种不同的包装对新产品销售的影响。从某城市随机选取5个相似商店,将样本配以不同包装进行销售,试分析包装对

14、新产品的销售是否有显著影响。方差分析差异源SSdfMSFP-valueF crit组间702353.4426230.0658193.885294组内1221210.16667总计19214练习练习 某公司在一次新产品的研究中,试验3种不同的包装对新产品销售的影响。从某城市随机选取12个相似商店,将他们分成3组,配以不同包装进行销售,试分析不同包装对新产品的销售是否有显著影响。单因素方差分析(练习)单因素方差分析(练习)A包装(瓶装)B包装(罐装)C包装(袋装)销售数量757460707864667265696855平均值707073736161总均值6868差异源SSdfMSFP-valueF

15、 crit组间组内总计练习 某公司在一次新产品的研究中,试验3种不同的包装对新产品销售的影响。从某城市随机选取12个相似商店,将他们分成3组,配以不同包装进行销售,试分析不同包装对新产品的销售是否有显著影响。单因素方差分析(练习)单因素方差分析(练习)A包装(瓶装)B包装(罐装)C包装(袋装)销售数量757460707864667265696855平均值707073736161总均值6868差异源SSdfMSFP-valueF crit组间312215690.00714.26组内156917.3总计46811单因素方差分析(操作)单因素方差分析(操作)EXCEL操作操作SPSS操作操作三、双因

16、素方差分析三、双因素方差分析v两个因素(行因素Row和列因素Column)对试验结果的影响v如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复双因素方差分无交互作用的双因素方差分析或无重复双因素方差分析析(Two-factor without replication)v如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复双因素有交互作用的双因素方差分析或可重复双因素方差分析方差分析 (Two-factor wit

17、h replication )双因素方差分析双因素方差分析(案例与基本概念)(案例与基本概念)定义: 当方差分析中涉及两个分类型自变量对数值型因变量的影响。分类: 无重复双因素方差分析(无交互因素) 有重复双因素方差分析(有交互因素)双因素方差分析的基本假定双因素方差分析的基本假定v每个总体都服从正态分布对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本v各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的v观察值是独立的双因素方差分析的数据结构双因素方差分析的数据结构双因素方差分析(误差分解)双因素方差分析(误差分解)45双因素方差分析(无交互作用)案例双因素方

18、差分析(无交互作用)案例品牌品牌1 1品牌品牌2 2品牌品牌3 3品牌品牌4 4行平行平均数均数地地区区1 1365 365 345 345 358 358 288 288 339.339.0 0 地地区区2 2350 350 368 368 323 323 280 280 330.330.3 3 地地区区3 3343 343 363 363 353 353 298 298 339.339.3 3 地地区区4 4340 340 330 330 343 343 260 260 318.318.3 3 地地区区5 5 323 323 333 333 308 308 298 298 315.315.

19、5 5 列列平平均均数数344.344.2 2 347.347.8 8 337.337.0 0 284.284.8 8 328.328.5 5 分析步骤分析步骤v提出假设提出假设对行因素提出的假设H0: m1 = m2 = = m i = = mr (m i为第i个水平的均值)H1: m i (i =1,2, , r) 不全相等对列因素提出的假设为H0: m1 = m2 = = mj = = mc (m j为第j个水平的均值)H1: m j (j =1,2,c) 不全相等双因素方差分析的假设双因素方差分析的假设构造检验的统计量构造检验的统计量 总离差平方和(SST )、水平项离差平方和 (SS

20、R和SSC) 、误差项离差平方和(SSE) 之间的关系SST = SSR +SSC+SSE 统计决策统计决策v 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策根据给定的显著性水平在F分布表中查找相应的临界值 F 若FRF ,则拒绝拒绝原假设H0 ,表明均值之间的差异是显著的,即所检验的行因素对观察值有显著影响若FC F ,则拒绝拒绝原假设H0 ,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响 1、 双因素方差分析(无交互作用)案例双因素方差分析(无交互作用)案例品牌品牌1 1品牌品牌2 2品牌品牌3 3品牌品牌4 4行平行平均数均数地地区区1 1365

21、365 345 345 358 358 288 288 339.339.0 0 地地区区2 2350 350 368 368 323 323 280 280 330.330.3 3 地地区区3 3343 343 363 363 353 353 298 298 339.339.3 3 地地区区4 4340 340 330 330 343 343 260 260 318.318.3 3 地地区区5 5 323 323 333 333 308 308 298 298 315.315.5 5 列列平平均均数数344.344.2 2 347.347.8 8 337.337.0 0 284.284.8 8

22、 328.328.5 5 1 1、双因素方差分析、双因素方差分析(无交互作用)(无交互作用)总误差自由度:总误差自由度:rc-1行因素自由度:行因素自由度:r-1列因素自由度:列因素自由度:c-1随机误差自由度:随机误差自由度:(r-1)*(c-1)双因素方差分析(案例)双因素方差分析(案例)差异源误差平方和SS自由度df均方MSF行因素SSRr-1MSR=SSR/(r-1)MSR/MSE列因素SSCc-1MSC=SSC/(c-1)MSC/MSE随机误差SSE(r-1)*(c-1)MSE=SSE/(r-1)*(c-1)总计SSn-1差异源SSdfMSFP-valueF crit行2011.74

23、502.9252.1008462.1008460.1436653.2591673.259167列13004.5534334.8518.1077718.107779.46E-053.4902953.490295误差2872.712239.3917总计17888.9519 1 1、双因素方差分析、双因素方差分析(无交互作用)(无交互作用)无交互作用:注意选择无交互作用:注意选择custom/main effects交互作用:注意选择交互作用:注意选择custom/full functional(Type 3)2 2、双因素方差分析、双因素方差分析(有交互作用的)(有交互作用的)行因素有行因素有r个

24、水平个水平 列因素有列因素有c个水平个水平行变量中每个水平的每个行变量中每个水平的每个样本的行数为样本的行数为m行。行。2 2、双因素方差分析、双因素方差分析(有交互作用的)(有交互作用的)2 2、双因素方差分析、双因素方差分析(有交互作用的)(有交互作用的)2 2、双因素方差分析、双因素方差分析(有交互作用的)(有交互作用的)2 2、双因素方差分析、双因素方差分析(交互作用)(交互作用)总误差自由度:总误差自由度:rcm-1行因素自由度:行因素自由度:r-1列因素自由度:列因素自由度:c-1交互因素自由度:交互因素自由度:(r-1)*(c-1)随机误差自由度:随机误差自由度:rc*(m-1)

25、2 2、双因素方差分析(有交互作用的)、双因素方差分析(有交互作用的)路段1路段2高峰期26192420272325222521非高峰期20181717221321161712例3:分析路段、时段、路段和时段的交互作用对行车时间的影响。行因素有行因素有K个水平个水平 列因素有列因素有r个水平个水平行变量中每个水平的每个行变量中每个水平的每个样本的行数为样本的行数为m行。行。双因素方差分析(有交互作用)双因素方差分析(有交互作用)路段1路段2高峰期261923.2242027232522252125.421非高峰期201817.2171722132116171219.41520.222.418案

26、例:分析路段、时段、路段和时段的交互作用对行车时间的影响。行因素有行因素有2个水平个水平 列因素有列因素有2个水平个水平行变量中每个水平的每个行变量中每个水平的每个样本的行数为样本的行数为5行。行。差异源误差平方和SS自由度df均方MSF行因素SSRR-1MSR=SSR/(R-1)MSR/MSE列因素SSCC-1MSC=SSC/(C-1)MSC/MSE交互作用SSRC(R-1)*(C-1)MSRC=SSRC/(R-1)(C-1)MSRC/MSE随机误差SSERC(m-1)MSE=SSE/RC(m-1)总计SSRC-1差异源SSdfMSFP-valueF crit行174.051174.0544.0644.065.7E-064.4934.493列92.45192.4523.4023.400.0001824.4934.493交互0.0510.050.0130.0130.9118194.4934.493随机63.2163.95总计329.7519路段1路段2高峰期26192420272325222521非高峰期20181717221321161712

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号