用SPSS作列联分析.

上传人:我** 文档编号:116873909 上传时间:2019-11-17 格式:PPT 页数:46 大小:991.50KB
返回 下载 相关 举报
用SPSS作列联分析._第1页
第1页 / 共46页
用SPSS作列联分析._第2页
第2页 / 共46页
用SPSS作列联分析._第3页
第3页 / 共46页
用SPSS作列联分析._第4页
第4页 / 共46页
用SPSS作列联分析._第5页
第5页 / 共46页
点击查看更多>>
资源描述

《用SPSS作列联分析.》由会员分享,可在线阅读,更多相关《用SPSS作列联分析.(46页珍藏版)》请在金锄头文库上搜索。

1、用SPSS作列联分析 列联 分析 引例: 有鉴于当前大学生对体育锻炼不够重视的现状,学校体育部与学生会计划 联合在全校范围内开设并普及乒乓球、羽毛球、网球三项运动。他们认为这三 项运动既能吸引学生,又能达到良好的锻炼效果。在一次讨论如何针对大学生 特点展开校园宣传的工作会议上,为了强化宣传力度,有人提出男女大学生的 运动偏好是否存在差异的问题。如果男女大学生的运动偏好没有差异,体育部 与学生会将针对全体学生发起整体性的宣传活动;如果有差异,将分别针对男 生和女生采取不同的宣传策略。为此,体育部与学生会随机发放了200份问卷 ,让每一个学生在乒乓球、羽毛球、网球这三个运动项目上选择出自己最喜欢

2、的一项。调查数据整理后,得出如表下所示的表格: 关于男女生运动动偏好的样样本数据 乒乓乒乓 球羽毛球网球合计计 男生552728110 女生16373790 合计计716465200 男女学生运动偏好频数分布图 女生男生 60 50 40 30 20 10 乒乓球 羽毛球 网球 55 27 28 16 3737 频 数 列联表中的卡方检验 列联表中的相关系数 列联表 列联表的一般结构 列联表中的自由度 Ij列联联表 合计 合计 33列联联表自由度为为4 合计 合计 34列联联表自由度为为6 合计计 合计计 26列联联表自由度为为5 合计计 合计计 乒乓乒乓 球羽毛球网球合计计 男生观观察频频数

3、552728110 行间间比率50.0%24.5%25.5%100% 女生观观察频频数16373790 行间间比率17.8%41.1%41.1%100% 合计计观观察频频数716465200 行间间比率35.5%32.0%32.5%100% 关于男女生运动动偏好的样样本数据 乒乓乒乓 球羽毛球网球合计计 男生552728110 女生16373790 合计计716465200 从样本数据上看,男女生运动 偏好存在差异。但从样本到总 体的推断须通过假设检验完成 。 学生性别与运动偏好相互独立 学生性别与运动偏好相互不独立 观观察频频数 乒乓乒乓 球羽毛球网球合计计 男生552728110 女生16

4、373790 合计计716465200 期望频频数 乒乓乒乓 球羽毛球网球合计计 男生39.135.235.8110 女生32.028.829.390 合计计716465200 如果原假设成立,则总体中男生和女生喜欢乒乓球、羽毛球、网球人数的比率 应是相等的,由列联表所计算得出的总比率35.5%、32.0%、32.5%就是对总体 中的相应比率的估计。做为总体中相应比率的估计,它们对男生和女生就应当 都是适用的。于是,可以根据这些总比率,计算得出各个单元格中的一个理论 上的频数,此理论频数可称之为期望频数,记作 : 0426 0.00 0.05 0.10 0.15 0.25 0.20 810 0

5、.30 观察频数与期望频差异的大小以 统计量衡量。该统计量服从自由度 为 的 分布。 自由度为3 的 分布 自由度为1 的 分布 自由度为10的 分布 自由度为20的 分布 55 27 28 16 37 37 39.1 35.2 35.8 32.0 28.8 29.3 15.9 -8.2 -7.8 -16.0 8.2 7.7 252.81 67.24 60.84 256.00 67.24 59.29 6.47 1.91 1.70 8.00 2.33 2.0222.4 统计量的计算过程 ,若给定 ,则检验的临界值为:问题中自由度为: 检验原假设的拒绝准则为: 5.991522.4 拒绝域接受域

6、0 ,拒绝原假设。结论:男女大学生的 运动偏好是有差异的,做出这一推断的把握程度是95%。 某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上有人提出男性 与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将针对不同的目标市场采 取不同的推销策略;若相同,公司将发起对所有啤酒的广告运动。 淡啤普啤 黑啤合计计 男性20402080 女性30301070 合计计507030150 男性与女性饮者啤酒偏好的样本数据 淡啤普啤 黑啤合计计 频频数比率%频频数比率%频频数比率%频频数比率% 男性2025.04050.02025.080100 女性3042.93042.91014.270100 合

7、计计5033.37046.73020.0150100 男女饮酒偏好相同 男女饮酒偏好不同 淡啤普啤 黑啤合计计 男性26.6737.3316.0080 女性23.3332.6714.0070 合计计507030150 观察频数 期望频数 淡啤普啤 黑啤合计计 男性20402080 女性30301070 合计计507030150 卡方统计量的构造建立在观察频数服从正态分布的假设基础上,违背这个假设,检验结果无效。各个单元格的观 察频数事实上服从二项分布,但当观察频数充分大时,二项分布可近似视为正态分布。用正态分布近似二项分布 时,通常要求 和 同时大于等于5。在列联表中的 检验中,同样有类似的要

8、求,即观察频数 必须足够大,从而使得每个单元格的期望频数大于等于5。一旦出现某一个或某几个单元格中的期望频数小于5的 情况,通常的做法是:将相邻单元格加以合并,以满足这个条件。从 统计量的公式中可以看出,期望频数是 出现在分母上的,如果过小,则必会使商值很大,因而产生夸大统计量值的倾向。本例中没有发生这种情况。 性 别别 偏好 男 男 男 女 女 女 淡啤 普啤 黑啤 淡啤 普啤 黑啤 20 40 20 30 30 10 26.67 37.33 16.00 23.33 32.67 14.00 -6.67 2.67 4.00 6.67 -2.67 -4.00 44.49 7.13 16.00 4

9、4.49 7.13 16.00 1.67 0.19 1.00 1.91 0.22 1.146.13 判定饮酒偏好是否与饮酒者性别有关所需检验统计量的计算 结论:拒绝 “男性与女性啤酒偏好相同”的原假设,并不得不接受“男性与女 性啤酒偏好不同”的备择假设。即啤酒的偏好与性别是有关联的。 已知 : 自由度= 查表得临界值:经计算: C相关系数 V相关系数 相关系数 1205565合计 702050 503515 合计 与 相关 1206060合计 804040 402020 合计 与 不相关 1206060合计 60600 60060 合计 与 完全相关 列联表中的卡方检验回答了两变量之间是否相关

10、,但没有直接给出相关程度的 高低。需要一种尺度,用以测量和直接显示两个变量之间是否相关以及相关程 度的高低。 无相关完全相关 弱相关中度相关高度相关 合计 合计 22列联表 合计 合计 22列联表 化简得: , 。 可充当测量相关性的尺度。 即 : 变量 与变量 不相关时,有: , 完 全 相 关 的 两 种 情 况 合计 合计 22列联表 合计 合计 22列联表 相关系数与 统计量的关系 或 丹麦人与法国人以同样的眼光看待陌生人吗?一次抽样调查中就“你认为大多 数人都可信赖呢?还是认为与人相处要处处小心?”这一问题,获得数据如下 表。 要求:判定“国籍”与“态度”两变量间的相关性。 相关系数

11、比较适用于22列联表。列联表的行数 和列数大于2时, 相关系数会出现大于是1情况。 1954969985合计 1123763360怀疑 831206625信任 合计法国丹麦 22列联表 适用于大于2 2的列联表 列联联表223344 C的最大值值0.70710.81650.87 的最大值依赖于列联表的行列数 无相关 相关系数(列联系数)计算公式 一种原料来自三个不同的地区,原料质量被分成三个 不同等级。从这批原料中随机抽取500件进行检验, 得样本数据如下表所示: 一级级二级级三级级合计计 地区1526424140 地区2605952171 地区3506574189 合计计1621881505

12、00 原料抽样数据 要求:检验地区与原料质量之间有无依赖关系 。 地区原料 1 1 1 2 2 2 3 3 3 1 2 3 1 2 3 1 2 3 52 64 24 60 59 52 50 65 74 45.36 52.64 42.00 55.40 64.30 51.30 61.24 71.06 56.70 6.64 11.36 -18.00 4.60 5.30 0. 70 -11.24 - 6.06 17.30 44.09 129.05 324.00 21.16 28. 09 0.49 126.34 36.72 299.29 0.97 2.45 7.71 0.38 0.44 0.01 2.0

13、6 0.52 5.28 合计计19.82 为判定地区是否与原料质量相关所需 统计量的计算 适用于大于2 2的列联表 计算结果表明:“地区”与“ 原料质量”之间低度相关。 列联表行数和列数中较小者 。 相关系数计算公式 V相关系数解决了相关系数无上界和C相关系数小于1的 情况。两个变量无相关时V=0;两个变量完全相关时V=1 。 结束 公司1公司2公司3公司4合计计 赞赞成68755779279 反对对32453331141 合计计10012090110420 关于改革方案调查结果的样本数据 态度 赞成 反对 r 1 2 公司 公司 1 公司 2 公司 3 公司 4 c 1 2 3 4 观察频数

14、 fo 定义变量 68 75 57 79 32 45 33 31 31428 33327 45226 32125 79414 57313 75212 68111 focr序号 列联表在spss数据集中的排列 数据集7 1、打开数据集; 2、点击data; 2、点击weight cases;弹出weight cases对话框 ; 3、选择weight cases by; 4、将变量Fo点击进入frequency variable框内,对 其进行加权。 1、点击analyze; 2、选择descriptive statistics; 3、在下拉菜单中选择 crosstabs,进行列联表分析 。 显

15、示交叉频数分布图 指定行变量 指定列变量 卡方检验 定类变量相关指标 相关分析 列联系数 和V系数 值 不确定系数 定序变量的相关指标 本例中选择 chi-square 频数 观察频数 期望频数 频率 行频率 列频率 总和频率 残差 未标准化 已标准化 已由标准误标准化 本例中选择频数 中的两选项 升序 行顺序 降序 故接受原假设。即四个分公司态度一致。 如果在crosstabs cell display对话中,选择了count中的observed和expected 与percentages中的row、column和total,系统将输出如下列联表。 C fo r 意 见见 合计计 不能满满足基本满满足能够满够满 足 系 别别 金融系 统计统计 系 70 70 160 60 20 10 250 140 合 计计14022030390 为了解非计算机专业对计算机课程教学的意见,在金融系和统计 系本科生中进行了一次抽样调查,得到了390名学生的调查数据。试 据此推断两系本科生对计算机课程教学的意见是否一致。 关于计算机课程教学意见的样本数据数据集8 结束

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号