医学研究数据管理与分析——第九章(2)

上传人:ji****en 文档编号:121275688 上传时间:2020-02-19 格式:PPT 页数:68 大小:888KB
返回 下载 相关 举报
医学研究数据管理与分析——第九章(2)_第1页
第1页 / 共68页
医学研究数据管理与分析——第九章(2)_第2页
第2页 / 共68页
医学研究数据管理与分析——第九章(2)_第3页
第3页 / 共68页
医学研究数据管理与分析——第九章(2)_第4页
第4页 / 共68页
医学研究数据管理与分析——第九章(2)_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《医学研究数据管理与分析——第九章(2)》由会员分享,可在线阅读,更多相关《医学研究数据管理与分析——第九章(2)(68页珍藏版)》请在金锄头文库上搜索。

1、第九章 SPSS软件应用 二 第二节 均数的比较 补充 假设检验 定义 假设检验是数理统计学中根据一定假设条件由样本 推断总体的一种方法 假设检验是非常重要的一类统计推断问题 假设检验 技术不仅可以对总体分布的某些参数 而且也可以对总体 本身的分布做出假设 通过对样本的统计分析来判定该假 设是否成立 从而对总体分布给以进一步的确认 如 已知样本来自正态总体 是否有理由说它是来自 均值为 的正态总体 再如 已知两个相互独立的样本 分别来自两个正态总体 能否说这两个总体均值相同或方 差相同 假设检验中的几个基本概念 1 原假设与备择假设 2 两类错误 3 检验统计量 4 拒绝域与临界值 5 显著性

2、水平 例 一种零件的生产标准是直径应为10cm 为对生产过 程进行控制 质量监测人员定期对一台加工机床检查 确定这台机床生产的零件是否符合标准要求 如果零件 的平均直径大于或小于10cm 则表明生产过程不正常 必须进行调整 试陈述用来检验生产过程是否正常的原 假设和备择假设 解 建立的原假设和备择假设为解 建立的原假设和备择假设为 HH 0 0 u u 10cm 10cm HH 1 1 u u 10cm 10cm 原假设 零假设 与备择假设 对立假设 1 第 类错误 弃真错误 原假设为真时拒绝原假设 第 类错误的概率记为 被称为显著性水平 2 第 类错误 取伪错误 原假设为假时未拒绝原假设 第

3、 类错误的概率记为 假设检验中的两类错误 两类 错误的关系 N一定 不能同 时减少两类错误 和和 的关系就的关系就 像翘翘板 像翘翘板 小小 就大 就大 大大 就小就小 拒绝域与临界值 假设检验的目的在于判断样本统计量与假设的 总体参数之间的差异 不同的抽样方法对应着不同 的标准 显著性水平就是用来判断接受和拒绝原假 设的标准 通常用 表示 1 1 在一次试验中 一个几乎不可能发生的事件发生在一次试验中 一个几乎不可能发生的事件发生 的概率为零 的概率为零 2 2 在一次试验中小概率事件一旦发生 我们就有理在一次试验中小概率事件一旦发生 我们就有理 由拒绝原假设 由拒绝原假设 3 3 由研究者

4、事先确定 由研究者事先确定 显著性水平 基本思想 利用小概率原理进行反证明 小概率 事件在一次实验中不可能发生 1 为了检验一个零假设 即虚拟假设 是否成立 先假定它是成立的 然后看接受这个假设之后 是否会导致不合理结果 如果结果是合理的 就接受它 如不合理 则否定原假设 2 所谓导致不合理结果 就是看是否在一次观 察中 出现小概率事件 通常把出现小概率事件 的概率记为0 01或者0 05 即显著性水平 假设检验的步骤 1 根据具体问题的要求 建立原假设 和备择假 设H 2 选择一个合适的检验统计量 它应与原假设有关 而且当原假设 为真时统计量的分布已知 3 给定显著性水平 当原假设 为真的

5、求出 临界值 4 由样本观测值计算检验统计量的数值 按检验规 则 对原假设作出拒绝或接受的判断 注 当总体标准差未知时一般采用T分布检验 当 总体标准差已知时一般采用正态分布检验 SPSS 的输出结果中给出了相应检验统计量的实际取 值 但由于显著性水平根据不同要求而有所不同 SPSS 并不给出临界值 如果不查概率表 就无法直 接采用上面的步骤进行检验 SPSS 给出了检验统计量的概值即文献中常见的p 值 p value 或称为相伴概率 利用p 值就可以直 接进行检验 p 值是在零假设成立的情况下 检验 统计量的取值等于或超过检验统计量的实际值的概 率 从而p 值即为否定零假设的最低显著性水平

6、p 值经常被称为实际显著性水平 以区别于给定的显 著性水平 当p 时 意味着如果给定一个真实的零假设 那么检验统计量的取值等于或超过实际观察到的极 端值的概率为 大多数学者都把这一结果解释 为支持你否定零假设而接受替代假设的证据 有学 者称p值为 实验使零假设相信者感到吃惊的程度的 度量 p值越小 零假设相信者吃惊的程度越高 为了便于记忆 我们可以把p 值理解为零假设的支 持率或可信程度 当p 时 我们拒绝零假设 如在0 05的显著水平下 如果p 不能拒绝H0 SPSS单样本t检验 四 基本操作步骤 1 菜单选项 Analyze compare means one samples T test

7、 2 指定检验值 在test后的框中输入检验值 SPSS单样本t检验 五 option选项 lconfidence interval 指定输出 0的置信区间 默认值为 95 lMissing values 缺失值的处理 单样本检验时以下选项没 有差别 l exclude cases analysis by analysis 当分析时涉及到有缺 失值变量时再剔除相应的个案 lexclude cases listwise 剔除所有含缺失值的个案后再分 析 SPSS单样本t检验 六 应用举例 例9 2 1 SPSS两独立样本t检验 成组t检验 一 含义 根据两独立样本的数据 对两总体均值是否有显著差

8、异 进行推断 例如 男生和女生的计算机平均成绩有显著差异吗 二 要求 两样本必须相互独立 即 抽取其中一批样本对抽取另一 批样本没有任何影响 如 北京周岁儿童与上海儿童的平均身 高 两总体服从正态分布 为什 么 SPSS两独立样本t检验 三 基本思路 lH0 u1 u2 0 两总体均值无显著差异 l构造检验统计量 两总体均方差未知时构造t统 计量 l方差相等 用合并方差 l方差不等 l计算t统计量和对应的相伴概率P 绝对值大于等于该值的双侧概率 SPSS两独立样本t检验 三 基本思路 结论 l方差齐性F检验 l利用Levene F检验确定两总体方差是否齐性 H0 两总体方差无显著差异 l该检验

9、首先计算每个个案与所属组均值之差并 取绝对值 然后对其进行单因素方差分析 SPSS两独立样本t检验 三 基本思路 结论 l首先 如果F检验的P 则拒绝F检验的H0 认为方差 不齐性 其次看Unequal行的t检验概率 如果 则拒 绝t检验的H0 认为两总体均值有显著差异 如果 则不拒绝t检验的H0 l首先 如果F检验的P 则不能拒绝F检验的H0 认 为方差齐性 其次看equal行的t检验概率 其余同上 SPSS两独立样本t检验 四 基本操作步骤 1 菜单选项 analyze compare means independent samples T 2 选择若干变量作为检验变量到test vari

10、ables框 3 选择代表不同总体的变量作为分组变量到grouping variable 框 4 定义分组变量的分组情况Define Groups use specified values 定义分组变量的分组标志值分别是什么 cut point 分组变量为连续变量 输入一个数字 将大于等于该值的 分成一组 小于该值的分成另一组 SPSS两独立样本t检验 应用举例 例9 2 2 SPSS两配对样本t检验 一 含义 根据配对样本对两总体均值是否有显著差异进 行推断 例如 某种药物是否有效 二 要求 两样本数据必须两两配对 即 样本个数相同 个 案顺序相同 控制了个案自身的影响 两总体服从正态分布

11、SPSS两配对样本t检验 三 基本思路 lH0 两总体均值无显著差异 差值序列的均值u0 0 l构造统计量 同单样本均值检验 l实质是先求出每对测量值的差值 然后检验差值序列的均 值是否与0有显著差异 l如果差值的均值与0有显著差异 则认为两总体均值存在显 著差异 否则 与0无显著差异 则认为两总体均值不存在显 著差异 l计算t统计量和对应的相伴概率P 绝对值大于等于的双侧概 率 l结论 P 则拒绝H0 认为两总体均值有显著差异 P 不能 拒绝H0 SPSS两配对样本t检验 四 基本操作步骤 1 菜单选项 analyze compare means paired samples T 2 选择一

12、对或若干对配对变量作为检测变量到paired variables框 3 option选项 同独立样本的T检验 SPSS两配对样本t检验 应用举例 例9 2 3 作业 一 给幼鼠以不同的饲料 研究每天钙的留存量是否有显著不 同 以下两种方法涉及实验样本 方式1 同一鼠喂不同的饲料 鼠号 1 2 3 4 5 6 7 8 9 饲料1 33 1 33 1 26 8 36 3 39 5 30 9 33 4 31 5 28 6 饲料2 36 7 28 8 35 1 35 2 43 8 25 7 36 5 37 9 28 7 方式2 甲组12只喂饲料1 乙组9只喂饲料2 甲组 29 7 26 7 28 9

13、31 1 31 1 26 8 26 3 39 5 30 9 33 4 33 1 28 6 乙组 28 7 28 3 29 3 32 2 31 1 30 0 36 2 36 8 30 0 二 根据学生成绩数据 分析 是否有男女生平均成绩存在明显差异的课程 判断学生在哪些课程上的平均成绩差别不明显 方差分析概述 一 目的 方差分析从分析数据的差异入手 分析 哪些因素是影响数据差异的众多因素中的主要因素 二 相关概念 1 观测变量 作为观测的对象 如 亩产量 推销量等 2 控制因素 人为可以控制的因素 如 施肥量 品种 推 销策略 价格 包装方式等 在方差分析中称为控制因 素 将控制变量的不同情况称

14、为控制变量的不同水平 3 随机因素 人为很难控制的因素 如 气候 推销人员的 形象 抽样误差等 方差分析中主要指抽样误差 方差分析概述 三 核心问题 从数据差异角度看 观测变量的数据差异 控制因素造成 随机因素造成 当控制因素对实验结果有显著影响时 和随机因素共同作用 必然使观测变量产生显著变动 反之 观测变量的变动较小 将 归结为随机性造成的 这里指抽样误差造成的 方差分析概述 四 方差分析的类型 单因素方差分析 只考虑一个控制因素的影响 多因素方差分析 考虑两个以上的控制因素和它们的交互作用对观测变 量的影响 协方差分析 在尽量排除其他因素的影响下 分析单个或多个控制 因素对观测变量的影响

15、 引入协变量 单因素方差分析 一 目的 检验某一个控制因素的改变是否会给观察变量 带来显著影响 例如 应用面很广 科学试验 社会经济问题 考察不同肥料对某农作物亩产量是否有显著差异 考察不同温度下某产品的获得率 考察妇女生育率在不同地区是否有显著差异 考察不同学历是否对工资收入产生显著影响 单因素方差分析 二 基本思路 1 入手点 检验控制变量的不同水平下 各总体的分布是否存在 显著差异 进而判断控制变量是否对观测变量产生了 显著影响 2 前提 各组样本独立 不同水平下各总体服从方差相等的正态分布 3 H0 不同水平下 各总体均值无显著差异 即 不同水平下 控制因素的影响不显著 通过参数检验可

16、以解决两两总体均值的比较 多个总体均值的检验如何作 如 北京 上海 广州周岁 儿童平均身高的比较 可以多次采用两样本t检验方法实现 产生的问题 犯第一类错误的概率明显增大 例如 K个变量两两进行t检验 需要作N k 2 k 2 次 如果 为0 05 那么每次不犯 错的概率为0 95 N次检验均不犯 错的概 率为0 95N 而犯 错的概率为1 0 95N 远远大于设定的0 05 可以利用方差分析的方法来实现多个总体的均值比较 单因素方差分析 单因素方差分析 二 基本思路 4 构造F统计量 因为 总变差 组间差异 组内差异 可证明 SST SSA SSE 设 k个水平 每个水平有ni个 数据 考察平均的组间差异与平均的组内差异的比值 于是 F k 1 n k 单因素方差分析 二 基本思路 5 结论 lF值较大 F值的概率p值小于或等于用户给定 的显著性水平a 则拒绝H0 认为不同水平下各 总体均值有显著差异 lF值较小 F值的概率p值大于用户给定的显著 性水平a 则不能拒绝H0 不可以认为不同水平 下各总体均值存在显著差异 单因素方差分析 四 基本操作步骤 1 菜单选项 analyze c

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号