类变量资料的统计分析

上传人:tian****1990 文档编号:81634190 上传时间:2019-02-22 格式:PPT 页数:37 大小:441.50KB
返回 下载 相关 举报
类变量资料的统计分析_第1页
第1页 / 共37页
类变量资料的统计分析_第2页
第2页 / 共37页
类变量资料的统计分析_第3页
第3页 / 共37页
类变量资料的统计分析_第4页
第4页 / 共37页
类变量资料的统计分析_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《类变量资料的统计分析》由会员分享,可在线阅读,更多相关《类变量资料的统计分析(37页珍藏版)》请在金锄头文库上搜索。

1、,环境与公共卫生学院预防医学系 闫洪涛,计数资料的统计分析,统计资料的类型,数值变量: 计量资料,分类变量: 计数资料,有序分类 : 变量之间有程度的差 别, 且排列有序. (等级变量),无序分类:,第十章 分类变量资料的统计分析,第一节 统计描述 一.描述指标(相对数) 1. 率(rate) : 单位: %,万分率,10万分率 2. 构成比 (constituent ratio) 单位: % 特点: 3. 相对比 (relative ratio) 常用率比,例10-1 某研究者2000年对某校的初中生进行了近视患病情况调查,试计算各年级近视患病率和构成比及三年级和一年级患病率的相对比.,年级

2、 检查人数 患病人数 患病率 构成比 相对比,一年级 442 67 二年级 428 68 三年级 405 74,合计 1275 209 16.39 100.0,15.16 32.06 15.89 32.53 18.27 35.41 1.2,二. 应用相对数时注意事项 1. 分母不宜太小 2. 率和构成比的区别 3. 样本含量不等的几个率的平均值不等于 几个率的算数平均值 4. 对率或构成比进行比较时,应注意资料的可比性 5. 率的标准化 6. 两样本率进行比较时应进行假设检验,三.率的标准化 1.基本思想: 为消除内部构成不同对指标的影响, 采用统一的内部构成计算标准化率,使得出的标准化率具有

3、可比性. 2.计算方法: 直接法: 已知各年龄组的实际发病率,用标准人口数或 标准人口构成进行计算 间接法: 标准化死亡比 (SMR), 实际死亡数与预 期死亡数的比 3. 率的标准化应注意的问题,第三节 率的标准化法 (standardization),西医组 中西医结合组 病型 病例数 治愈数 治愈率 (%) 病例数 治愈数 治愈率 (%) 普通型 60 36 60 20 13 65 重型 20 8 40 60 27 45 爆发型 20 4 20 20 5 25 合计 100 48 48 100 45 45,西医标准化治愈率 P= 88200 = 44%,中西医标准化治愈率 P= 9820

4、0 = 49%,例: 某病两种疗法治愈率的比较,西医组 中西医结合组 病型 病例数 原治愈率 (%) 预期治愈数 原治愈率 (%) 预期治愈数 普通型 80 60 48 65 52 重型 80 40 32 45 36 爆发型 40 20 8 25 10 合计 200 88 98,率的标准化 1.基本思想: 为消除内部构成不同对指标的影响, 采用统一的内部构成计算标准化率,使得出的标准化率具有可比性. 2.计算方法: 直接法: 已知各年龄组的实际发病率,用标准人口数或标准人口构成进行计算 间接法: 标准化死亡比 (SMR), 实际死亡数与预期死亡数的比,3. 率的标准化应注意的问题,由于内部构成

5、不同,影响到要比较的总率,需要标准化处理? 标准化率只用于比较,已经不代表实际的水平。 各分组率有交叉,不能用标准化率比较 抽样得到的标准化率的比较,也应该进行假设检验.,第二节 计数资料统计推断,一. 率的抽样误差和标准误 样本率和总体率或样本率之间存在的差异,称抽样误差.率的抽样误差用率的标准误表示.(p or Sp).,( p =阳性率, 1- p=阴性率),二. 总体率的区间估计,查表法: 当n 50, 样本率p 接近与0或1时,该资料服从二项分布,用查表法估计样本含量,p u Sp,1. 正态近似法:,np 和 n(1-p)5,条件: n 足够大,样本率p 或1-p均不太小时, 即,

6、例10-5 为了解某地乙肝表面抗原携带情况,某研究者在该地人群中随机检测了该地200人,乙肝表面抗原阳性7人,乙肝表面抗原携带率为3.5%,试计算标准误并估计95%和99%可信区间.,95%可信区间: 3.5% 1.96 Sp 99%可信区间: 3.5% 2.58 Sp,n=200 X=7, P=3.5%,三. 两个率比较的u 检验,当np和 n(1-p) 5 时 样本率的分布近似正态分布 u 检验,(一) 检验步骤: 1. 建立假设, 确定检验水准 H0: H1: =0.05 2. 选择检验方法, 计算 u 值 3. 确定 P 值, 判断结果,(二)资料类型,样本率与总体率的比较 (例10-

7、6),计算公式:,2. 两个样本率的比较 (例10-7) 计算公式:,第三节 X2 检验 (chi-square test),基本思想 检验实际频数与理论频数的吻合程度,实际频数与理论频数越相近, X2 值越小; 反之,实际数与理论数相差越大, X2值越大.,计算公式:,理论频数的计算: TRC= nRnC / n df=(行数-1)(列数-1),例10-8 某医生用A,B两种药物治疗急性下呼吸道感染.A药治疗74例,有效68例;B药治疗63例,有效52例.问两种药物的有效率是否有差别?,例10-8 某医生用A,B两种药物治疗急性下呼吸道感染.A药治疗74例,有效68例;B药治疗63例,有效5

8、2例.问两种药物的有效率是否有差别?,二. 2 检验的基本步骤 建立检验假设,确定检验水准 H0: 1= 2 H1: 1 2 =0.05 2. 计算2 值 资料类型不同,计算公式不同 3. 确定 P 值, 判断结果 根据查2 界值表, 确定P值,三. 四格表资料的2 检验,1. 四格表资料的2 检验的专用公式,df =(R-1)(C-1)=1,四格表资料的2 检验的校正 - Yates 连续校正 校正公式:,校正的目的: 英国统计学家(Yates)认为2分布是一种连续性分布,而四格表中的资料属离散性分布,得到的2统计量的抽样分布也是离散的.因此,为改善2统计量分布的连续性,建议进行校正. 连续

9、性校正应遵循的条件: 1. T 5, 且 N 40时, 用非校正的公式 2. 1 T 5,且N 40时,用连续性校正公 式 3. T 1 或 N 40, 用 Fisher 精确概率法,例10-9 某医生收集到两种药物治疗白色葡萄球菌败血症疗效的资料,结果见表10-8,问两种药物疗效之间的差别有无统计学意义?,处理 有效 无效 合计,甲药 28 (26.09) 2 (3.91) 30 乙药 12 (13.91) 4 (2.09) 16,合计 40 6 46,例10-10 用两种不同的方法对53例肺癌患者进行诊断,资料见表10-9. 问两种检测结果有无差别?,3. 配对设计资料的2检验,b+c40

10、:,当 b+c40 时, 用校正公式. (McNemar 检验),4. 行列表资料的2检验 (R C 表资料),基本公式:,A 每个格子的实际频数 nR A所对应的行合计 nC A所对应的列合计,例10-12. 某研究者欲比较甲、乙、丙三家医院住院患者院内感染情况,随机抽查同一时期住院患者感染情况,结果如下:试比较三家医院院内感染率有无差别。,H0:三家医院院内感染率相同 H1:三家医院院内感染率不相同或不全相同 0.05,df=(行数-1)(列数-1) (31)(21) =2 查X2界值表: X20.05(2)=5.99 X20.01(2)=9.21,按0.05,拒绝H0,接受H1,差别有统

11、计学意义,即可认为三家医院住院病人的院内感染率有差别。 然而,三者之间谁和谁有差别,还不知道。应该进一步进行两两比较 两两比较,可采用 X2分割,行列表资料2检验应注意事项 1. 行列表资料2检验公式的应用条件: 不能有1/5以上的格子的理论数5, 或者,不能有1个格子的理论数1 2. 如果资料不能满足上述条件,则可以通过 (1) 在可能的情况下再增加样本量; (2)专业上允许的情况下,合并相邻的行或列; (3) 删去理论数太小的行和列 3. 假设检验结果有差别,只能认为总的率或构成比有差别,4. 单向有序变量(等级资料)的行列表,不能用X2检验比较组间效应,如果作X2,只能说明个处理组间的效

12、应在构成比上有无差别。,小结 计数资料的统计描述 指标: 率、构成比、相对比 计数资料的统计推断 总体参数估计:PuSp 率的假设检验: 样本率与总体率的比较 - u检验 两个大样本率的比较 - u检验 两个样本率的比较 - 2检验 配对设计资料的两个率比较 - 2检验 多个样本率的比较 - RC表的2检验 假设检验的基本步骤完全相同,统计资料处理的基本思路,资料的整理 : 统计图,统计表,统计资料的描述 (描述指标),统计学推断 总体参数的估计(可信区间) 假设检验,统计资料类型的判断,例1. 某研究者欲比较甲乙两药治疗高血压的效果,进行了随机对照试验.甲乙药组各选择了50名病人,甲药组血压

13、平均下降了10.67mmHg,标准差是3.27mmHg, 乙药组平均下降了13.20mmHg,标准差是4.33mmHg. 问两药降压效果是否不同?,例2. 为调查2型糖尿病发病易感因素,某研究者进行了一项以医院为基础的病例对照研究.结果发现,在200名糖尿病病例中, 100人有糖尿病遗传家族史;而200名对照者中只有50人有糖尿病家族史.问糖尿病家族史是否在两组中分布不同?,例3. 为比较A,B,C,D四种药物治疗小细胞肺癌的效果,将160人随机分配进入四个治疗组.每组40人.治疗结果见下表,试比较四种药物治疗效果有无差别?,处理组 有效 无效 合计 .,A 药 15 25 40 B 药 10 30 40 C 药 13 27 40 D 药 8 32 40,合计 46 114 160 .,例4. 用A、B两种不同的方法对58例系统红斑狼疮患者血清中的抗体进行测定,资料见下表,问两种检测结果有无差别?,A 法,+ -,B 法,合计,+ 11 12 23 - 2 33 35,合计 13 45 58 .,例5. 为研究铅作业与工人尿铅含量的关系,随机抽查了3种作业工人的尿铅结果,见下表.问3种作业工人的尿铅含量是否不同?,铅作业组 调离铅作业组 非铅作业组 .,0.01 0.11 0.09 0.16

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号