医学统计学——t检验ppt课件

上传人:资****亨 文档编号:129849551 上传时间:2020-04-23 格式:PPT 页数:41 大小:1.47MB
返回 下载 相关 举报
医学统计学——t检验ppt课件_第1页
第1页 / 共41页
医学统计学——t检验ppt课件_第2页
第2页 / 共41页
医学统计学——t检验ppt课件_第3页
第3页 / 共41页
医学统计学——t检验ppt课件_第4页
第4页 / 共41页
医学统计学——t检验ppt课件_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《医学统计学——t检验ppt课件》由会员分享,可在线阅读,更多相关《医学统计学——t检验ppt课件(41页珍藏版)》请在金锄头文库上搜索。

1、1 第三篇医学统计学方法 StatisticalMethodsinMedicine 2 第九章数值变量资料的统计分析第一节数值型资料的统计描述第二节正态分布和参考值范围的估计第三节数值型资料的统计推断第四节t检验和u检验第五节方差分析 3 4 统计分析包括统计描述和统计推断两大部分 统计描述 statisticaldescription 是用统计指标 统计表和统计图描述资料的分析规律及其数量特征 统计推断 statisticalinference 包括总体参数估计和假设检验两个内容 参数估计 是用样本统计量估计总体参数所在范围 假设检验 是利用样本的实际资料来检验事先对总体某些数量特征所作的假

2、设是否成立 5 第一节数值型变量资料的统计描述例9 12002年某市150名20 29岁正常男子的尿酸浓度 mol L 资料见表9 1 如何进行统计描述 6 表9 12002年某市150名20 29岁正常男子的尿酸浓度 mol L 7 统计描述的内容 一 制频数 分布 表 表9 2 和频数分布图 图9 1 频数表的用途 1 揭示资料的分布特征和分布类型 2 便于发现某些特大或特小的可疑值 3 便于进一步计算统计指标和统计分析处理二 计算统计指标 1 计算平均值 代表一组资料的平均水平 2 计算标准差 反映资料的离散程度 三 绘制统计表和统计图 8 一 编制频数分布表 制表步骤 1 求极差或全距

3、 range R Xmax Xmin本例 R 428 7 278 6 150 1 mol L 2 决定组数 组段数和划分组距 classinterval 根据样本含量的多少确定组数 一般设8 15组 组段数 取整 极差 组数 本例 组段数 取整 150 1 10 15 01 15划分组距 每组段的起点和终点分别称为下界和上界 组距 本组内的上界和下界之差 9 3 列频数表 按上述组段序列制成表的形式 采用划记法或计算机将原始数据汇总 得出各组段中所包含的观察例数 即为频数 如表9 2的第 2 栏 将各组段及其相应的频数列成表格 即为频数表 frequencytable 如表9 2 所绘的图形见

4、图9 1 10 资料的分布类型 对称分布或正态分布 2 偏态分布 高峰在左侧或右侧 3 不规则分布 分布很散 无明显高峰 11 二 计算平均值 代表平均资料的平均水平1 平均值的种类 一 算术均值 arithmeticmean average 常用表示样本均值 希腊字母 表示总体均值 适用于对称分布的数值型变量资料 其计算方法有 直接法 i I 1 2 n 为第i个观察对象的观察值 加权法 i为第i组的组中值 fi为第i组的例数 12 13 二 几何均值 geometricmean G 适用条件 等比级数资料 原始观察值呈偏态分布 但数据经过对数变换后呈正态分布或近似正态分布的资料 如医学实践

5、中某些疾病的潜伏期 抗体滴度 平均效价等 其计算方法有 直接法 i为第i个观察对象的观察值 加权法 i为第i组的组中值 或观察值 fi为第i组例数 14 表9 4某地34名儿童接种麻疹疫苗后血清血凝抑制抗体滴度 血清血凝抑制抗体的几何平均滴度为1 10 206 X 2 5 3 5 0 7 10 0 14 20 0 6 40 0 4 34 13 6 算术平均滴度为1 13 6 15 三 中位数 median M 将观察值按大小排序后 位次居中的观察值 M X P 50 在全部观察值中小于M的观察值个数与大于M的观察值个数相等 由于M不受个别特小或特大观察值的影响 适用于分布不规则或分散度很高的资

6、料 3个观察值 1 3 5 M 3 4个观察值 1 3 5 7 M 4 直接法 设n为观察值的个数 有公式 9 5 及 9 6 频数表法 i为第i组的组中值 或观察值 fi为第i组例数 L 中位数组段下限值 fL 小于L的累计频数 i 中位数组距 16 表9 5308名6岁以下儿童尿铅值的频数分布 中位数计算 L 中位数组段下限值 fL 小于L的累计频数 i 中位数组距 f50 中位数组频数 L 50 fL 81 i 25f50 95 17 三 计算标准差 反映资料的离散程度 数值变量数据的频数分布有集中趋势和离散程度两个主要特征 只有两者相结合 才能全面地认识事物 反映资料的离散程度的统计量

7、 统计指标 有 一 全距 range 或极差 R Xmax Xmin全距是一组观察值中最大值与最小值之差 二 四分位数间距 quartileinterval Q X75 X25 Q包括了全部观察值中间的一半 三 方差 variance 和标准差 standarddeviation 18 例有3组同龄男孩的体重 测量值如下 其平均体重都是30 试分析其离散程度 19 标准差的简化计算方法 数学上可证明 故标准差的计算公式又可写成 直接法 X为观察值加权法 Xi为组中值 20 标准差的应用 1 表示观察值的变异程度 离散程度 在两组 或几组 资料均数相近 度量单位相同的条件下 标准差大 表示观察值

8、的变异度大 即各观察值离均数较远 均数的代表性较差 2 结合均数描述正态分布的特征和估计医学参考值范围 3 结合样本含量n计算标准误 21 四分位数间距的计算 interquartilerange Q 中位数计算公式 25 位数计算公式 75 位数计算公式 22 四分位数间距 interquartilerange Q 计算公式 Q X75 X25 X0 X25 X50 X75 X100 Q 048 1569 21100 0175 X1 Xn 23 24 变异系数 coefficientofvariation CV 若比较度量单位不同或均数相差悬殊的两组 或几组 观察值的变异度 则需用变异系数为

9、相互比较的指标 不属于描述性统计指标 是一个比较用的统计指标 从变异系数比较 体重的变异程度大于身高的变异程度 变异系数的特点 描述的是相对离散程度 没有单位 适用于 1 比较单位不同的多组资料的变异度 2 比较均数相差悬殊的多组资料的变异度 例9 10某地25岁男子100人的调查结果如下 问题 哪一个指标的变异度大些 25 第二节正态分布和医学参考值范围一 正态分布 normaldistribution 26 图9 2频数分布逐渐向正态分布接近 27 一 正态分布的图形可以设想 如果观察例数逐渐增多 组段数也不断增多 就会形成一条光滑曲线 图9 2 3 称为正态分布曲线 这条正态分布曲线的特

10、点为 高峰位于中央均数所在处 两侧逐渐降低 左右对称 曲线在无穷远处与横轴相交 把服从正态分布的变量表示为 X N 2 正态分布曲线由两个参数确定 平均数 称位置参数 决定平均数所在的位置 方差 2 称形状参数 决定曲线的高低宽窄 28 服从正态分布的变量X的概率密度函数f X 为 式中 为总体均数 为总体标准差 3 14159为圆周率 e为自然对数的底 e 2 71828 X为变量 表示为 u N 0 1 即平均值为0 方差为1的正态分布 为实际应用方便 将一般正态分布转换为标准正态分布 转换公式为 u X u称为标准正态变量 服从标准正态分布的变量u的概率密度函数f u 为 29 A 正态

11、分布B 标准正态分布图9 3正态分布与标准正态分布的面积与纵高 按式 9 16 根据X的不同取值 绘出正态分布 normaldistribution 的图形 图9 3A 按式 9 16 根据u的不同取值 绘出标准正态分布 standardnormaldistribution 的图形 图9 3B X u 30 图9 4正态曲线与标准正态曲线的面积分布 二 正态曲线下面积的分布规律 用积分法求得 31 为了省去计算的麻烦 编制成了 标准正态分布曲线下的面积 表9 8 表中列出了左侧概率 u 右侧概率 u u u 1 u 通过查表可求出正态曲线下某区间的面积 进而估计该区间观察例数占总例数的百分数或

12、变量值落在该区间的概率 查表时应注意 当 已知时 先将观察值X变换为u值 u X 再查表 当 未知 但n足够大时 可以用样本均数和样本标准差s分别代替 和 进行u变换 u X s 求得u的估计值后再查表 曲线下对称于0的区间面积相等 如 1 96 1 96 曲线下横轴上的总面积为100 或1 32 三 医学参考值范围的估计 参考值范围 referencerange 的意义参考值是指正常人体或动物的各种生理常数 正常人体液和排泄物中某种生理生化指标或某种元素的含量 以及人体对各种试验的正常反应值等 由于存在个体变异 各种数据不仅因人而异 而且同一个人还会随机体内外环境的改变而改变 因而需要确定其

13、波动的范围 即医学参考值范围 亦称医学正常值范围 33 制订医学参考值范围时须注意 从同质总体中随机抽样 根据研究目的确定同质总体的标准 排除患有影响所研究指标的疾病和有关因素的同质人群 需要有一定的样本含量 n 100例 控制测量误差 判断是否需要分组确定参考值范围 如不同性别 不同年龄组 甚至不同民族 确定是取单侧还是取双侧参考值 确定适当的百分数范围 80 90 95 99 范围过窄 即诊断标准过严 会增加漏诊 范围过宽 即诊断标准过松 会增加误诊 根据资料分布类型选择统计学方法估计参考值范围 34 例9 11 表9 22002年某市150名20 29岁正常男子的尿酸浓度资料 X 350

14、 24 mol L S 32 97 mol L 用正态分布法双侧95 的参考值范围的上下界限值为 下界 350 24 1 96 32 97 285 62 mol L 上界 350 24 1 96 32 97 414 86 mol L 即20 29岁男性尿酸浓度95 参考值范围 285 62 414 86 mol L 35 例9 12 例9 7表9 5 308名6岁以下儿童尿铅值资料 用百分位数法计算单侧95 参考值范围的上界值 即X95 L 150 95 组段下限值 fL 291 小于L的累计频数i 25 95 组的组距f95 12 95 组频数 故6岁以下儿童尿铅值单侧95 参考值范围为 153 33 mmol L 36 37 Theend 38 第九章第一讲 练习题 实习九数值变量资料的统计分析 1 pp 379 382 内容 一 选择题 1 2 3 9 10 二 思考题 1 2 6 三 应用题 1 2 3 39 表9 8标准正态分布曲线下的面积自 到 u的面积 u u 1 u 40 感谢亲观看此幻灯片 此课件部分内容来源于网络 如有侵权请及时联系我们删除 谢谢配合

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号