697编号医学统计学知识点

上传人:玩*** 文档编号:145839677 上传时间:2020-09-23 格式:PDF 页数:18 大小:289.46KB
返回 下载 相关 举报
697编号医学统计学知识点_第1页
第1页 / 共18页
697编号医学统计学知识点_第2页
第2页 / 共18页
697编号医学统计学知识点_第3页
第3页 / 共18页
697编号医学统计学知识点_第4页
第4页 / 共18页
697编号医学统计学知识点_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《697编号医学统计学知识点》由会员分享,可在线阅读,更多相关《697编号医学统计学知识点(18页珍藏版)》请在金锄头文库上搜索。

1、第一章 绪论 1、统计学统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象研究对象:具有不确定性结果的事物。 3、统计学作用统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。统计学通过对变异的研究来探索事物

2、。 (2) 变量与数据类型 变量变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据数据 分为三种类型:定量数据定量数据,也称计量资料计量资料,指对每个观察单位某个变量用测量或其他定量 方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性 数据 定性 数据,也称计数资料计数资料,指将观察单位按某种属性分组计数计数的定性观察结果。包括二分类、 无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为 A、B、O、 AB 等) 有序数据有序数据,也称半定量数据或等级资料半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成 等级等级后分组计数

3、的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量 值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。 抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误 差的大小通常恒定,具有明确的方向性具有明确的方向性

4、。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率 P(U)1; 随机事件,事件可能发生,可能不发生,概率介于 0P(A) 1; 不可能事件,事件肯定不发生,概率 P()0; 小概率事件,事件发生的可能性很小,概率 P(A) 0.05、或 P(A) 0.01。 医 学 科 研 中 ,医 学 科 研 中 , P(A) 0.0

5、5 作 为 事 物 差 别 有 统 计 意 义 ,作 为 事 物 差 别 有 统 计 意 义 , P(A) 0.01 作为事物差别有高度统计意义。作为事物差别有高度统计意义。 第二章第二章 定量数据的统计描述定量数据的统计描述 定量数据的统计描述方法:定量数据的统计描述方法:频数表、直方图、统计指标。 (1)频数分布)频数分布 频数分布的目的:频数分布的目的:了解数据的分布范围、集中位置以及分布形态等特征,以便根据资料分 布情况选择合适的统计方法。 频数分布的用途:频数分布的用途: 作为陈述资料的形式; 便于观察数据的分布类型; 便于发现数据中特大或特小的可疑值; 当样本量大时,可用各组段的频

6、率作为概率的估计值。 计算全距(计算全距(range,R):):是一组数据的最大值与最小值之差。RMax-Min 确定组数与组距 样本量在样本量在 100 例左右,组数选择例左右,组数选择 815 之间,一般取之间,一般取 10 组左右。组左右。 组距全距/组数 确定组限确定组限 第一组段必须包括最小值,最后一组段必须包括最大值。 最后一组段包括最大值,且一般情况下应包含该组段上限,其余各组段区间左闭右开。 计算各组段频数(计算各组段频数(frequency):):即计算各组段内观察值的个数。 计算各组段频率(计算各组段频率(percent):):即计算各组段频数与总观察值个数之比,用百分数表

7、示。 计 算 累 计 频 数 (计 算 累 计 频 数 ( cumulative frequency) 和 累 计 频 率 () 和 累 计 频 率 ( cumulative percent ):累计频数):累计频数是由上至下将频数累加;累计频率累计频率是由上至下将频率累加。 (2)直方图)直方图 直方图,直方图,是以垂直条段代表频数分布的一种图形。 (3)频数分布表的用途)频数分布表的用途 1、作为称述资料的形式,可以代替原始资料,便于进一步分析。 2、便于观察数据的分布类型。资料分布类型分为:对称分布和偏态分布。 在统计分析时常需要根据资料的分布形式选择相应的统计分析方法,因此对数据分布形

8、式 的判定非常重要。 3、便于发现资料中某些远离群体的特大或特小值。 4、当样本含量比较大时,可用各组段的频率作为概率的估计值。 集中趋势的统计指标集中趋势的统计指标 平均数,平均数,是描述一组观察值集中位置或平均水平的统计指标,常作为一组数据的代表值用 于分析和进行组间的比较。 常用的有算术均数、几何均数、中位数、百分位数等。常用的有算术均数、几何均数、中位数、百分位数等。 算术均数,算术均数,等于一个变量所有观察值的和除以观察值个数。 总体均数用希腊字母 表示,样本均数用符号 拔 表示。 算术均数适用于适用于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据 。 算术均数易受

9、极端值的影响,并且受极大值的影响大于受极小值的影响。 几何均数几何均数 几何均数(几何均数(geometric mean,G),),等于一个变量所有 n 个观察值的乘积的 n 次方根。 几何均数适用于取对数后近似呈对称分布的资料,尤其是右偏态分布数据。医学研究中常 用于比例数据。 【注】计算几何均数的观察值不能小于或等于【注】计算几何均数的观察值不能小于或等于 0,因为无法求对数。,因为无法求对数。 中位数中位数 中位数(中位数(median,M ),),是在按大小顺序排列的变量的所有观察值中,位于正中间的一个或两个数值。 当数据呈偏态分布、或频数分布两端无确定数值,均宜采用中位数描述集中趋势

10、。 中位数的确定取决于它在数据序列中的位置,因此对极端值不敏感。 百分位数百分位数 百分位数(百分位数(percentile ),),是一个位置指标,它将一组变量值排列后划分为若干相等部分的分割点数值。用 Px 表示,X 用百分数表示。 表示在按照升序排列的数据中,其左侧( Px )的观察值个数在整个样本中所占百分比为 X %,其右侧( Px )的观察值个数在整个样本中所占百分比为(100X )%。 百分位数不论资料分布类型均可计算,在实际工作中常用于确定医学参考值范围;在假设 检验中用作拒绝或不拒绝检验假设的界值。 百分位数并非由全部观察值综合计算得来,因此,它不如均数和标准差精确;然而中间

11、部 分的百分位数因不受资料中个别极端数据的影响,具有较好的稳定性。 小小 结结 指指 标标意意 义义适用场合适用场合 均均 数数个体的平均值个体的平均值对称分布,特别是正态分布资料。对称分布,特别是正态分布资料。 几何均数几何均数平均倍数平均倍数取对数后对称分布。取对数后对称分布。 中位数中位数位次居中的观察值位次居中的观察值非对称分布;半定量资料;非对称分布;半定量资料; 末端无确切数值;分布不明。末端无确切数值;分布不明。 变异程度的统计指标变异程度的统计指标 变异指标,又称离散指标,变异指标,又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。 变异指标越大,观察值之间差异愈大

12、,说明变异程度越大;反之亦然。 常用的有极差、四分位数间距、方差、标准差和变异系数。常用的有极差、四分位数间距、方差、标准差和变异系数。 极极 差差 极差(极差(range,R),等于一个变量所有观察值中最大值与最小值之间的差值。 R Max Min 缺点:缺点: 没有利用观察值的全部信息,不能反映其它数据的离散度; 各样本含量大小悬殊时,不宜比较其极差; 极差的抽样误差也较大,所以不够稳定。 极差仅适用于对未知分布的小样本资料作粗略的分析。 四分位数间距四分位数间距 四分位数,四分位数,是统计学对特殊的三个百分位数 P25% 、 P50% 和 P75%的统称 四分位数间距(quartile

13、range,Q), 等于第三四分位数与第一四分位数之间的差值。 Q P75% P25% 缺点:缺点: 没有利用观察值的全部信息,不能反映其它数据的离散度; 四分位数间距仅用来描述大样本偏态资料的变异情况。 方方 差差 方差(方差(variance), 是描述一个变量的所有观察值与总体均数的平均离散程度的指标。 总体方差用 2 表示,样本方差用 S2 表示。 标准差标准差 标准差(标准差(standard deviation,S ),), 是描述一个变量的所有观察值与均数的平均离散程度的指标。 总体标准差用 表示,样本标准差用 S 表示。 标准差标准差 方差或标准差属同类变异指标,它们多用来描述

14、均匀分布或近似正态分布的资料,大、小 样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中 常用 X 拔S 的形式表达资料。 变异系数变异系数 变异系数(变异系数(coefficient of variation,CV ),), 是一个度量相对离散程度的指标。 CV 是无量纲的指标,可以用来比较几个量纲不同的指标变量之间的离散程度的差异,或比较 量纲相同但均数相差悬殊的变量之间的离散程度的差异。 小小 结结 指指 标标意意 义义适用场合适用场合 极极 差差观察值的取值范围观察值的取值范围不拘分布形式,概略分析。不拘分布形式,概略分析。 四分位数四分位数 间距间距 居中

15、半数观察值的极差居中半数观察值的极差非对称分布;半定量资料;非对称分布;半定量资料; 末端无确切数值;分布不明。末端无确切数值;分布不明。 标准差 (方差) 标准差 (方差) 观察值距离均数的平均程度观察值距离均数的平均程度对称分布,特别是正态分布资料。对称分布,特别是正态分布资料。 变异系数变异系数变异程度大小的对比变异程度大小的对比不同量纲的变量间比较;不同量纲的变量间比较; 量纲相同但数量级相差悬殊的变量 间比较。 量纲相同但数量级相差悬殊的变量 间比较。 第三章第三章 正态分布与医学参考值范围正态分布与医学参考值范围 正态分布,正态分布,是一种连续型随机变量常见而重要的分布。 正态曲线

16、正态曲线,是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交 的钟型曲线。 如果随机变量 X 的分布服从概率密度函数和概率分布函数称连续型随机变量 X 服从正态分布,记为 XN (, 2 )。 为圆周率, e 为自然对数的底值, 为总体标准差, 为总体均数。 正态分布的特征正态分布的特征 1、 正 态 分 布 是 单 峰 分 布 , 以 X = 为 中 心 , 左 右 完 全 对 称 , 正 态 曲 线 以 X 轴为渐近线,两端与 X 轴不相交。 2、正态曲线在 X = 处有最大值,其值为 f()=1/(2) ;X 越远离 ,f(X)值越小,在 X= 处有拐点,呈现钟形。 3、正态分布完全由参数 和 决定。 是 位 置 参 数 , 决 定 正 态 曲 线 在 X 轴 上 的 位 置 。 在 一 定 时 , 增大,曲线沿横轴向右移动; 较小,曲线沿横轴向左移动。 是 形 状 参 数 , 决 定 正 态 曲 线 的 分 布 形 态 。 越 大 , 曲 线 的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号