医学统计学知识点

上传人:m**** 文档编号:469293871 上传时间:2022-08-17 格式:DOCX 页数:18 大小:42.87KB
返回 下载 相关 举报
医学统计学知识点_第1页
第1页 / 共18页
医学统计学知识点_第2页
第2页 / 共18页
医学统计学知识点_第3页
第3页 / 共18页
医学统计学知识点_第4页
第4页 / 共18页
医学统计学知识点_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《医学统计学知识点》由会员分享,可在线阅读,更多相关《医学统计学知识点(18页珍藏版)》请在金锄头文库上搜索。

1、第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。2、研究对象:具有不确定性结果的事物。3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。5、医学统计学根本内容:统计设计、数据整理、统计描述、统计推断。6、医学统计学中的根本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致一样。变异,指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。变量的观测值,称为数据分为三种

2、类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量 方法准确获得的定量结果。如身高、体重、血压、温度等定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、 无序多分类。进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、0、AB 等有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成 等级后分组计数的观察结果,具有半定量性质。统计方法的选用与数据类型有密切的关系。3总体与样本总体,指根据研究目确实定的所有同质观察单位的全体,包括所有定义X围内的个体变量 值。样本,是从研究总体中随机抽取局部有代表性的观察单位,对

3、变量进展观测得到的数据。 抽样,是从研究总体中随机抽取局部有代表性的观察单位。参数,指描述总体特征的指标。统计量,指描述样本特征的指标。4误差误差,指观测值与真实值、统计量与参数之间的差异。可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误 差的大小通常恒定,具有明确的方向性。随机测量误差,是偶然机遇所致,误差没有固定的大小和方向抽样误差,是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。5概率概率,是描述某事件发生可能性大小的量度。必然事件,事件肯定发生,概率P(U)=1;随机事件,事件可能发生,可能不发生,概率介于0 WP(

4、A)W 1;不可能事件,事件肯定不发生,概率P3)=0;小概率事件,事件发生的可能性很小,概率P(A)W 0.05、或P(A)W 0.01。医学科研中,P(A) W0.05作为事物差异有统计意义,P(A)W0.01作为事物差异有高度统计意义。第二章定量数据的统计描述 定量数据的统计描述方法:频数表、直方图、统计指标。 1频数分布频数分布的目的:了解数据的分布X围、集中位置以与分布形态等特征,以便根据资料分 布情况选择适宜的统计方法。频数分布的用途: 作为陈述资料的形式; 便于观察数据的分布类型; 便于发现数据中特大或特小的可疑值; 当样本量大时,可用各组段的频率作为概率的估计值。计算全距ran

5、ge, R:是一组数据的最大值与最小值之差。R = Max-Min 确定组数与组距样本量在100例左右,组数选择815之间,一般取10组左右。组距全距/组数确定组限第一组段必须包括最小值,最后一组段必须包括最大值。 最后一组段包括最大值,且一般情况下应包含该组段上限,其余各组段区间左闭右开。计算各组段频数frequency:即计算各组段内观察值的个数。计算各组段频率percent:即计算各组段频数与总观察值个数之比,用百分数表示。计算累计频数cumulativefrequency和累计频率cumulativepercent:累计频数是由上至下将频数累加;累计频率是由上至下将频率累加。2直方图

6、直方图,是以垂直条段代表频数分布的一种图形。3频数分布表的用途1、作为称述资料的形式,可以代替原始资料,便于进一步分析。2、便于观察数据的分布类型。资料分布类型分为:对称分布和偏态分布。在统计分析时常需要根据资料的分布形式选择相应的统计分析方法,因此对数据分布形式 的判定非常重要。3、便于发现资料中某些远离群体的特大或特小值。4、当样本含量比拟大时,可用各组段的频率作为概率的估计值。集中趋势的统计指标 平均数,是描述一组观察值集中位置或平均水平的统计指标,常作为一组数据的代表值用 于分析和进展组间的比拟。常用的有算术均数、几何均数、中位数、百分位数等。 算术均数,等于一个变量所有观察值的和除以

7、观察值个数。 总体均数用希腊字母U表示,样本均数用符号X拔表示。算术均数适用于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据。 算术均数易受极端值的影响,并且受极大值的影响大于受极小值的影响。几何均数 几何均数geometric mean, G,等于一个变量所有n个观察值的乘积的n次方根。 几何均数适用于取对数后近似呈对称分布的资料,尤其是右偏态分布数据。医学研究中常 用于比例数据。【注】计算几何均数的观察值不能小于或等于0,因为无法求对数。中位数中位数median,M,是在按大小顺序排列的变量的所有观察值中,位于正中间的一个 或两个数值。当数据呈偏态分布、或频数分布两端无确

8、定数值,均宜采用中位数描述集中趋势。 中位数确实定取决于它在数据序列中的位置,因此对极端值不敏感。百分位数百分位数percentile,是一个位置指标,它将一组变量值排列后划分为假如干相等局 部的分割点数值。用Px表示,X用百分数表示。表示在按照升序排列的数据中,其左侧WPx的观察值个数在整个样本中所占百分比为X%,其右侧$Px的观察值个数在整个样本中所占百分比为(100X )%。百分位数不论资料分布类型均可计算,在实际工作中常用于确定医学参考值X围;在假设 检验中用作拒绝或不拒绝检验假设的界值。百分位数并非由全部观察值综合计算得来,因此,它不如均数和标准差准确;然而中间局 部的百分位数因不受

9、资料中个别极端数据的影响,具有较好的稳定性。小结指标意义适用场合均数个体的平均值对称分布,特别是正态分布资料。几何均数平均倍数取对数后对称分布。中位数位次居中的观察值非对称分布;半定量资料; 末端无确切数值;分布不明。变异程度的统计指标变异指标,又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。 变异指标越大,观察值之间差异愈大,说明变异程度越大;反之亦然。 常用的有极差、四分位数间距、方差、标准差和变异系数。极差极差range, R,等于一个变量所有观察值中最大值与最小值之间的差值。R =Max Min缺点: 没有利用观察值的全部信息,不能反映其它数据的离散度; 各样本含量大小悬

10、殊时,不宜比拟其极差; 极差的抽样误差也较大,所以不够稳定。 极差仅适用于对未知分布的小样本资料作粗略的分析。四分位数间距四分位数,是统计学对特殊的三个百分位数P25%、P50%和P75%的统称四分位数间距quartile range,Q,等于第三四分位数与第一四分位数之间的差值。Q = P75% P25%缺点: 没有利用观察值的全部信息,不能反映其它数据的离散度; 四分位数间距仅用来描述大样本偏态资料的变异情况。方差方差variance,是描述一个变量的所有观察值与总体均数的平均离散程度的指标。 总体方差用。2表示,样本方差用S2表示。标准差标准差standarddeviation, S,是

11、描述一个变量的所有观察值与均数的平均离散程度的指标。总体标准差用。表示,样本标准差用S表示。标准差方差或标准差属同类变异指标,它们多用来描述均匀分布或近似正态分布的资料,大、小 样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中 常用X拔土S的形式表达资料。变异系数变异系数coefficient of variation, CV,是一个度量相对离散程度的指标。CV 是无量纲的指标,可以用来比拟几个量纲不同的指标变量之间的离散程度的差异,或比 拟量纲一样但均数相差悬殊的变量之间的离散程度的差异。小结指标意义适用场合极差观察值的取值X围不拘分布形式,概略分析。四分位数

12、间距居中半数观察值的极差非对称分布;半定量资料; 末端无确切数值;分布不明。标准差方 差观察值距离均数的平均程度对称分布,特别是正态分布资料。变异系数变异程度大小的比照 不同量纲的变量间比拟; 量纲一样但数量级相差悬殊的变 量间比拟。第三章正态分布与医学参考值X围 正态分布,是一种连续型随机变量常见而重要的分布。 正态曲线,是一条顶峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交 的钟型曲线。如果随机变量X的分布服从概率密度函数和概率分布函数称连续型随机变量X服从正态分 布,记为 XN(U,)。n为圆周率,e为自然对数的底值,。为总体标准差,U为总体均数。正态分布的特征1、正态分布

13、是单峰分布,以X二U为中心,左右完全对称,正态曲线以X轴为渐近线,两端与X轴不相交。2、正态曲线在X二|1处有最大值,其值为 f(|d)=1/(uJ2n) ; X越远离|d ,f(X)值越小,在X二|da处有拐点,呈现钟形。3、正态分布完全由参数u和。决定。U是位置参数,决定正态曲线在X轴上的位置。在定时,U增大,曲线沿横轴向右移动;U较小,曲线沿横轴向左移动。是形状参数,决定正态曲线的分布形态。越大,曲线的形状越“矮胖,表示数据分 布越分散;。越小,曲线的形状越“瘦高,表示数据分布越集中。正态曲线下面积分布规律1、服从正态分布的随机变量在某区间上的曲线下面积与其在同区间上取值的概率相等。2、

14、曲线下的总面积为1 或 100%,以为中心左右两侧面积各占 50%,越靠近处曲线下面积越大,两边逐渐减少。3、所有的正态曲线,在左右的任意个标准差X围内面积一样。一些特殊情况,在HaX围内的面积约为68.27%,在naX围内的面积约为95.00%, 在naX围内的面积约为99.00%。标准正态分布对任意一个服从N (|1, 02 )分布的随机变量X,经Z=X-|i/Q变换都可以转为|!二0、0二1的标准正态分布,也称随机变量的标准化变换。标准正态分布的应用实际应用中,经z变换可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分 布曲线下相应面积的问题。正态分布的应用1、制定医学参考值X围

15、2、质量控制3、正态分布是很多统计方法的理论根底医学参考值X围医学参考值X围,指正常人的解剖、生理、生化、免疫与组织代谢产物的含量等各种数据 的波动X围。医学参考值X围,习惯上是包含95%的参照总体的X围。制订的须知事项a、抽取足够例数的同质“正常人样本 “正常人的定义,样本量n120,随机化。b、确定具有实际意义的统一测量标准指标的测量方法等要有规定,控制测量误差。c、根据指标的性质确定是否要分组根据实际情况、专业知识。d、根据指标含义决定单、双侧X围 单侧下限,过低异常;单侧上限,过高异常;双侧,过高、过低均异常。e、选择适当的百分X围绝大多数人,一般80%、90%、95%、99%;减少误诊,取较大X围;减少漏诊,取

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号