医学统计学(点睛之笔很经典)

上传人:xzh****18 文档编号:44578790 上传时间:2018-06-14 格式:PDF 页数:6 大小:196.19KB
返回 下载 相关 举报
医学统计学(点睛之笔很经典)_第1页
第1页 / 共6页
医学统计学(点睛之笔很经典)_第2页
第2页 / 共6页
医学统计学(点睛之笔很经典)_第3页
第3页 / 共6页
医学统计学(点睛之笔很经典)_第4页
第4页 / 共6页
医学统计学(点睛之笔很经典)_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《医学统计学(点睛之笔很经典)》由会员分享,可在线阅读,更多相关《医学统计学(点睛之笔很经典)(6页珍藏版)》请在金锄头文库上搜索。

1、医学统计学 重点 (2005 级 六年制)copyright vivian.cat1Chapter1 基本概念基本概念显著性检验显著性检验(test of significance) :计算 P 值医学统计工作的内容:医学统计工作的内容:1、实验设计:最关键最重要2、收集资料:最基础 原始资料:实验数据 现场调查资料 医疗卫生工作记录 报表 报告卡质量控制精度和偏倚3、整理资料 (1)资料的逻辑检查(坏数) (2)一致性检查 (3)原始数据加工:频数分布表4、分析资料:统计描述(表、图、离散趋势、 集中趋势)和统计推断统计描述类型的选择:统计描述类型的选择:集中趋势离散趋势对称、正态,xSSS

2、,对数正态GS lgX偏态及其他MQ,R单位不同或均数差别大CV医学统计的医学统计的资料类型资料类型:计量资料、计数资料、等 级分组资料医学统计学的对象:医学统计学的对象:有变异的事物总体和样本:总体和样本:总体(总体(populationpopulation)的特性:)的特性:同质性、大量性、 差异性。抽样的要求抽样的要求:代表性、随机性、可靠性、可比性。样本的三性:样本的三性:代表性、随机性、可靠性。可靠性可靠性(reliabilityreliability) :实验的结果要具有可重复 性。即由科研课题的样本得出的结论所推测总体的结 论有较大的可信度。两样本间具有:两样本间具有:可比性。误

3、差的类别:误差的类别:1 1、系统误差系统误差(system error) :在资料的收集过 程中,由于仪器初始状态没有调零、标准试剂未经矫 正、标准指定偏高或偏低等原因,造成的观察结果的 倾向性的偏大或偏小。必须克服。2 2、 随机测量误差随机测量误差( random measurement error) : 在避免系统误差的情况下,由于各种偶然因素的影响 造成对同一对象多次测量值的不一致。3 3、抽样误差、抽样误差(sampling error) :由于抽样造成 的的样本统计量与总体参数之间的差别。不可避免。 样本含量越大,抽样误差越小。如均数的抽样误差:|-X|。小概率事件小概率事件:

4、P0.05 (有统计学意义) 或 P0.01 (有高度统计学意义) 。Chapter 2 集中趋势的统计描述集中趋势的统计描述手工整理资料频数表手工整理资料频数表(frequency table)的步骤的步骤: 1、求极差(全距) 2、确定组数、组距 参考组距=全距 / 组数 3、确定组段 4、手工编制划记表直方图(直方图(histogramhistogram) :高度:各组的频数 纵轴宽度:组距 横轴表示组限均数(均数(averageaverage) :适用:对称分布或偏度不大的资料,尤其适合正 态分布。抽样总体样本参数统计量推断医学统计学 重点 (2005 级 六年制)copyright

5、vivian.cat21、算术均数(mean) :nXX2、加权均数:nXfX3、几何均数:nXlg lgG1,nM1Xlg flgG中位数中位数 (medianmedian) : 观察值按照从小到大排列时, 居中心位置的数值。适用于 1、分布明显成偏态时,2、频数分布的一 端或两端无确切数值时。不便于统计计算。iffn5.0LMML M)(M:中位数;LM:M 所在组的上限;fL:M 所在 组之前积累的频数;fM:M 所在组的频数;i:组距。百分位数(百分位数(percentilepercentile) :Px。在一组中找到这 样一个数值 P,全部观察值的 x%小于 P。P75、P25描 述

6、资料离散程度。iffx%nLPxL xX)(众数众数:一组观察值中,出现频率最高的那个观察 值。若为分组资料,则为频率最高组的组中值。适用 于大样本,但粗糙。Chapter 3 离散程度的统计描述离散程度的统计描述离散的表述指标:离散的表述指标:1、按间距计算:极差、四分位数间距2、按平均差距:离均差平方和、方差、标准差、 变异系数极差极差(rangerange,R R) :即全距。粗略。适用于任何 分布。四分位数间距四分位数间距(quartilequartile,Q Q) :一组观察值按大小排序后,分成四个数目相等的段落,每个段落观察 值的数目占总例数的 25%。 去掉两端含有极端数值的 2

7、5%,取中间的 50%的观察值的数据范围即为。越大则数据变异越大。适用于偏态分布。Q=P75- P25离均差平方和离均差平方和( sumsum ofof squaresquare ofof deviationdeviation) :nXXX-XSS2 22)()(方差(方差(variancevariance) :样本方差1-nX-XSSS22)( 总体方差NX-XSSS22)( 标准差(标准差(standardstandard deviationsdeviations) :SSSS2适用于近似正态分布。p.s.1、可用于合并资料的直接计算2、与均数结合可以完整概括一个正态分布。变异系数(变异系

8、数(CVCV) :用于均属相差交大或单位不同 的几组数据观察值的比较。CV=%100XS正态分布(正态分布(normalnormal distributiondistribution) :1、正偏态分布:高峰向左,长尾向右负偏态分布:高峰向右,长尾向左。2、和是正态分布总体的两个参数,对应样本 统计量中的 S 和 X。实际应用中和通常未知,可以 将 S 和 X 作为总体参数的估计量使用。医学统计学 重点 (2005 级 六年制)copyright vivian.cat3注意对比:1-nX-XS2)(N-X2)(2、是位置参数,是变异参数。描述方法:N(,2)3、曲线下面积的意义:X1X2出现的

9、概率。68.3%1.96 (单侧1.645)95%2.58(单侧2.33)99%标准正态分布标准正态分布(standardstandard) :是=0,=1 的正 态分布。对于任何参数为、的正态分布,都可以通过变量变换转化成标准正态分布:-xu 。医学参考值范围(医学参考值范围(referencereference valuevalue rangerange)的的 制定方法:制定方法:1、选择足够数量的正常人作为参照样本2、对选定的参照样本进行准确的测定3、决定取单侧范围还是双侧范围值4、选择适当的百分范围5、估计参考值范围的界限Chapter 4 抽样误差与可信区间抽样误差与可信区间中心极限

10、定理:中心极限定理:在样本含量很大的情况下(n 50) ,无论样本测量量(X)服从什么分布,样本均数X的抽样分布都近似服从以为均数的正态分布 N(,2/n)标准误(标准误(standardstandard errorerror) :样本均数X之间变异的标准差。nX实际工作中总体标准差 未知, ,用样本的标准差 S 代替:nSSX标准差与标准误的区别:标准差与标准误的区别:标准差标准误含义描述观察值的变异程 度的大小的指标描述样本均数的抽样 误差大小的指标公式1-nX-XSSSS22)(nX(nSSX)意义标准差较小, 表示观察 值围绕均数波动较小,说明样本均数代表性 好小,表明样本均数围绕 总

11、体均数的波动较小,说明样本均数可靠性 好应用1、表示观察值变异程 度2、结合样本均数描述 正态分布资料特征, 确 定医学参考值范围3、计算标准误4、计算 CV1、估计样本均数抽样 可靠程度2、估计总体均数的可 信区间3、进行假设检验n趋于稳定()逐渐减小标准误(公式)的意义:标准误(公式)的意义:1、与标准差的联系:在样本含量一定的情况下, 标准误与标准差成正比。(1)当观察值的变异(标准差)较小时,样本均数 之间的抽样误差较小,抽到的样本均数与总体均属可能相差较小,用X估计的可靠性较好医学统计学 重点 (2005 级 六年制)copyright vivian.cat4(2)当观察值的变异较大

12、时,样本均数之间的抽样 误差较大,抽到的样本均数与总体均属可能相差较大,用X估计的可靠性较差。2、与样本含量的关系:与其平方根成反比,说 明在同一总体中随机抽样,样本含量越大,标准误越 小。3、标准误反映了样本均数间的离散程度,也反 映了样本均数与总体均数的差异。参数估计参数估计(parameterparameter estimationestimation) :指偶那个 过样本参数估计总体参数,是统计推断的重要内容之 一。常用方法有点估计、区间估计。点估计点估计(pointpoint ) :使用单一数值直接作为总体 参数的估计值。适用于各种资料。区间估计(区间估计(intervalinter

13、val ) :按照预先给定的概率 计算出一个区间,使它能够包含总体参数。给定的概 率(1-)称为可信度。计算得到的区间称为可信区可信区 间(间(confidenceconfidence intervalinterval,CICI)可信区间通常包括两个数值界定的可信限 (confidence limit) ,分别为上限、下限。总体均数估计的 95%可信区间表示:该区间有 95%的概率包含总体均数。注意不可以说“总体均 数有 95%的概率落在这个区间里” 。可信区间估计效果的比较:可信区间估计效果的比较:1、 (1-)越接近 1 越好,概率2、区间宽度越窄越好,精确度但两者是矛盾的。一般选择(1-

14、)=95%。t t 分布(分布(t t distributiondistribution) :是以 0 为中心的对称 分布;当时,t 分布的极限分布就是标准正态分布。在正态分布的总体中进行抽样,n/S-x服从自由度1n 的 t 分布。t 的大小与、自由度有关。可信区间的计算:可信区间的计算:XS,2/tX(,)XS,2/tX若 n50,则 t 分布接近标准正态分布,则简化XS2/uX(,)XS2/uX若已知,则可简化为X2/uX(,)X2/uX96.1u05.0,58.2u01.0Chapter 5 假设检验假设检验假设检验(假设检验(hypothesishypothesis testtest

15、) :目的:比较总体参数有无差别基本思想:首先对所需比较的总体提出一个无差 别的假设,然后通过样本数据推断是否拒绝这一假 设。基本方法:反证法和小概率事件。基本步骤:基本步骤:1、建立假设和确定检验水准无效假设( null hypothesis):H0: =0( 或d=0) , 总体均数无差别。备择假设( alternative ) :H0: 0( 或d0) , 总体均数有差别假设有单侧和双侧两种。应用单侧检验一定要有 过硬的专业知识。一般选用双侧检验,因为双侧检验 得出有显著差别的结论,单侧检验结论也一定是显著 差别;然而反之不亦然。检验水准亦称显著性水准(significance level) , 用表示,是预先设定的拒绝域的概率值。一般取 0.05。2、选择检验方法和计算检验统计量t来自正态分布(或近似)的小样本(n,样本数据差异不显著,无统计学意义, 根据现有样本不足以拒绝 H0(不等于接受 H0) 。单样本的单样本的 t t 检验:检验:条件:,X,S,n1、H0:=0,=0.05,双侧检验2、t=n/S-x,1n 3、,2/t配对样本配对样本 t t 检验:检验:条件:n,指标 1、指标 2(d,d,d2)1、H0:d=0,=0.052、t=nSnd/d Sdd3、

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号