《医用统计学复习资料全统计学》由会员分享,可在线阅读,更多相关《医用统计学复习资料全统计学(6页珍藏版)》请在金锄头文库上搜索。
1、参考范围2)质量控制图,常以x2s作为上、下警戒值以x3其取值是定性的,一般无度量衡单位。表现为互不相容的类别或属性体参数可能存在的范围(称“可信区间”或“置信区间”)的估计方用合计的数据来计算(4)比较相对数时应注意资料的可比性(5)立身以立学为先,立学以读书为本一、名解1.小概率原理:一个事件如果发生的概率很小的话, 那么它在一次试验中是几乎不会发生的, 称之为小概率原理。统计学中,一般认为等于或小于 0.05 或 0.01 的概率为小概率。 2.小概率事件:习惯上将 p0.05 或 p0.01 的事件。 3.同质:是针对被研究的指标来讲,其影响因素相同,简单的理解,同质就是指对研究指标
2、影响较大的可控的主要因素。同质基础上的个体差异称为变异。 4.抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得统计 标准量与相应的标准参数往往是不同的,这种差异称为抽样误差。 5.假设检验第一类错误/第二类错误:如果实际情况与 H0 一致,仅仅由于抽样的原因,使得 统计量观察值落到拒绝域,拒绝原本正确的 H0,导致推断结论错误,这样的错误称为第一 类错误。如果实际情况与 H0 不一致, 也仅仅是抽样的原因使得统计量的观察值落到接受域, 不能拒绝原本错误的 H0,则导致了另一种推断错误,这样的错误称为第二类错误。 6.检验效能 :1-称为假设检验的功效,当所研究的总体与
3、 H0 确有差别时,按检验水准 能够发现它(拒绝 H0)的概率。7.四分位数间距 :表示百分位数 P75 和百分位数 P25 之差, 定义为Q=P75-P25 8.变异系数( cv):cv 主要用于量纲不同的变量间或均数差别较大的变量间变异程度的比较。 9.均数的标准误:样本均数的标准差, 通常称为均数的标准误, 用于反应均数抽样误差的大 小。10.总体参数的可信区间:从总体中做随机抽样, 每个样本可以算得一个置信区间。按预先 给定的概率( 1- )估计总体参数的可能范围,该范围就称为总体参数的 1-置信区间。 11.相关系数:又称 pearson 积矩相关系数, 是定量描述两个变量间线性关系
4、密切程度和相关 方向的统计指标。12.最小二乘法原理:残差 ei=Yi-(a+bXi )yI ,求 a 与 b 的适宜值, 能使所有残差平方和为 最小, 则称这一对 a 和 b 为与的最小二乘估计。13.回归系数Y/X= +X,其中, Y 为个体的因变量值, 为回归直线的截距参数, 为 回归直线的斜率参数, 又称回归系数。14.标准正态分布 :均数为 0、标准差为 1 的正态分布被称为标准正态分布( standard normal distribution ),通常记为 N(0,1 ) 15.总体:就是根据研究目的确定的同质观察单位的总体。 确切的说是同质的所有观察单位 某种变量值的集合。 1
5、6.样本:从总体中随机抽取部分观察单位,其变量值的集合;样本中所包含个体数称为样本 含量。17.非参数检验:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断, 故又称为任意检验。18.均数的标准误:样本均数的标准差, 通常称为均数的标准误(SEM 或 SE ),可以反应均 数抽样误差的大小。 19.完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解 2 选 1)完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way) 设计。 它是将受试对象按随机化的方法分配到各个处理组中, 观察实验效应, 临床试验中的 随机对照试验也属于此类设计
6、。配对设计: 是将受试对象按一定条件配对成对子,再随机分配每对中的两个受试对象到不同 处理组。配对的因素是影响实验效应的主要非处理因素。20.定量资料 :定量变量也称计量变量或数值变量,是通过度量衡的方法,测定每一个观察 单位的某项研究指标的量的大小得到的资料。其取值是定量的, 表现为数值大小。 按取值的(层)然后再从每一层内进行单纯随机抽样,组成一个样本的统计学0)的概率。7.四分位数间距:表示百分位数P75和百分位数P规定的界限,是相对的。差别有统计学意义时,是指无效假设h0被则6.相关分析,秩和检验的应用条件7.统计表由标题,标目,线FL立身以立学为先,立学以读书为本不同可分为离散型变量
7、和连续性变量两种。前者如儿童龋齿数、胎次等,后者如身高、 体重 等。 21.定性资料:定性变量也称计数变量或分类变量,是将全体观测单位按照某种性质或特征 分组, 然后再分别清点各组观察单位的个数所获得的资料。 其取值是定性的, 一般无度量衡 单位。表现为互不相容的类别或属性,有两种情况:无序分类和有序分类。 22.标准误:抽样误差具有一定的规律性,可以用特定的指标来描述,标准误除了反映样本 统计量之间的离散程度外,也反映样本统计量与相应总体参数之间的差异,即抽样误差大小。 23.区间估计:指按一定的概率估计未知的总体参数可能存在的范围(称“可信区间”或 “置 信区间”) 的估计方法。24.分层
8、抽样:先将总体的单位按某种特征分为若干次级总体(层) 然后再从每一层内进行单 纯随机抽样,组成一个样本的统计学计算方法。25.概率: 频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性, 因 而是可以被认识和度量的。 这个常数 p 就被称为事件 A 出现的概率, 记住 P(A)或 P。这 一定义称为概率的统计定义。它是事件 A 发生的可能性大小的一个度量。26.双盲法:这种实验方法用于防止研究结果被安慰剂效应或者观察者偏爱影响,是一种更 加严格的实验方法,通常适用于以人为研究对象的实验。二、填空1.每种检验方法的应用条件: t 检验的应用条件: a 随机样本 b 来自正态分布总
9、体 c 方差齐性 方差分析的应用条件: a 相互独立的随机样本 b 来自于正态分布总体 c 方差齐性 2.统计学的描述指标,描述集中趋势的统计指标: 算数均数, 几何均数, 中位数。描述离散 趋势的统计指标: 极差, 四分位数间距,方差,标准差,变异系数。几何均数的应用:( 1)几何均数用于对于对数正态分布资料或呈倍数关系的等比资料等(2) 观察值不能为零或同时出现正负值(3)同组资料 G 单纯随机抽样系统抽样分层抽样11.卡方检验的用途: 推断两个或多个样本率及构成比之间有无差别, 检验分类变量配对设 计下的卡方检验,以及频数分布的拟合优度检验等。12常用的相对数: 比,构成比,率三、单选四
10、:简答1.频数分布表制作过程:连续型定量变量频数分布表的制作过程: 1)计算极差(R),也称将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验2.最小二乘法原理:残差ei=Yi-(a+bXi)yI,求a标准量与相应的标准参数往往是不同的,这种差异称为抽样误差。5都为入2.poisson分布的观察结果有可加性11.非参数适立身以立学为先,立学以读书为本全距,即数据最大值与最小值之差。 2 )确定组段数与组距,组段数一般取 10 左右,组距 =R/预计组段数。 3 )确定各组段的上下限,组段的起点为下限,终点为上限。 4 )列表用途: 1 )揭示资料的分布类型和分布特征 2)描述分布的集
11、中趋势和离散趋势 3 )便于发现 某些特大或特小的可以值 4 )便于进一步计算指标和统计分析 2.医学参考值范围制定及注意:医学参考范围:指特定的“正常”人群(排除了对所研究的 指标有影响的疾病和有关因素的特定人群) 的解剖、 生理、 生化指标及组织代谢产物含量等 数据中大多数个体(一般为 95% )取值所在的范围。针对某医学指标 X ,确定 X 的医学参考值范围的原则:1)制定“正常”人群的入选标准2 )确定样本量大小,在符合入选标准的人群中随机抽样3 )对样本中的每个个体进行指标测量4 )确定是否要分组制定参考值范围5)根据该指标 X 的背景意义,确定参考值的范围是双侧还是单侧6)根据样本
12、资料的分布情况确定采用正态分布法还是百分位数法方法:1)百分位数法,适合于任何分布类型的资料。2 )正态分布法: 适合于正态分布资料或近似正态分布资料。假设检验的步骤 :1)建立检验假设,确定检验水准 2)选择方法并计算统计量 3 )确定 p 值,作出推断结论3.假设检验时注意的事项要有严密的抽样研究设计; 样本必须是从同质总体中随机抽取的; 要保证组间的均衡型和 资料的可比性。 根据现有的资料的性质、设计类型、 样本含量大小正确选用假设检验方法。如两样本变量均数(均数)的比较常用 t 检验,分类资料比较常用 X2 检验,而同为数值变 量资料, 配对设计与完全随机设计比较的 t 检验也不相同,若用完全随机设计的 t 检验处理 配对资料, 不但浪费信息,还可能得出错误结论。结论不能绝对化, 因检验水准只是人为规定的界限, 是相对的。 差别有统计学意义时,是 指无效假设 h0 被接受的可能性只有 5%或不到 5%,甚至不到 1%,根据小概率事件一次不 可能拒 h0,但尚不能排除有 5%或 1%出现的可能,所以可能产生第一类错误;同样,若不 拒绝 h0,可能产生第二类错误。 正确理解“差异有无统计学意义”。统计学上差别显著与否,与实际意义是有区别的。 如 应用某药治疗高血压,平均降低舒张压 0.5kPa,并