《医学统计学_总结_重点_笔记_复习资料》由会员分享,可在线阅读,更多相关《医学统计学_总结_重点_笔记_复习资料(13页珍藏版)》请在金锄头文库上搜索。
1、第一章第一章 2 2 选选 1 1 总体:总体:总体(总体(populationpopulation)是)是根据研究目的确定的同质观察单位(研究对象)的全体,根据研究目的确定的同质观察单位(研究对象)的全体, 实际上是某一变量值的集合实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识。可分为有限总体和无限总体。总体中的所有单位都能够标识 者为有限总体,反之为无限总体。者为有限总体,反之为无限总体。 总体总体populationpopulation根据研究目的而确定的同质观察单位的全体。根据研究目的而确定的同质观察单位的全体。 样本:样本:从总体中随机抽取部分观察单位
2、,其测量结果的集合称为样本(从总体中随机抽取部分观察单位,其测量结果的集合称为样本(samplesample)。样)。样 本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本样本samplesample从总体中随机抽得的部分观察单位,其实测值的集合。从总体中随机抽得的部分观察单位,其实测值的集合。 3 3 选选 1 1 小概率事件:我们把概率很接近于小概率事件:我们把概率很接近于 0 0(即在大量(即在大量重复试验重复试验中出现的频率非常低)的事中出现的频率非常低)的事 件称为小概率事件。件称为小概率事件。
3、P P 值:值:P P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法检验方法所所 得到的得到的 P P 值反应结果真实程度,一般以值反应结果真实程度,一般以 P P 0.050.05 认为有统计学意义,认为有统计学意义, P P 0.010.01 认为有认为有 高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于 0.050.05 或或 0.010.01。P P 值是:值是: 1)1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极
4、端情况的概率。一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。 2)2) 拒绝原假设的最小显著性水平。拒绝原假设的最小显著性水平。 3)3) 观察到的观察到的( (实例的实例的) ) 显著性水平。显著性水平。 4)4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是 不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一
5、不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一 般认为等于或小于般认为等于或小于 0.050.05 或或 0.010.01 的概率为小概率。的概率为小概率。 资料的类型(资料的类型(3 3 选选 1 1) (1 1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称 为计量资料(为计量资料(measurementmeasurement datadata)。计量资料亦称定量资料、测量资料。)。计量资料亦称定量资料、测量资料。. .其变量值是定量其变量值是定量 的,表现为数值大
6、小,一般有度量衡单位。如某一患者的身高(的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cmcm)、体重)、体重(kg)(kg)、红细胞、红细胞计数计数(10(101212/ /L L) )、脉搏(次、脉搏(次/ /分)、血压(分)、血压(KPaKPa)等。)等。 计量资料计量资料 measurementmeasurement datadata 定量资料定量资料 quantitativequantitative datadata 数值变量资料数值变量资料 numericalnumerical variablevariable 为观测每个观察单位某项指标的大小,而获得的资料。为观测每个观
7、察单位某项指标的大小,而获得的资料。 (2 2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (countcount datadata)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相 容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、 无效的人数;调查一批少数民族居民的无效的人数;调查一批少数民族居民的A A
8、、B B、ABAB、O O 四种血型的人数等。四种血型的人数等。 计量资料计量资料enumerationenumeration datadata定性资料定性资料qualitativequalitative datadata无序分类变量资料无序分类变量资料unorderedunordered categoricalcategorical variablevariable 名义变量资料名义变量资料nominalnominal variablevariable 为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而
9、得到的资料。 (3 3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(单位数,称为等级资料(ordinalordinal datadata)。等级资料又称有序变量。如患者的治疗结果可)。等级资料又称有序变量。如患者的治疗结果可 分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但 这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为这种差别却不能准确测量;一批肾病患者
10、尿蛋白含量的测定结果分为 + +、+、+等。等。等级资料等级资料rankedranked datadata半定量资料半定量资料semi-quantitativesemi-quantitative datadata有序分类变量有序分类变量ordinalordinal categoricalcategorical variablevariable资料资料 为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得 到的资料。到的资料。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。等
11、级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 两种误差(两种误差(2 2 选选 1 1) 抽样误差(抽样误差(samplingsampling errorerror )由于抽样而引起的总体指标)由于抽样而引起的总体指标( (参数参数) )与样本指标与样本指标( (统计数统计数) ) 之间的差异。抽样误差是由个体变异或其它随机因素造成的,是不可避免的,但误差分布之间的差异。抽样误差是由个体变异或其它随机因素造成的,是不可避免的,但误差分布 有
12、规律可循,可进行估计和分析。有规律可循,可进行估计和分析。 系统误差(系统误差(systematicsystematic errorerror):由于测量仪器结构本身的问题、刻度不准确或测量):由于测量仪器结构本身的问题、刻度不准确或测量 环境改变等原因环境改变等原因, ,在多次测量时所产生的在多次测量时所产生的, ,总是偏大或总是偏小的误差总是偏大或总是偏小的误差, ,称为系统误差。它带称为系统误差。它带 有规律性有规律性, ,经过校正和处理经过校正和处理, ,通常可以减少或消除。通常可以减少或消除。 统计的步骤(考填空题,四个空)统计的步骤(考填空题,四个空) 统计工作的步骤统计工作的步骤
13、 设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个 研究中最关键的一环,是今后工作应遵循的依据。研究中最关键的一环,是今后工作应遵循的依据。 收集资料:应采取措施使能取得准确可靠的原始数据。收集资料:应采取措施使能取得准确可靠的原始数据。 整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。 分析
14、资料包括统计描述和统计推断。分析资料包括统计描述和统计推断。 实验设计的基本原则实验设计的基本原则 (考填空题,三个空)(考填空题,三个空) 随机化原则、对照的原则、重复的原则。随机化原则、对照的原则、重复的原则。 2 2 选选 1 1 参数:参数()是指总体的统计指标,如总体均数、总体率等。参数:参数()是指总体的统计指标,如总体均数、总体率等。 总体参数总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表 性的样性的样 本,用算得的样本统计量估计未知的总体参数。本,用算得的样本统计量估
15、计未知的总体参数。 统计量:统计量()是指样本的统计指标,如样本均数、样本率统计量:统计量()是指样本的统计指标,如样本均数、样本率 等。样本等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动 的随机的随机 变量。变量。 第二章第二章 频数表的制作步骤以及频数分布表的用途(问答题)频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤:频数分布表的编制步骤: 例:某市例:某市19821982年年5050名名7 7岁男童的身高岁男童的身高(cm)(cm)资料如下,试编制频数表。资料如下,试编制频数表。 114.4114.4 117.2117.2 122.7122.7 124.0124.0 114.0114.0 110.8110.8 118.2118.2 116.7116.7 118.9118.9 118.1118.1 123.5123.5 118.3118.3 120.3120.3 116.2116.2 114.7114.7 119.7119.7 114.8114.8 119.6119.6 113.2113.2 120.0120.0 119.8119.8 116.8116.8 119.8119.8 122.5122.5 119.7119.7 120.712