6467编号医学统计学 第三版 复习总结

上传人:玩*** 文档编号:145331920 上传时间:2020-09-19 格式:PDF 页数:26 大小:593.56KB
返回 下载 相关 举报
6467编号医学统计学 第三版 复习总结_第1页
第1页 / 共26页
6467编号医学统计学 第三版 复习总结_第2页
第2页 / 共26页
6467编号医学统计学 第三版 复习总结_第3页
第3页 / 共26页
6467编号医学统计学 第三版 复习总结_第4页
第4页 / 共26页
6467编号医学统计学 第三版 复习总结_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《6467编号医学统计学 第三版 复习总结》由会员分享,可在线阅读,更多相关《6467编号医学统计学 第三版 复习总结(26页珍藏版)》请在金锄头文库上搜索。

1、第一章 绪论 统计的三大特征:实用性、丰富性、公平性 总体总体(population):(population): 是根据研究目的确定的、同质的全部研究对象中所有观察单位某种变量值的集合。是根据研究目的确定的、同质的全部研究对象中所有观察单位某种变量值的集合。 同质基础:时间、空间、条件等同质基础:时间、空间、条件等 (1)有限总体(finite population):有限观察单位(1)有限总体(finite population):有限观察单位 (2)无限总体(infinite population):很多为无限总体。(2)无限总体(infinite population):很多为无限总体

2、。 样本样本 根据随机化原则从总体中抽取的一定数量(sample size)的个体,称为样本 (sample) ,用样本信息来推断总体特征。 根据随机化原则从总体中抽取的一定数量(sample size)的个体,称为样本 (sample) ,用样本信息来推断总体特征。 从总体中抽取部分个体的过程称为抽样(sampling)。从总体中抽取部分个体的过程称为抽样(sampling)。 同质同质(homogeneity)(homogeneity) 是指影响被研究指标的非实验因素相同。是指影响被研究指标的非实验因素相同。 变异变异(variation, variablility )(variation

3、, variablility ) 同质基础上的各观察单位(亦称为个体)之间的差异为变异。如同性别、同年龄、 同民族、同地区儿童的身高有高有低,称为身高的变异。 同质基础上的各观察单位(亦称为个体)之间的差异为变异。如同性别、同年龄、 同民族、同地区儿童的身高有高有低,称为身高的变异。 参数(parameter)和统计量(statistic)参数(parameter)和统计量(statistic) 总体的统计指标称为参数。总体的统计指标称为参数。 如:总体均数(),总体发病率,总体死亡率,等,如:总体均数(),总体发病率,总体死亡率,等, 样本的统计指标称为统计量样本的统计指标称为统计量 如:样

4、本均数(x),样本发病率,样本死亡率,等,如:样本均数(x),样本发病率,样本死亡率,等, 统计学上用不同的符号表示。统计学上用不同的符号表示。 误差(error) 误差(error) 观察值与实际值的差异,成为误差。观察值与实际值的差异,成为误差。 分为:过失误差;系统误差;随机测量误差;随机抽样误差;分为:过失误差;系统误差;随机测量误差;随机抽样误差; (1)(1)过失误差过失误差(mistaken error):过失所致的误差(不认真,错误判断,记录等原因) ;(mistaken error):过失所致的误差(不认真,错误判断,记录等原因) ; (2)(2)系统误差系统误差(syste

5、matic error):仪器未校准所致的误差(统一偏高,或偏低) ;(systematic error):仪器未校准所致的误差(统一偏高,或偏低) ; 这两类误差可以避免。这两类误差可以避免。 (3)(3)随机测量误差随机测量误差(random measurement error):不同观察者或同一观察者多次观察值的(random measurement error):不同观察者或同一观察者多次观察值的 不相同。不相同。 这种误差不可避免。 这种误差不可避免。 (4)(4)抽样误差抽样误差(sampling error):总体中存在个体变异,抽样研究中所抽取的样本,只包(sampling e

6、rror):总体中存在个体变异,抽样研究中所抽取的样本,只包 含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率) ,表现为 多次抽样的样本均数或率不同。这种由抽样引起的差异称为 含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率) ,表现为 多次抽样的样本均数或率不同。这种由抽样引起的差异称为抽样误差抽样误差。 抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 由于生物的个体变异是客观存在的,因而抽样误差是由于生物的个体变异是客观存在的,因而抽样误差是不可避免不可避免的,但抽样误差有的,但

7、抽样误差有 一定的规律性。一定的规律性。 小概率事件定理:小概率事件定理: “小概率事件一次抽样不可能发生” “小概率事件一次抽样不可能发生” 变量及变量值变量及变量值 变量(variable):观察对象的特征或指标。对变量进行取值所采用的工具或标准成变量(variable):观察对象的特征或指标。对变量进行取值所采用的工具或标准成 为测量尺度(scale)。为测量尺度(scale)。 测量的结果称为变量值(value of variable) 或观察值(observed value, 测量的结果称为变量值(value of variable) 或观察值(observed value, mea

8、surements)。measurements)。 随机化随机化(randomization)(randomization) 使总体中的每个个体有均等的机会成为样本观察单位的过程,称为随机化。使总体中的每个个体有均等的机会成为样本观察单位的过程,称为随机化。 随机抽样旨在避免人的主观性,让机遇起作用,以反映总体的客观情况。随机抽样旨在避免人的主观性,让机遇起作用,以反映总体的客观情况。 常用:抽签法,随机数目表法,计算器随机数法;常用:抽签法,随机数目表法,计算器随机数法; 单纯随机抽样(simple random sampling):总体全部观察单位编号,再用随机数字法或单纯随机抽样(sim

9、ple random sampling):总体全部观察单位编号,再用随机数字法或 抽签法;抽签法; 整群抽样 cluster sampling:直接由若干个群组成的总体中随机抽取若干个群, 再对被整群抽样 cluster sampling:直接由若干个群组成的总体中随机抽取若干个群, 再对被 抽取的每个群的全部观察单位加以调查。抽取的每个群的全部观察单位加以调查。 系统抽样 systematic sampling:( 间隔抽样,机械抽样)系统抽样 systematic sampling:( 间隔抽样,机械抽样) 先将总体观察单位按某顺序号分成 n 个部分,再从第一部分抽第 k 号观察单位,依次

10、用此 相等间隔机械地从每一部分各抽一个观察单位组成样本。 先将总体观察单位按某顺序号分成 n 个部分,再从第一部分抽第 k 号观察单位,依次用此 相等间隔机械地从每一部分各抽一个观察单位组成样本。 分层抽样 stratified sampling:先按某种特征将总体分为若干组别、类型、区域,再分层抽样 stratified sampling:先按某种特征将总体分为若干组别、类型、区域,再 从每一层内随机抽样,组成样本。从每一层内随机抽样,组成样本。 抽样误差:分层抽样系统抽样单纯随机抽样整群抽样抽样误差:分层抽样系统抽样单纯随机抽样整群抽样 第二章 统计资料的收集和整理第二章 统计资料的收集和

11、整理 一、资料的类型一、资料的类型 根据是否定量划分:根据是否定量划分: (1)(1)计量资料计量资料(measurement data)(measurement data) 用定量方法测量每个观察单位的某项指标,所得的数值资料为计量资料,亦称数值用定量方法测量每个观察单位的某项指标,所得的数值资料为计量资料,亦称数值 变量资料。一般有度量衡单位。变量资料。一般有度量衡单位。 常用:平均数,标准差,t 检验,方差分析,相关与回归 等分析。常用:平均数,标准差,t 检验,方差分析,相关与回归 等分析。 (2)(2)计数资料计数资料(enumeration data)(enumeration da

12、ta) 将观察单位按某种属性或类别分组,然后清点各组的观察单位数,为计数资料(亦将观察单位按某种属性或类别分组,然后清点各组的观察单位数,为计数资料(亦 称分类变量资料,无序分类资料) 。称分类变量资料,无序分类资料) 。 常用:率、构成比、卡方检验等常用:率、构成比、卡方检验等 (3)(3)等级资料等级资料 (ranked data) (ranked data) 将观察单位按某种属性的不同程度分组,所得各组的观察单位数为等级资料,亦称 将观察单位按某种属性的不同程度分组,所得各组的观察单位数为等级资料,亦称 有序分类资料。有序分类资料。 常用:率、构成比、秩和检验等。常用:率、构成比、秩和检

13、验等。 三者联系:三者联系: 等级资料与计数资料不同:属性的分组有程度差别,各组大小顺序排列;等级资料与计数资料不同:属性的分组有程度差别,各组大小顺序排列; 等级资料与计量资料不同:每个观察单位未确切定量,称为半定量资料。等级资料与计量资料不同:每个观察单位未确切定量,称为半定量资料。 介于计量资料与计数资料之间。介于计量资料与计数资料之间。 计量资料 计数资料 等级资料计量资料 计数资料 等级资料 调查设计和实验设计调查设计和实验设计 调查设计一般包括专业设计和统计设计。调查设计一般包括专业设计和统计设计。 实验设计(experiment design)实验设计(experiment de

14、sign) 医学医学实验的基本要素实验的基本要素包括处理因素、受试对象和实验效应三部分。包括处理因素、受试对象和实验效应三部分。 实验设计应实验设计应遵循遵循对照(空白对照,试验对照,安慰剂对照,配对对照,组间对照对照(空白对照,试验对照,安慰剂对照,配对对照,组间对照 ) 、随机、重复(即样本例数)的) 、随机、重复(即样本例数)的原则 原则 。 频数分布表(frequency distribution table)频数分布表(frequency distribution table) 用途用途: (1)揭示频数的分布特征:两个重要特征:(1)揭示频数的分布特征:两个重要特征: 集中趋势(c

15、entral tendency):数值高低不等,但中等水平的人数最多。集中趋势(central tendency):数值高低不等,但中等水平的人数最多。 离散趋势(tendency of dispersion):数值之间参差不齐 ; 逐渐变大(或变小)的人离散趋势(tendency of dispersion):数值之间参差不齐 ; 逐渐变大(或变小)的人 数渐少。向两端分散。数渐少。向两端分散。 第三章 计量资料的统计描述 集中趋势集中趋势 central tendencycentral tendency 平均数平均数(average):用于描述数值变量资料的集中趋势(平均水平) 。(ave

16、rage):用于描述数值变量资料的集中趋势(平均水平) 。 特点:简明概括,便于比较。特点:简明概括,便于比较。 包括包括:算术平均数,几何平均数,中位数,百分位数:算术平均数,几何平均数,中位数,百分位数 1、1、算术平均数算术平均数(arithmetic mean)(arithmetic mean) 一组变量值之和除以变量值个数所得的商,简称均数。一组变量值之和除以变量值个数所得的商,简称均数。 总体均数 ,样本均数 x 表示。总体均数 ,样本均数 x 表示。 适用条件:资料成正态分布(或近似正态,或对称分布) 。适用条件:资料成正态分布(或近似正态,或对称分布) 。 计算方法:直接法,加权法计算方法:直接法,加权法 均数的两个重要属性:均数的两个重要属性: (1)各离均差(各观察值与均数之差)的总和等于零。(1)各离均差(各观察值与均数之差)的总和等于零。 (2)离均差的平方和小于各个观察值 X 与任何数 a(a 不等于均数)之差的平方和。(2)离均差的平方和小于各个观察值 X 与任何数 a(a 不等于均数)之差的平方

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号