研究生医学统计学绪论-资料收集和整理

上传人:第*** 文档编号:49881114 上传时间:2018-08-04 格式:PPT 页数:88 大小:895KB
返回 下载 相关 举报
研究生医学统计学绪论-资料收集和整理_第1页
第1页 / 共88页
研究生医学统计学绪论-资料收集和整理_第2页
第2页 / 共88页
研究生医学统计学绪论-资料收集和整理_第3页
第3页 / 共88页
研究生医学统计学绪论-资料收集和整理_第4页
第4页 / 共88页
研究生医学统计学绪论-资料收集和整理_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《研究生医学统计学绪论-资料收集和整理》由会员分享,可在线阅读,更多相关《研究生医学统计学绪论-资料收集和整理(88页珍藏版)》请在金锄头文库上搜索。

1、医用统计方法 Medical Statistics张建军 汕大医学院预防医学教研室 Tel: 0754-88900445 Email: 第一节第一节 绪论绪论北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱, 甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为 94.4% 别的医院,其他大夫使用“乌贝散”来治疗胃 溃疡病出血,其有效率也一定是94.4%吗?求 置信区间北京某医院有位老大夫,用“冠心灵”治疗冠心病 ,其对照组用西药,观察结果如下表:表1-1 冠心灵与单纯西药疗效对比显 效 有 效 无 效 合计 单纯西药 9 25 6 40冠 心

2、灵 19 18 5 42冠心灵是否比单纯西药有效?假设检验 (test of significance),俗称要算值。l 统计有三大特性,用三句话予以简单的概括 : l实用性:除了实情,数据能证明一切。 l丰富性:方法多样,发展之中。 l公平性:我们相信上帝,其它人请用数据说 话。 一、统计学的重要性Importance定义:统计学(Statistics)是研究数据搜集、 整理与分析的科学,是认识社会和自然现 象数量特征的重要工具。医用统计学(Medical Statistics):运用概率 论和数理统计的原理,方法,结合医学实 际,研究数字资料的搜集,整理,分析, 推断的一门学科。数学统计学

3、医学数理统计学医用统计学医用数学医学统计学是交叉学科数据的重要性:对事物本质的理解-科学性(具体/量化);对偶然、众多现象的分析-数据的规律性;医学的发展-数据的依赖性(标准/诊断准确 率);比如:现象间的关系:相关-因果? 统计模型(Statistical Model)的建立-现象之 间的数量关系;Y=-17.3618+0.2219X (直线回归方程)Y: 体重(g);X:大白鼠进食量(g)利用大白鼠进食量推测体重增加情况 还可以研究多因素对某一因素的影响统计结论的正确取决于:实验设计,资料搜 集,数据管理等; 统计学的应用意义(Application):Vaccinated groupIn

4、fection rate 20%Unvaccinated groupInfection rate 10%e.g. Evaluation on a new vaccineHow can we conclude?1. Really effective? or By chance? Methods are needed to differentiate these two situations.2. Any bias in vaccinated people? e.g. age, nutrition, or social class. A suitable design can exclude th

5、e bias.统计学发展迅速统计学离不开计算工具的进步: 计算机,软件的发展; SPSS (Statistics Package for Social Science)-Statistical Product and Service Solutions, SAS, Stata, PEMS (Package for Encyclopedia of Medical Statistics)二、统计学研究的对象objects1、有变异(variation)的事物l变异来源各种各样;是客观存在的;统计必 须在一定数量的观察基础上进行。l随机事件(Random event):一次试验结果 不确定,在一定数

6、量重复条件下呈现出规律性 。2、同质(homogeneity)的事物 研究的事物性质基本相同;避免将风马牛不 相及的事物作统计分析; (3 mules+2 donkeys)/5=? l1、总体(population):l是根据研究目的确定的、同质的全部研究对 象中所有观察单位某种变量值的集合。l同质基础:时间、空间、条件等l(1)有限总体(finite population):有限观察 单位l(2)无限总体(infinite population):很多为 无限总体。三、几个基本概念basic conceptsl如研究某地2003年健康成年男性的身高(cm), 则该地2003年全部健康成年男子

7、的身高构成一个总 体。该总体只包括有限个观察单位,称为有限总体 。l有时总体是设想的,是抽象的。l例如:研究用某药治疗冠心病患者的疗效,其总体 的同质基础是同用该药治疗的冠心病患者,而总体 为设想用该药治疗的所有冠心病患者的治疗结果, 这里没有确定的时间和空间范围的限制,因而观察 单位数无限,称为无限总体。l2、样本l根据随机化原则从总体中抽取的一定数量( sample size)的个体,称为样本(sample), 用样本信息来推断总体特征。l从总体中抽取部分个体的过程称为抽样(sampling)。l抽样必须遵循随机化原则,即要使总体中每 一个体有同等的机会被抽取,这样的样本对 总体有较好的代

8、表性,能根据其统计量推断 总体特征。l(随机化,足够样本含量使样本具有代表性)l样本的可靠性:l总体确定后,使样本中的每个观察单位确属预先 确定的同质总体。l如:正确诊断,正确分期;规定动物的种属、原 始体重,控制非实验因素等;l抽样的必要性:l无限总体;l有限总体:人力、财力、不可能性、不必要性 ( 高血压病人等)。l3、同质l同质(homogeneity)是指影响被研究指标的非实验 因素相同。l有些影响因素往往是难以控制的、甚至是未知的, 如遗传、营养、心理等。l实际中只有相对的同质,即影响被研究指标较大的 、可以控制的主要因素尽可能相同。如研究儿童的 身高,则要求影响身高这一指标较大的、

9、易控制的 因素如性别、年龄、民族、地区要相同,而不能控 制的因素,如遗传、营养等影响因素可以略去。l4、变异(variation, variablility )l同质基础上的各观察单位(亦称为个体)之间的差 异为变异。如同性别、同年龄、同民族、同地区儿 童的身高有高有低,称为身高的变异。l统计学是研究变异的科学。没有变异就不需要统计 学。l在医学研究中,这种变异表现在人与人之间的差异 。l虽然有时我们感兴趣的是变异本身,但更多时候我 们试图找出隐藏在变异背后的规律性。l5、参数(parameter)和统计量(statistic)l总体的统计指标称为参数。l如:总体均数(),总体发病率,总体死亡

10、率 ,等,l样本的统计指标称为统计量l如:样本均数(x),样本发病率,样本死亡率, 等,l统计学上用不同的符号表示。l6、误差(error) l观察值与实际值的差异,成为误差。l分为:过失误差;系统误差;随机测量误差;随机抽 样误差;(1)过失误差(mistaken error):过失所致的误差(不 认真,错误判断,记录等原因);(2)系统误差(systematic error):仪器未校准所致的 误差(统一偏高,或偏低);l这两类误差可以避免。(3)随机测量误差(random measurement error):不同观察者或同一观察者多次观察值的不相同。这种误差不可避免。 那么,抽样误差又

11、怎样呢?(4)抽样误差(sampling error):总体中存在个体变异,抽样研究中所抽取的样本, 只包含总体中一部分个体,因而样本均数(或率) 往往不等于总体均数(或率),表现为多次抽样的 样本均数或率不同。这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之 ,其精确度愈低。由于生物的个体变异是客观存在的,因而抽样误差是 不可避免的,但抽样误差有一定的规律性。l7、概率(probability)几率,或然率 l概率是反映某一事件发生的可能性大小的量,常用 符号P表示。lThe probability of an event is the events long

12、 run relative frequency(相对频率) in repeated trials under similar conditions. It can be any value from 0 to 1.l绝对事件(absolute event):概率等于1或0。l随机事件(random event): 概率在0和1之间。ProbabilityProbability(概率)(概率)Event A, occurs B times in C trials, the ratio B /C is called the probability of A. P(A) = B /C lP0.05和

13、P0.01分别表示事件发生的可能性等 于或小于0.05和0.01。l习惯上把P0.05或0.01的事件称为小概率事件 ,表示某事件发生的可能性很小。l“小概率事件一次抽样不可能发生” 小概率事件定理P=1P=0P=0.5Random EventAbsolute EventAbsolute Eventl8、变量及变量值l变量(variable):观察对象的特征或指标。对变量进 行取值所采用的工具或标准成为测量尺度(scale)。l测量的结果称为变量值(value of variable) 或观察值 (observed value, measurements)。l如健康成年男性的血压值:某个人是观

14、察单位,血 压是变量,千帕是测量尺度,千帕数值为观察值。l也可以将变量定性:性别,职业,等。Sample 100Sampling Parameters Statistics Population 50000 With relatively same features(homogeneity ) but still varied among all(variation)Observed unit with Probability Representative(random, size)Inferencel9、随机化(randomization)l使总体中的每个个体有均等的机会成为样本观察单 位的

15、过程,称为随机化。l医学研究从总体中抽出一定数量的样本进行研究, 得出规律,推及总体。为使样本代表总体,必须缩 小抽样误差。l随机抽样旨在避免人的主观性,让机遇起作用,以 反映总体的客观情况。l随机不是随便(free and easy, casual)或随意(ad libitum)。l常用:抽签法,随机数目表法,计算器随机数法;单纯随机抽样(简单随机抽样)最简单、最基本的抽样方法从总体N个对象中,利用抽签或其他随机方法抽取n个总体中每个对象被抽到的概率相等Simple random sampling系统抽样(机械抽样)按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。将总体各个个体单位按

16、某种标志排列、连续编号根据总体数N和确定的样本数n,计算抽样距离(N/n)用单纯随机方法在第一组中确定一个起始号从此起始点开始,每隔K(K=N/n)个单位抽取一个作为研究对象Systemic sampling系统抽样示意图分层抽样将总体单位按某种特征分为若干次级(层),然后从每一层内 单纯随机抽样组成一个样本。分类按比例分配(proportional allocation)分层随机抽样各层内抽样比例相同最优分配(optimum allocation) 分层随机抽样各层抽样比例不同,内部变异小的层抽样比例小,内部 变异大的层抽样比例大 Stratified sampling整群抽样将总体分成若干群组,抽取其中部分群组作为观察 单位组成样本 分类单纯整群抽样(S

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号