{经营管理知识}统计学的基本概念及其工作步骤

上传人:精****库 文档编号:141153387 上传时间:2020-08-04 格式:PPTX 页数:43 大小:357.72KB
返回 下载 相关 举报
{经营管理知识}统计学的基本概念及其工作步骤_第1页
第1页 / 共43页
{经营管理知识}统计学的基本概念及其工作步骤_第2页
第2页 / 共43页
{经营管理知识}统计学的基本概念及其工作步骤_第3页
第3页 / 共43页
{经营管理知识}统计学的基本概念及其工作步骤_第4页
第4页 / 共43页
{经营管理知识}统计学的基本概念及其工作步骤_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《{经营管理知识}统计学的基本概念及其工作步骤》由会员分享,可在线阅读,更多相关《{经营管理知识}统计学的基本概念及其工作步骤(43页珍藏版)》请在金锄头文库上搜索。

1、本资料来源,第一章 绪论,卫生统计学教研室刘洪庆 Email: Tel:13583625690,学习目标,1、掌握统计学基本知识、基本技能、基本概念、基本方法。建立逻辑思维方法和提高分析问题的能力。 2、掌握统计工作的基本步骤。具有收集、整理、分析统计资料的系统工作能力。 3、掌握统计研究资料的类型及相互转化。,一、卫生统计思维进化与概念,概念 StatisticsA science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data” “The

2、science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results” (A Dictionary of Epidemiology),统计学:是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 卫生统计学:是一门应用统计学方法和原理研究卫生服务数据的收集、分析、解释和表达的学科。,统计学的发展简史,卫生统计思维进化与概念,1948年,英国

3、发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。 1948年,郭祖超教授(19121999)编著的医学与生物统计方法,是我国第一部医学统计方法的教科书。 统计软件实现; SAS and SPSS,统计学与公共卫生的关系,统计学是得力工具: 统计设计:抽样、样本量、统计方法等 统计描述:群体事件的分布特征 统计推断:找危险因素、评价效果、决策等 历史成就:John Graunt 、William Farr(寿命表);John Snow (霍乱发生原因); Doll 和Hill (吸烟与肺癌),现代公共卫生对统计学的挑战 疾病谱的变化需要新的统计方法

4、: 为了研究非感染性疾病的流行,人们发展了多因素分析、生存分析、疾病自然史的模型等现代统计方法 学科交叉结合需要新的统计学方法: 如:人群药物代谢动力学与现代统计学几个分支的交叉结合,包括广义线性混合效应模型、非线性混合效应模型、等级和经验Bayes方法等 遗传流行病学需要遗传统计学方法;生物信息海量数据库的统计分析;卫生经济与决策的统计学方法。,学点统计学,迎接新挑战 New England J.Medicine British Medical J. Lancet 70% 国内优秀的医学杂志 多数 应用的统计学知识 70%为基本理论和经典统计方法,较少部分为复杂的、新发展的统计理论和技术,但

5、出现错误最多的就是前一部分,某疾病某年各季度病人分布情况,急性中毒后合并感染组与非感染组之间的比较,卫生统计学的主要内容,统计学基本原理和方法 包括资料的收集、整理和分析的基本原理和方法。 医学研究设计 包括观察性研究中的现场调查、病例对照研究和队列研究设计,实验研究中的临床试验、动物实验及实验室研究设计等。 统计学的应用 包括医学人口统计、生命统计及疾病监测与控制中常用的综合评价方法。,卫生统计学包括,健康统计,卫生服务统计,医学人口统计 疾病统计 生长发育统计,卫生资源利用 医疗卫生服务需求 医疗保健体制改革,二、统计学的基本概念,总体与样本 同质与变异 随机变量与研究资料的类型 医学研究

6、中常用的测量尺度 参数与统计量 误差 频率与概率,总体、样本与个体,总体(population) 根据研究目的所确定的性质相同的所有观察单位的某种变量值的集合。 如:调查某地1999年正常成年男子的红细胞数,则观察对象是该地1999年正常成年男子,总体就是该地1999年正常成年男子的血红细胞数。,根据总体中观察单位数是否已知,分为: 有限总体: 有确定的时间、空间和有限个观察单位, 无限总体:没有确定的时间、空间限制,观察单位数为无限。 个体(individual):可以是一个人、一个动物、一个家庭、一个地区、一份样品等,是科学研究的基本观察单位。,样本(sample) 从总体中随机抽取的部分

7、观察单位的某个变量的测量值所组成的集合。 随机抽样(sampling) 目的是用样本信息来推断总体特征,因此要保证样本的可靠性和代表性,使样本能够充分地反映总体的真实情况。这就要求抽样要遵守随机化的原则,并保证足够的样本含量。 随机抽样是保证总体中每一个观察单位均有同等机会被抽取。 样本含量: 指样本中所包含的观察单位数。,同质(homogeneity),总体中的个体具有相同的性质称为同质性,它是进行统计分析的前提。 统计分析是在一定数量的观察单位的基础上进行的,这一定数量的观察单位在研究的主要方面必须具有相同的性质。 比如,研究某地高血压病人的生活质量,研究对象必须是同质的,即都是同一地区的

8、高血压病人。 如果不能满足同质的要求,那么研究资料就是杂乱无章的,便不能得出有用的信息和结论。,同质是相对的,研究对象只是在某一方面是性质相同的,同类的观察对象之间往往也存在着变异。 比如,同一地区、同一年龄的男童的身高并非完全相同,而是千差万别、参差不齐的,这种参差不齐的情况就是变异。 因个体差异引起的现象称为变异(variation) 与同质的相对性不同,变异是绝对的、客观存在的,变异是生物界的基本特点,也是生物界随机现象的根本原因,统计学就是通过对变异的研究来探讨生物随机现象内在规律的一门科学。, 变量与随机变量,变量是指我们观察或测量到的每个观察单位的特征或指标,对观察单位的各个变量的

9、观察结果称为变量值或观察值,因为测量不同的观察单位会得到不同的观察结果,所以称之为变量。 变异是生物个体的共有特征,反映了生物个体的不确定性。在测量观察单位的变量值之前,只知道变量值所在的可能范围,并不知道其具体取值情况,比如只知道8岁男童的身高可能在50-150厘米的范围内,但不能确定某个男童的具体身高,正是因为变量的这种不确定性,概率论中将其称为随机变量。,参数和统计量,在科研工作中,通过对样本中的观察单位的变量值进行统计分析所得到的统计指标称为统计量。如:样本均数、样本回归系数、样本标准差、样本率等。 参数是反映总体特征的统计指标,如果样本的代表性好,那么统计量与相应的参数的数值非常接近

10、,就可以用样本统计量来估计总体参数,所以样本的统计量也称为参数的估计值,例如用样本均数、样本回归系数和样本率来估计总体均数、总体回归系数和总体率。, 误差,统计学研究中,将观察值(实际值)与真实值(理论值)之差称之为误差,由于生物个体的变异性等原因使得误差在医学领域中广泛存在。 误差按其产生的原因和性质可分为: 过失误差 系统误差 随机误差 不同的误差应采取不同的方法进行处理。,1. 过失误差,过失误差是由于观察者的错误造成的误差,比如观察者有意或无意的记录错误,计算错误,数据核查、录入错误,度量衡单位错误,甚至故意修改数据导致的错误。 过失误差在统计学研究中是不允许的,必须通过加强调查、录入

11、和分析人员的责任心,完善检查核对制度等方法来避免和消除过失误差,以保证数据和结果的真实性。,2. 系统误差,系统误差是由于设计人员、受试者、观察者、研究者、仪器设备、研究方法及外部环境的非实验因素等原因的影响造成的有一定的变化规律的误差。 总的来说,系统误差的产生原因复杂,而且不能通过适当的统计方法来消除,所以对研究结果的影响很大。 但是系统误差一般是恒向、恒量的,且有其特定的变化规律,故可以通过严格、科学的实验设计将其减小或控制在最小范围之内。,3. 随机误差,随机误差是排除过失误差、系统误差之后尚存在的误差,它由多种无法控制的因素引起的,大小和方向是随机变化的。 尽管随机误差是不可避免的,

12、但其以零为中心呈正态分布,所以可以利用概率统计学的方法对随机误差进行估计。 随机误差包括抽样误差和随机测量误差两类。,抽样误差是在随机抽样研究中,由于抽样而引起的样本统计量和总体参数之间的差异。抽样误差的大小主要取决于个体之间变异程度的大小和样本含量的多少,变异程度越大,样本含量越小,抽样误差就越大;反之亦然。 随机测量误差指在同一条件下对同一观察单位的同一指标进行重复测量所产生的误差。由于医学技术水平的限制,随机测量误差目前也是无法避免的,只能尽量提高仪器设备的准确性和精密性来控制随机测量误差在容许的范围之内。, 频率与概率,频率:某单位配蜂刺脱敏药,陆续试用于被蜂刺的患者,共计200人,其

13、中180人用药后症状减轻。有效率 80/200=0.90或90%。 这个数字是从反复实验与实际观察得来的。那么对于另一个接受此治疗的病人,预计脱敏得可能性约为90。就是说若有蜂刺患者10人使脱敏药,预计约9人可能有效。比值180/200是频率。 用数学语言来表示,在n次随机试验中,随机事件A发生k次,记fn(A)=k/n,则称fn(A)为随机事件A在n次试验中出现的频率。,实践证明,当实验次数n逐渐增多时,fn(A)在一个常数附近摆动。摆动的幅度随着n的增大将愈来愈小,而逐渐稳定下来。这个常数是客观存在的,称为事件A的概率,记作P(A),概率表示随机事件发生可能性的大小。 频率稳定性是定义事件

14、的概率的客观基础,它揭示了隐藏在随机现象中的规律性,这种规律性就是通常所说的统计规律性。 实际应用中,常用n时的频率作为概率的估计值。,随机事件概率的大小在0 与1 之间。 P 值越接近1,表示某事件发生的可能性越大, P 值越接近0,表示某事件发生的可能性越小。 P=1,表示事件必然发生, P=0,表示事件不可能发生, 他们是确定性的,不是随机事件,但可把他们看成随机事件的特例。 统计分析中的很多结论都是带有概率性的。 习惯上将 P0.05,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。,三、统计工作的基本步骤,1、研究设计(design)资料的收集、整

15、理和分析的全过程进行总的设想和安排 2. (collection of data)采取措施取得准确可靠的原始数据 要求:准确、及时 来源 (1)统计报表 (2)经常性工作记录 (3)专题调查或实验,3、整理资料(sorting of data)净化原始数据,利于计算和分析 4、分析资料(analysis of data)计算指标,反映特征,揭示规律 统计描述(descriptive statistics)利用统计指标、统计图表等,对资料的数量特征及其分布规律进行测定和描述 统计推断(inferential statistics)包括如何抽样,以及如何由样本信息推断总体特征,四、研究资料的类型,

16、定量变量、数值变量计量资料 定性变量、分类变量计数资料,1. 定量变量/计量资料/数值变量资料,定量变量是用仪器、工具或其它定量方法进行测定或衡量所取得的数据。 其变量值是定量的,表现为大小不等的数值,可以由区间尺度、比数尺度测得。 定量变量一般带有度量衡单位,如身高(cm)、体重(kg)、白细胞计数(109/L)、血压(kPa)、龋齿个数等。 由一组同质的定量变量所组成的资料称为计量资料,计量资料的各个观察值之间有量的区别,没有性质的不同。,2. 定性变量/计数资料/分类变量资料,其变量值是定性的,表现为无不相容的类别或属性,一般由名义尺度测得。 定性变量的属性指标的分类是无序的,这是定性变量与顺序变量的区别所在。 由同质的定性变量组成的资料称为计数资料,计数资料是按照事物的属性分组,然后清点各组的观察单位个数得到的资料,各观察单位之间一般没有量的区别,但有质的不同。 计数资料的变量值只能代表事物的某些属性或分类,不能反映程度上的差别。,定性变量的分类,如果变量只有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号