统计学课件之绪论及统计描述

上传人:团**** 文档编号:154762239 上传时间:2020-12-07 格式:PPT 页数:40 大小:801KB
返回 下载 相关 举报
统计学课件之绪论及统计描述_第1页
第1页 / 共40页
统计学课件之绪论及统计描述_第2页
第2页 / 共40页
统计学课件之绪论及统计描述_第3页
第3页 / 共40页
统计学课件之绪论及统计描述_第4页
第4页 / 共40页
统计学课件之绪论及统计描述_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《统计学课件之绪论及统计描述》由会员分享,可在线阅读,更多相关《统计学课件之绪论及统计描述(40页珍藏版)》请在金锄头文库上搜索。

1、医学统计学,Medical Statistics,绪 论,统计学(Statistics)的定义 A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data. Webster International Dictionary 关于数据收集、整理、表达、分析与推断的普遍原理和方法。,统计学的发展史 源远流长 统计学的应用领域 日趋广泛,医学统计学(Medical Statistics ),定义: 运用统计学的基本原理和方法(以数理统计学为主

2、)研究医学领域中的生物医学问题的一门学科。 类型应用型学科 显著特征: 描述不确定现象 揭示不确定现象背后隐藏的统计学规律,六个基本概念(1),同质与变异(Homogeneity and Variation) 同质受研究个体的某些相同的因素情况。 变异同质个体的某些研究因素情况存在差异。 总体与样本(Population and Sample) 总体根据研究目的所确定的同质的观察单位的测量 值或观察指标取值的全体。 样本从总体中随机抽取的一部分有代表性的个体或 观察单位的测量值。,六个基本概念(2),参数与统计量(Parameter and Statistic) 参数根据总体的个体值统计计算出

3、的、描述有规律 分布的总体的特征量。 统计量根据样本个体值统计计算出的、描述样本的 特征量。 误差(Error) 定义实际观测值与观察指标的真值之差。 分类系统误差(Systematic error) 随机误差(Random error)包括重复测量误差 与抽样误差(Sampling error)。,六个基本概念(3),概率(Probability) 概率描述或度量某一随机事件发生的可能性大小。 小概率事件:P0.05 资料类型(Types of data) 定量变量(numerical variable) 定性变量(categorical variable) 有序变量(ranked vari

4、able) 三种资料之间的相互转换,医学统计工作的步骤,科研设计(Design of study) 包括专业设计和统计设计两方面。 资料收集(Collection of data) 准确、及时、完整三原则 资料整理(Classification of data) 系统化、条理化 资料分析(Analysis of data) 包括统计描述(Descriptive Statistics)和统计推断(Inferential Statistics)两方面。,学习的方式方法,理解性地掌握医学统计学的基本原理和方法 能举一反三,灵活应用,统 计 描 述,定量变量的统计描述(一),频数分布表的编制 步 骤

5、用 途,确定全距R R = Xmax - Xmin 确定组数与组距 i = R / 组数 确定各组段的上限U与下限L LXU 划记频数,列出频数表 由(分组信息+各组频数信息+该组频率信息+累计频数信息+累计频率信息)五部分组成 绘制相应的频数分布图,定量变量的统计描述(二),集中趋势的描述 常用指标1.2.3 适用范围1.2.3,定量变量的统计描述(三),离散趋势的描述 常用指标1.2.3 适用范围1.2.3,算术平均数(Mean),组中值,算术平均数(Mean),适用于对称分布 尤其适用于正态分布或近似正态分布资料 特性 离均差之和为0 离均差平方和最小,几何均数( Geometric m

6、ean ),几何均数( Geometric mean ),适用于偏态分布资料 尤其适用于数据呈倍数变化关系的资料以及符合对数正态分布资料 最常见于血清学滴度、抗体效价、人口增长、发展速度等资料,中位数( Median ),奇数,偶数,百分位数,中位数,中位数( Median ),适用于任何分布类型的资料 符合正态分布的资料其均数等于中位数 符合对数正态分布的资料其几何均数等于中位数 其他分布的资料只能用中位数进行描述 排序问题 确定包含中位数或百分位数的本组所在,全距与四分位间距( Range and Inter-quartile range),R=Xmax Xmin,Q= P75 P25,全

7、距与四分位间距( Range and Inter-quartile range),计算简单方便 任何分布类型的资料均可使用 具有不稳定性、不全面性 作为参考指标 后者常与中位数配套,用于偏态分布资料,方差与标准差(Variance and Standard deviation),方差与标准差(Variance and Standard deviation),适用于对称分布的资料 尤其适用于正态分布与近似正态分布的资料 自由度 具有全面性 集中趋势与离散趋势的综合分析,变异系数( Coefficient of variation ),变异系数( Coefficient of variation

8、),为一相对指标 适用于两种不同的资料 观察指标的单位不同的资料 均数相差过大的两组资料,定性变量的统计描述,常用指标1.2 注意事项,率(Rate) K比例基数 比较 发病率与患病率 死亡率与病死率,比(Ratio),相对比 构成比 趋势比 定基比、上升比、下降比、 环比、平均发展速度与平均 变化速度等指标,注意事项,分母足够大 构成比不能代替率 合并率 可比性问题 率的标准化(Standardization),率的标准化(Standardization method),定义 若比较的两组或多组率当其内部构成不同时,需要统一的“标准”进行调整,使之具备可比性,称“指标标化法”。 方法 直接法

9、 间接法 注意事项,直接法标准化率 已知标准组年龄别人口数 已知标准组年龄别人口构成比 间接法标准化率,表 甲、乙两地各年龄组人口数及死亡率,Populations and Samples,We want to know about these:,We have this to work with:,Random Selection,Inference,Parameter,Statistic,Population,Sample,(Population mean),(Sample mean),Population,Sample,Sample 1,Sample 2,Sample n,The fir

10、st story: “a survey about who those speedy drivers are.” 67 males: 110 109 90 140 105 150 120 110 110 90 115 95 145 140 110 105 85 95 100 115 124 95 100 125 140 85 120 115 105 125 102 85 120 85 120 110 120 115 94 125 80 85 60 120 92 130 125 110 90 110 110 95 95 110 105 80 100 110 130 105 105 120 90

11、100 105 55 120 88 females: 80 75 83 80 100 100 90 75 95 85 90 90 120 85 100 120 75 85 80 70 85 110 85 75 110 105 120 130 115 86 70 70 85 80 100 75 100 105 110 102 87 90 70 50 110 80 90 105 120 80 100 135 105 78 90 75 95 130 78 100 95 90 105 110 85 97 85 100 130 140 97 98 100 105 110 70 125 90 95 110

12、 90 95 80 110 120 140 75 88,The second story: “The debate about whether Aspirin reduces heart attack rates or not.” 1. The results of a five-year randomized experiment conducted using 22,071 male doctors between the age of 40 and 84. 2. There are two groups in the experiment. One group took an ordin

13、ary Aspirin tablet every other day, while the other group took a placebo. 3. The observation results is that taking Aspirin actually caused the lower rate of heart attacks for that group. 4. Whether was the results reasonable or not? Whether did the conclusion have broader value or not?,Examples,There is 130 heights of 14 years old girls (unit: cm). Please calculate P25, P75, P95, and median of the sample:,( P25=139.00cm),( P75=147.04cm),( M=142.77cm),( P95=154.80cm),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 统计学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号