统计学原理

上传人:xzh****18 文档编号:45455542 上传时间:2018-06-16 格式:PDF 页数:183 大小:880.77KB
返回 下载 相关 举报
统计学原理_第1页
第1页 / 共183页
统计学原理_第2页
第2页 / 共183页
统计学原理_第3页
第3页 / 共183页
统计学原理_第4页
第4页 / 共183页
统计学原理_第5页
第5页 / 共183页
点击查看更多>>
资源描述

《统计学原理》由会员分享,可在线阅读,更多相关《统计学原理(183页珍藏版)》请在金锄头文库上搜索。

1、统计学教程 第四军医大学 徐勇勇 第一章 绪 论 第二章 计量资料的统计描述 第三章 正态分布 目 录第四章 总体均数的估计和假设检验 第五章 方差分析 第六章 分类资料的统计描述第七章 二项分布与 Poisson 分布及其应用第八章 卡方检验 第九章 秩和检验 第十章 直线相关与回归第十一章 多元线性回归与logistic回归 第十二章 统计表与统计图第十三章 实验设计 第十四章 调查设计与资料分析第十五章 医学人口统计与疾病统计常用指标 第十六章 寿命表 第十七章 随访资料的生存分析 第十八章 常用综合评价方法 1 第一章 绪 论 一、教学大纲要求 (一)掌握内容 1几个基本概念 样本与总

2、体、频率与概率、资料类型、随机变量、误差。 2 统计工作的步骤 设计、收集资料、整理资料、分析资料。 (二)熟悉内容 医学统计学的含义、内容及其医学应用。 (三)了解内容 医学统计的历史发展。 二、教学内容精要 (一) 统计学、医学统计学、卫生统计学 统计学是研究数据的收集、整理、分析与推断的科学。 医学统计学是用统计学的原理和方法研究生物医学现象的一门学科。 卫生统计学则是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。 (二) 统计学中的几个基本概念 1随机变量 随机变量(random variable)指取值不能事先确定的观察结果,通常简称为变

3、量。随机变量有一个共同的特点是不能用一个常数来表示,而且理论上讲,每个变量的取值服从特定的概率分布。 随机变量可分为两种类型:离散型变量和连续型变量。 2 误差 误差(error)指实际观察值与观察真值之差、样本指标与总体指标之差。误差可分为系统误差和随机误差,两种误差的区别见表 1- 1。 表 1- 1 系统误差与随机误差的区别 误差分类 产生原因 对观察值的影响 处理方法 系统误差 仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等。 使观察值不是分散在真值的两侧, 而是有方向性、 系统性或周期性地偏离真值。 通过实验设计的完善和技术措施的改进来消除或减少。 随机误差 排除系统

4、误差后,其他多种不确定因素。 使观察值不按方向性、 系统性而随机的变化, 误差变量可通过统计处理估计随机误差。 2 一般服从正态分布。 3 资料类型 观察单位的某项特征的测量结果按其性质可分为三种类型: (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data) 。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小, 一般有度量衡单位。如某一患者的身高(cm) 、体重(kg)、红细胞计数(1012/L)、脉搏(次/分) 、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资

5、料(count data) 。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data) 。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、+、+等。 等级资料与计数资料不同:属性分组

6、有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 4 总体与样本 总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample) 。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 5 概率与频率 概率(probability)又称几率,是度量某一随机事件A 发生可能性大小的一个数值,记为 P(A) 。0P(A)1 。 在相同的条件下,独立重复做n 次试验, 事件

7、A 出现了m 次,则比值 m/n称为随机事件A在 n次试验中出现的频率(frequency) 。当试验重复很多次时P(A)= m/n。 (三)统计工作的步骤 1 设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。 2 收集资料:应采取措施使能取得准确可靠的原始数据。 3 整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4 分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。 (四)医学研究中统计方法的应用 医学统计方法在医学研究中的应用主要有三个方面: 1 以正确的方

8、式收集数据; 2 描述数据的统计特征; 3 统计分析得出正确结论。 3 (五)医学统计历史发展 最初的统计主要是数据汇总。统计发展到今天,已经成为一种对客观现象数量方面进行的调查研究活动,是收集、整理、分析、判断等认识活动的总称,数据汇总仅仅是统计工作的一小部分。医学统计的发展起源于生物统计、遗传统计,经过了描述统计、大样本统计、小样本统计推断、临床统计和多变量统计几个发展阶段。 三、典型试题分析 (一) 名词解释 抽样误差。 答案:抽样误差(sampling error)是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 评析 本

9、题考点:抽样误差的概念。 抽样误差是统计学中的重要概念。在抽样研究中是不可避免的。产生抽样误差的根本原因是生物个体间存在的变异性。 (二)单项选择题 1 统计学中所说的样本是指( ) 。 A随意抽取的总体中任意部分 B有意识的选择总体中的典型部分 C依照研究者要求选取总体中有意义的一部分 D依照随机原则抽取总体中有代表性的一部分 答案:D 评析 本题考点:统计学中样本概念的理解。 统计学中的样本是指从总体中随机抽取的部分观察单位测量值的集合。 这里的“随机抽取”并非通常所说的“随意抽取” ,而是保证总体中每个观察单位等概率被抽取的科学方法。随机抽样是样本具有代表性的保证。 2 下列资料属等级资

10、料的是( ) 。 A白细胞计数 B住院天数 C门急诊就诊人数 D病人的病情分级 答案: D 评析 本题考点:统计资料的分类。 统计资料按其性质可分为三种类型:计量资料、计数资料和等级资料。计量资料变量值是定量的,表现为数值大小,一般有度量衡单位,如本例中白细胞计数(109/ L) ,住院天数(天) 。计数资料其观察值是定性的,表现为互不相容的类别或属性的观察单位数,如门急诊就诊人数可按门诊、急诊分类清点各组人数。等级资料的属性分组有程度差别,各组按大小顺序排列,如病人的病情分级为轻、中、重。 (三)简答题 一位研究人员欲做一项实验研究,研究设计应包括那几方面的内容? 答案:一般来讲,研究设计应

11、包括两方面的设计:专业设计和统计设计。专业设计是针4 对专业问题进行的研究设计,如选题、形成假说、干预措施、实验对象、实验方法等;统计设计是针对统计数据收集进行的设计,如样本来源、样本量、干预措施的分配、统计设计类型测量指标的选择等。统计设计是统计分析的基础,任何设计上的缺陷,都不可能在统计分析阶段弥补和纠正。 评析 本题考点:研究设计包含的内容。 研究设计是整个研究中最关键的一环,是整个研究过程中始终遵循的依据。正确、严谨、周密的设计是研究工作顺利进行、研究结果真实可靠的保证。因此,应深刻理解并掌握研究设计的内容及其意义。 (四)是非题 描述不确定现象,通过重复观察,发现生物医学领域的不确定

12、现象背后隐藏的统计规律是医学统计的显著特征。 ( ) 答案:正确。 评析 本题考点:统计方法的特征。 在生物医学研究领域,由于存在较大的生物变异性,并受诸多因素的影响,使实验或观察结果往往成为不确定现象。在大量的重复试验中,这种不确定现象却呈现出明显的统计规律性。统计方法能够帮助人们分析数据,达到去伪存真、去粗存精,透过偶然现象认识其内在的规律性。这正是统计方法的显著特征。 四、习 题 (一) 名词解释 1 总体与样本 2 . 随机抽样 3 . 变异 4 . 等级资料 5 . 概率与频率 6 . 随机误差 7 . 系统误差 8 . 随机变量 9 参数 1 0 . 统计量 (二) 单项选择题 1

13、 观察单位为研究中的( )。 A样本 B. 全部对象 C影响因素 D. 个体 2 总体是由( ) 。 A个体组成 B. 研究对象组成 C同质个体组成 D. 研究指标组成 3 抽样的目的是( ) 。 A研究样本统计量 B. 由样本统计量推断总体参数 C研究典型案例研究误差 D. 研究总体统计量 4 参数是指( ) 。 A参与个体数 B. 总体的统计指标 C样本的统计指标 D. 样本的总和 5 关于随机抽样,下列那一项说法是正确的( ) 。 A抽样时应使得总体中的每一个个体都有同等的机会被抽取 5 B研究者在抽样时应精心挑选个体,以使样本更能代表总体 C随机抽样即随意抽取个体 D为确保样本具有更好

14、的代表性,样本量应越大越好 (三)是非题 1 研究人员测量了 1 0 0 例患者外周血的红细胞数,所得资料为计数资料。 2 统计分析包括统计描述和统计推断。 3 计量资料、计数资料和等级资料可根据分析需要相互转化。 (四)简答题 某年级甲班、乙班各有男生50 人。从两个班各抽取 10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什麽? 五、习题答题要点 (一) 名词解释 1总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中

15、的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample) 。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中) , 从总体中抽取部分观察单位的过程。 随机抽样是样本具有代表性的保证。 3 变异:在自然状态下,个体间测量结果的差异称为变异(variation) 。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4等级资料: 将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 5 概率:概率(probability)又称几率,是度量某一随机事件 A发生可能

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 计算机原理

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号