工作生活中常见的统计学问题

上传人:子 文档编号:43860648 上传时间:2018-06-07 格式:DOC 页数:71 大小:111.50KB
返回 下载 相关 举报
工作生活中常见的统计学问题_第1页
第1页 / 共71页
工作生活中常见的统计学问题_第2页
第2页 / 共71页
工作生活中常见的统计学问题_第3页
第3页 / 共71页
工作生活中常见的统计学问题_第4页
第4页 / 共71页
工作生活中常见的统计学问题_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《工作生活中常见的统计学问题》由会员分享,可在线阅读,更多相关《工作生活中常见的统计学问题(71页珍藏版)》请在金锄头文库上搜索。

1、工作生活中常见的统计学问题工作生活中常见的统计学问题工作生活中常见的统计学问题* 如何判断药物的疗效?(假设检验)* 奥运会后中国股市是否会大跌?(概率论)* 体育彩票能否中(大)奖?(概率论)* 子女为什么象父母,其强度有多大?(相关与回归)* 政治人物的支持度,民意测验(设计,抽样)* 一月份的 CPI(7.1) (相对数)* 不同民族智商测量、税收标准(均数)随访数 死于本病 中断随访第一年 1342 130 41第二年 1171 48 53第三年 1070 42 73第四年 955 56 48第五年 851 35问题:1、出院后第一年死亡率与以后几年和死亡率是否有差异?2、2 年和 3

2、 年的生存率是多少?3、中断随访的患者如何进行统计学分析?1、医学统计学定义:医学统计学是以医学理论为指导,运用数理统计学的原理和方法研究数据的搜集、整理、分析,从而掌握事物内在客观规律的一门学科。常见医学科研设计的几种类型(一)完全随机设计将受试对象随机分配到各个处理组或对照组中,或分别从不同总体中随机抽样进行研究。优点:简单;缺点:效率不高,需要较多的例数才能得到与其他设计相似的结果。医学研究中将配对计量资料也可分为:同源配对:同一对象处理前后的数据,同一样品用两种方法测定的结果。异源配对:将实验对象配成对子,对每一对子中的两个实验对象给予两种不同的处理,以推断两种处理的效果有无差别。配对

3、设计的优缺点优点:需用样本数量少,而效率比完全随机设计高;缺点:在实验的时间太长,受试者处理因素自身发生明显变化时,不能采用同源配对设计。如 0-3 岁儿童身高、体重等受时间因素影响较大。(三)随机区组设计(配伍组设计)配伍设计:将实验对象按某些特征或相似条件按 1:X 配成相应对子,来减少实验误差。分同源配伍和异源配伍。(1)同源配伍:即实验者自身实验前、后若干时间作对比。(2)异源配伍:例如将同窝、同性别、同年龄、同体重的动物配成伍,每配伍中一头列入实验组,其余列入对照组。优点:同配对设计。 缺点:同配对设计。矽肺患者经克矽平治疗 4 周血红蛋白含量 治疗后 编号 治疗前 1 周 2 周

4、3 周 4 周 1 9.9 11.3 12.7 13.2 14.5 2 8.9 12.3 11.7 14.4 15.5 3 10.9 11.0 13.1 14.0 14.9 : 资料整理包括:1、首先对原始数据进行核对和检查2、设计分组质量分组:将观察单位按其属性或类别归类分组。如性别、职业分类等。数量分组:将观察单位按数值大小进行分组。如年龄大小、血压高低等。3、按分组要求设计整理表,汇总资料。资料整理应注意的问题:资料的逻辑性检验 从专业角度对资料的合理性进行检查。如退休年龄不应小于 20 岁。一致性检查 从专业的角度,如诊断和疗效的评定标准是否统一。原始数据的加工 如年月进行分组,计算各

5、组出现的频数等。例题: 某地区 2002 年 5558 岁 132 名健康成人的空腹血糖(mmolL)测定值,结果如下:5.17 5.56 4.86 4.87 4.74 5.24 5.51 4.46 4.96 4.82 4.905.30 5.22 5.58 4.48 4.80 4.60 4.02 5.16 5.36 4.34 4.244.64 4.27 4.25 4.44 4.46 4.62 4.87 4.34 4.90 5.25 4.774.85 5.07 4.16 4.66 4.70 4.20 3.95 4.09 4.64 4.33 5.214.61 4.98 5.24 4.60 4.25

6、 4.78 5.00 3.60 4.11 4.61 4.084.78 4.26 4.44 4.38 4.40 4.79 4.76 4.92 4.60 4.78 5.034.35 4.18 4.68 4.65 4.57 4.27 4.99 4.21 4.89 4.71 4.724.41 4.38 4.06 4.79 4.96 4.83 4.45 4.54 4.27 4.50 4.315.05 5.59 5.08 5.16 3.74 4.36 5.36 4.64 5.09 4.57 4.464.56 4.39 5.24 4.61 4.21 4.96 4.34 4.45 4.86 4.50 4.90

7、4.45 4.49 4.42 4.68 4.56 5.38 4.34 4.46 4.I6 4.98 4.294.83 4.27 3.68 3.85 3.86 4.56 4.56 4.55 5.16 5.15 5.16一、同质和变异同质(homogeneity):指被研究指标的影响因素相同。实际工作中,指被研究指标中可控制的主要因素要尽可能相同或基本相同。变异(variation):指在同质的基础上各观测单位(个体)之间的差别。三、抽样指从总体中抽取部分个体的过程。(一)代表性样本中的每一个体必须符合总体的规定。(二)随机性确保总体中的每一个体有相同的概率被抽作样本。(三)可靠性用样本结果推测总

8、体的结论的可信度。确保可靠性,样本含量必须“足够大” 。(四)可比性如果进行两个或多个样本之间的比较,要求资料具有可比性。四、完全随机设计与随机区组设计(一)完全随机设计将受试对象随机分配到各个处理组或对照组中,或分别从不同总体中随机抽样进行研究。优点:简单;缺点:效率不高,需要较多的例数才能得到与其他设计相似的结果。配对设计的优缺点优点:需用样本数量少,而效率比完全随机设计高;缺点:在实验的时间太长,受试者处理因素自身发生明显变化时,不能采用同源配对设计。如 0-3 岁儿童身高、体重等受时间因素影响较大。(三)随机区组设计(配伍组设计)配伍设计:将实验对象按某些特征或相似条件按 1:X 配成

9、相应对子,来减少实验误差。分同源配伍和异源配伍。(1)同源配伍:即实验者自身实验前、后若干时间作对比。(2)异源配伍:例如将同窝、同性别、同年龄、同体重的动物配成伍,每配伍中一头列入实验组,其余列入对照组。优点:同配对设计。 缺点:同配对设计。矽肺患者经克矽平治疗 4 周血红蛋白含量 治疗后 编号 治疗前 1 周 2 周 3 周 4 周 1 9.9 11.3 12.7 13.2 14.5 2 8.9 12.3 11.7 14.4 15.5 3 10.9 11.0 13.1 14.0 14.9 : (2)随机测量误差:由于偶然因素的影响,使同一对象多次测定结果不一致。这种误差没有固定倾向。随机测

10、量误差是不可避免,要控制在容许范围内。(3)抽样误差由随机抽样引起的样本指标与总体指标的差异,称抽样误差。在统计学分析中,主要针对抽样误差而言的。六、概率描述某事件出现的可能性,用 P 表示,其数值介于 0 与 1 之间。医学事件分三种:1、必然发生事件是指必然会发生的事件, P=1。2、不可能事件必然不发生的事件,P=0。3、随机事件在一定条件下可能发生也可能不发生。某一事件发生的概率接近 1,则该事件发生的可能性愈大;概率接近 0,则该事件发生的可能性愈小。 八、变量和变量值变量(variaple):被观测单位的某项特征。变量值(value of variaple) :变量的观测结果,也称

11、观测值(observed value) 。对一组研究对象进行观察,某变量或指标数值出现的次数称为频数(frequency)。当观察例数较多时,可通过资料的整理,编制频数分布表,简称频数表(frequency table) 。二、直方图以变量值(身高)为横轴,以频数为纵轴,每一组段画一直条,直条的面积与该组频数成正比,称为直方图(histogram) 。三、频数分布的特征集中趋势(central tendency):频数向中间集中,中等水平的人数最多。离散趋势(tendency of dispersion):随变量值逐渐变大变小,人数越来越少,即向两端分散。四、频数分布的类型(1)对称分布:观察

12、值向中央部分集中,以中等数据居多,左右两侧分布大体对称。 (2)偏态分布:集中位置偏离中央,频数分布左右不对称。如集中位置偏向小的一侧,称正偏态分布;如集中位置偏向大的一侧,称负偏态分布。平均数(average):描述一组数值变量资料的集中趋势、平均水平或中心位置的指标。常用的平均数有算术平均数、几何均数和中位数。一、算术均数(arithmetic mean)简称均数,用于说明一组观察值的平均水平或集中趋势。总体均数用 表示,样本均数用表示。适用于对称分布资料,特别是正态分布资料描述。例:某地抽样得 5 名 7 岁男孩体重(kg)分别为:17.3,18.0,19.4,20.6,21.2, 。求

13、其均数。19.3(kg)2、加权法观察例数多又无计算机处理时选用。例 2.1 计算 140 名成年男子红细胞数的平均值。组中值=(本组下限+下组下限)/2fx=f?xfx2=x ? fx =f?x2、直接法观察例数不多时选用。例:6 份钩端螺旋体显凝试验的血清效价为:1:50,1:100,1:200,1:400,1:800,1:1600 。求其平均血清效价。lg1(2.4515)282.5故其平均血清效价为 1:282.52、加权法观察例数较多时选用。先将资料编成频数分布表,再按公式计算:具体步骤:1、编成频数分布表;2、求滴度倒数;3、取滴度倒数的对数;4、频数乘以滴度倒数的对数 例 2.3

14、 计算 326 人菌苗接种 2 个月后 lgG 滴度的平均滴度。=lg1(2.1441)=139.35平均滴度为 1:139.35 。(1)直接计算方法将变量值从小到大排列,再按下式计算:为奇数 (n+1)/2n 为偶数例:某病患者 5 人潜伏期( d) 从小到大排列为1、3、8、9、15,求中位数。本例5 为奇数(n+1)/238(d)例:某病患者 10 人潜伏期( d) 从小到大排列为1、3、8、9、15、19、20、23、25、30,求中位数。(2)频数表法适用于观察值个数较多时,其步骤如下:1、将资料编制成频数分布表;2、计算累计频数和累计频率;3、找出中位数所在组段;累计频率最先达到 50%的组段4、按公式计算。计算公式:中位数所在组段的下限fx :中位数所在组段的频数f L :中位数所在组段以前的累积频数例 某医生调查了 181 名食物中毒患者的潜伏期,见表,求其中位数反映其平均水平。例 2.4 计算某地 630 名正常女性血清甘油三脂的平均含量。、百分位数将 n 个观测值从小到大排列,分成 100 等份,与第 x 百分位次对应的观测值

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号