总体均数的区间估计和假设检验

上传人:mg****85 文档编号:50733314 上传时间:2018-08-10 格式:PPT 页数:78 大小:1.13MB
返回 下载 相关 举报
总体均数的区间估计和假设检验_第1页
第1页 / 共78页
总体均数的区间估计和假设检验_第2页
第2页 / 共78页
总体均数的区间估计和假设检验_第3页
第3页 / 共78页
总体均数的区间估计和假设检验_第4页
第4页 / 共78页
总体均数的区间估计和假设检验_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《总体均数的区间估计和假设检验》由会员分享,可在线阅读,更多相关《总体均数的区间估计和假设检验(78页珍藏版)》请在金锄头文库上搜索。

1、第3章 总体均数的区间估计 和假设检验目 录q 第五节 均数的 u 检验q 第二节 t 分布 q 第三节 总体均数的区间估计 q 第四节 假设检验的意义和基本步骤q 第一节 均数的抽样误差与标准误q 第六节 均数的 t 检验q 第八节 型错误和型错误 q 第九节 应用假设检验应注意的问题q 第七节 两总体方差的齐性检验和t检验学习要求w掌握:抽样误差的概念和计算方法w掌握:总体均数区间的概念,意义和计算方法w掌握:假设检验的基本步骤及思路w掌握:u检验和t检验的概念,意义,应用条件和计 算方法w熟悉:第一类错误和第二类错误的概念和意义w熟悉:假设检验的注意问题w w统计推断统计推断( (sta

2、tistical inferencestatistical inference) ) :根据样本信息 来推论总体特征。w w均数的抽样误差均数的抽样误差 :由抽样引起的样本均数与总体 均数的差异称为均数的抽样误差。 w w标准误标准误(standard error)(standard error):反映均数抽样误差大小 的指标。第一节 均数的抽样误差与标准误一、标准误的意义及其计算PopulationPopulation sample2sample2sample1sample1sample3sample3sample4 sample4 sample5sample5已知:标准误计算公式未知:实例

3、:如某年某市120名12岁健康男孩, 已求得均数为143.07cm,标准差为5.70cm,按 公式计算,则标准误为:w1.表示抽样误差的大小 ;w2.进行总体均数的区间估计; w3.进行均数的假设检验等。二、标准误的应用 第二节 t 分布一、t 分布的概念w t分布于1908年由英国统计学家 W.S.Gosset以“Student”笔名发表 ,故又称“Student t”分布w正态变量X采用u(X)/变换,则一般的 正态分布N (,)即变换为标准正态分布N (0,1)。 w又因从正态总体抽取的样本均数服从正态分布N(, ),同样可作正态变量的u变换,即v 实际工作中由于理论的标准误往往未 知,

4、而用样本的标准误作为的估计值, 此时就不是u变换而是t变换了,即下式 : 二、t分布曲线的特征 vt分布曲线是单峰分布,以0为中心,左右两侧对 称,v曲线的中间比标准正态曲线(u分布曲线)低,两 侧翘得比标准正态曲线略高。vt分布曲线随自由度而变化,当样本含量越小( 严格地说是自由度 =n-1越小),t分布与u分布 差别越大;当逐渐增大时,t分布逐渐逼近于u分 布,当 =时,t分布就完全成正态分布。vt分布曲线是一簇曲线,而不是一条曲线。vT界值表。t 分布示意图t分布曲线下双侧或单侧尾部合计面积w 我们常把自由度为的t分布曲线下 双侧尾部合计面积或单侧尾部面积为指 定值时,则横轴上相应的t界

5、值记为 t,。 w 如当=20, =0.05时,记为t0.05, 20;当 =22, =0.01时,记为t0.01, 22。对于t, 值,可根 据和值,查附表,t界值表。v t分布是t检验的理论基础。由公式可 知,t值与样本均数和总体均数之差 成正比,与标准误成反比。 v 在t分布中t值越大,其两侧或单 侧以外的面积所占曲线下总面积的比重就 越小 ,说明在抽样中获得此t值以及 更大t值的机会就越小,这种机会的 大小是用概率P来表示的。 v t值越大,则P值越小;反之, t值越小,P值越大。根据上述的意义 ,在同一自由度下,t t ,则P ; 反之,tt,则P。第三节 总体均数的区间估计 w w

6、参数估计参数估计:用样本指标(统计量)估 计总体指标(参数)称为参数估计 。w估计总体均数的方法有两种,即:w点值估计(point estimation )w区间估计(interval estimation)。一、点值估计 w w点值估计:点值估计:是直接用样本均数作 为总体均数的估计值。w 此法计算简便,但由于存在抽样误差,通 过样本均数不可能准确地估计出总体均数大小 ,也无法确知总体均数的可靠程度。二、区间估计 区间估计区间估计是按一定的概率(1-)估计 包含总体均数可能的范围,该范围亦称 总体均数的可信区间(confidence interval,缩写为CI)。1-称为可信度可信度,常取

7、1-为0.95和 0.99,即总体均数的95%可信区间和99% 可信区间。1-(如95)可信区间的含义是:总体均数 被包含在该区间内的可能性是1-,即(95 ),没有被包含的可能性为,即(5)。总体均数的可信区间的计算 w1.未知且n较小 (n100),可用u检验。不同的统计检验方 法,可得到不同的统计量,如t值和u值。w4.确定概率P值P值是指在H0所规定的总体中作随机抽样, 获得等于及大于(或小于)现有统计量的概率 。 t t, ,则P ;t 。w5.作出推断结论 w当P时,表示在H0成立的条件下,出现等于及 大于现有统计量的概率是小概率,根据小概率事件 原理,现有样本信息不支持H0,因而

8、拒绝H0,结论 为:按所取检验水准拒绝H0,接受H1,即差异有统 计学意义。如例3.3 认为两总体脉搏均数有差别。w当P时,表示在H0成立的条件下,出现等于及 大于现有统计量的概率不是小概率,现有样本信息 还不能拒绝H0,结论为按所取检验水准不拒绝H0, 即差异无统计意义,如例3.3 尚不能认为两总体脉 搏均数有差别。下结论时的注意点:wP ,拒绝H0,不能认为H0肯定不成立,因 为虽然在H0成立的条件下出现等于及大于现有 统计量的概率虽小,但仍有可能出现;w同理,P ,不拒绝H0,更不能认为H0肯定 成立。w由此可见,假设检验的结论是具有概率性的, 无论拒绝H0或不拒绝H0,都有可能发生错误

9、, 即第一类错误或第二类错误 第五节 均数的u检验v国外统计书籍及统计软件亦称为单样本单样本u u检验(检验(one sample one sample u u-test-test)。 v样本均数与总体均数比较的u检验适用于 :v总体标准差已知的情况; v样本含量较大时,比如n100时。对于后者 ,是因为n较大,也较大,则t分布很接近u 分布的缘故。 一、样本均数与总体均数比较的u检验u 值的计算公式为:总体标准差已知时,不管n的大小。总体标准差未知 时,但n100时。例3.4 某托儿所三年来测得2124月龄的 47名男婴平均体重11kg。查得近期全国九 城市城区大量调查的同龄男婴平均体重 1

10、1.18kg,标准差为1.23kg。问该托儿所男 婴的体重发育状况与全国九城市的同期水 平有无不同?(全国九城市的调查结果可 作为总体指标) w(1)建立检验假设 wH0: 0 ,即该托儿所男婴的体重发育状 况与全国九城市的同期水平相同, 0.05( 双侧)wH1: 0 ,即该托儿所男婴的体重发育状 况与全国九城市的同期水平不同。w(2)计算u值 本例因总体标准差已知,故 可用u检验。w本例n=47, 样本均数=11, 总体均数=11.18,总 体标准差=1.23, 代入公式w(3)确定P值,作出推断结论 w 查u界值表(t界值表中为一行),得 u0.05=1.96,u=1.0030.05。

11、按=0.05水准,不拒绝H0,差异无统计学意义 。 w结论:可认为该托儿所男婴的体重发育 状况与全国九城市的同期水平相同。 二、两样本均数比较的u检验w该检验也称为独立样本独立样本u u检验检验 (independent sample u-test),适用于 两样本含量较大(如n150且n250)时, u值可按下式计算:例3.5 测得某地2024岁健康女子100 人收缩压均数为15.27kPa,标准差为 1.16kPa;又测得该地2024岁健康男子 100人收缩压均数为16.11kPa,标准差为 1.41kPa。问该地2024岁健康女子和男子之间收缩压均数有无差别? (1)建立检验假设 H0:

12、1 2 ,即该地2024岁健康女子和 男子之间收缩压均数相同;H1: 12 ,即该地2024岁健康女子和男 子之间收缩压均数不同。 0.05(双侧) (2)计算u值 本例 n1=100, 均数1=15.27, S1=1.16n2=100, 均数2=16.11, S2=1.41w(3)确定P值,作出推断结论 w 查u界值表(附表7,t界值表中为一行) ,得u0.05=1.96,现uu0.05=1.96,故P0.05。按=0.05的 水准,不拒绝H0,差异无统计学意义。结论:即根据本资料还不能认为此山 区健康成年男子脉搏数与一般健康成年 男子不同。 w配对实验设计得到的资料称为配对资料 。w医学科

13、研中配对资料的四种主要类型:同一批受试对象治疗前后某些生理、生化指标 的比较;同一种样品,采用两种不同的方法进行测定, 来比较两种方法有无不同;配对动物试验,各对动物试验结果的比较等。同一观察对象的对称部位。二、配对资料的t检验v 先求出各对子的差值d的均值, 若两种处理的效应无 差别,理论上差值d 的总体均数应为0。所以这类资料的比较可看作是样本均数与总体均数 为0的比较。要求差值的总体分布为正态分布。v 配对资料的 t 检验 (paired samples t-test)t检验的公式为:例3.7 设有12名志愿受试者服用某减肥药 ,服药前和服药后一个疗程各测量一次体 重(kg),数据如表3

14、-4所示。问此减肥药是 否有效? (1)建立检验假设 H0:d= 0,即该减肥药无效;H1:d 0,即该减肥药有效。单侧=0.05 表3-4 某减肥药研究的体重(kg)观察值 w(2)计算t值w本例n = 12, d = -16,d2 = 710,w差值的均数=d /n = -16/12 = - 1.33(kg )w(3)确定P值,作出推断结论 自由度=n- 1=12-1=11,查t界值表,得单侧t0.05,11=1.796,现 t=0.58 0.05。按=0.05水 准,不拒绝H0, 差异无统计学意义。w结论:故尚不能认为该减肥药有减肥效果。w两样本均数比较的t检验亦称为成组t检验,又 称为

15、独立样本独立样本t t检验(检验(independent samples tindependent samples t -test-test)。w适用于比较按完全随机设计而得到的两组资料 ,比较的目的是推断它们各自所代表的总体均 数和是否相等。 三、两样本均数比较的t检验样本估计值为:总体方差已知:标准误的计算公式合并方差:若n1=n2时 :w已知S1和S2时 :例3.9 测得14名慢性支气管炎病人与11名健康 人的尿中17酮类固醇(mol/24h)排出量如下, 试比较两组人的尿中17酮类固醇的排出量有无不 同。 w原始调查数据如下:w病 人X1:n=14; 10.05 18.75 18.99

16、 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60w健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 (1)建立检验假设 H0:1 2 ,即病人与健康人的 尿中17酮类固醇的排出量相同 H1: 1 2 ,即病人与健康人的 尿中17酮类固醇的排出量不同 0.05 w(2)计算t值 w本例n1=14, X1=212.35, X12=3549.0919 wn2=11, X2=210.70, X22=4397.64 w(3)确定P值 作出推断结论 =14+11

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号