计量资料统计推断(第9章)

上传人:kms****20 文档编号:50938429 上传时间:2018-08-11 格式:PPT 页数:75 大小:1.33MB
返回 下载 相关 举报
计量资料统计推断(第9章)_第1页
第1页 / 共75页
计量资料统计推断(第9章)_第2页
第2页 / 共75页
计量资料统计推断(第9章)_第3页
第3页 / 共75页
计量资料统计推断(第9章)_第4页
第4页 / 共75页
计量资料统计推断(第9章)_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《计量资料统计推断(第9章)》由会员分享,可在线阅读,更多相关《计量资料统计推断(第9章)(75页珍藏版)》请在金锄头文库上搜索。

1、例 某年某市抽样调查了120名5岁女孩身高(cm)资料105.5 118.6 110.5 104.2 110.9 107.9 108.1 99.1 104.8 116.5 110.4 105.7 118.2 117.0 112.3 116.5 113.2 107.9 104.8 109.6 109.1 108.1 109.4 118.2 103.9 116.0 110.1 99.6 109.3 107.5 108.6 100.6 108.8 103.8 95.3 104.4 102.7 101.0 112.1 118.7 100.2 102.1 114.5 110.4 115.0 120.5

2、115.5 112.7 103.5 114.4 100.7 116.3 105.1 112.8 118.5 113.3 107.9 114.6 121.4 110.7 108.8 114.7 110.6 110.7 116.6 106.9 105.5 107.4 118.4 115.3 119.7 113.9 116.5 112.9 112.9 110.0 99.5 112.7 106.7 119.1 109.6 110.7 102.8 111.3 105.2 117.0 114.9 120.0 103.4 109.3 108.8 105.7 109.0 108.8 108.1 116.4 1

3、08.3 111.0 113.0 101.4 108.7 119.1 106.2 115.2 124.0 98.7 106.0 114.7 111.9 107.3 104.1 109.1 108.8 111.0 106.8 120.2 105.8 103.1 105.0 115.01根据 例 某年某市抽样调查120名女孩身高的资料 ,我们可以知道以下信息: 频数表和频数图 - 了解资料大体分布特征 计算均数 - 平均水平,集中趋势 =110.15 cm 计算标准差 - 变异程度,离散程度 S = 5.86 cm 120名5岁女孩身高的平均值与全国平均水平有 没有差别?现欲了解: 该地区的所有5

4、岁女孩身高的平均值是多少?2一.均数的抽样误差与标准误1. 均数的抽样误差:由于抽样引起的样本均数与总体均数之差第三节 数值变量资料的统计推断32.均数的标准误: (1)意义:说明抽样误差的大小。反映样本均数的可靠程度。大,抽样误差大,用 估计的可靠程度较小。样本均数的标准差 - 标准误 4(2)计算公式 :从上式可知,标准误与标准差成正比,与样本含量 的平方根成反比。在实际工作中,可以通过增大样 本含量来减少抽样误差。 例:某市随机抽查12岁男孩100人,得身高均数 139.6cm,标准差6.85cm,计算标准误。 5在实际工作中,由于未知,用样本S代替 , 这时样本均数的变换不是u变换,是

5、t变换6主要用于总体均数的区间估计及t 检验等t 分布的用途:二.t分布t分布又称Student-t分布(Students t-distribution).统计量 t 的分布- t分布t分布与自由度有关,每一个自由度对应一条分 布曲线73. t分布的图形和特征:图形:(1)以 0 为中心,两侧对称的单峰分布特征:(2)与 u 分布比较,峰值较低,两边上翘 (3)有一个参数 ,当 ,t分布u分布 8单尾概率(one-tailde probability),其对应的t界值用t,表示; 双尾概率(two-tailde probability),其对应的t界值用t/2,表示。9t值表的特点:1. 在相

6、同自由度时,t值越大,概率P越小; 2. 在相同概率P时,自由度越大,t值越小;3. 在相同t值时,双尾概率为单尾概率的两倍, 即t0.05/2,18= t0.025,18=2.101。10三.总体均数的估计1. 点估计(point estimation): 概念:按一定的概率(1 - )估计总体均数所在 范围(或称可信区间, confidence interval, CI ),常用95%和99%的概率估计。2. 区间估计(interval estimation):可信区间又称置信区间。11(3) 未知但n较大,可按正态分布原理(2) 未知时,按t分布原理(1)已知时,按正态分布原理计算:均数

7、的双侧可信区间为:12同理,均数的单侧可信区间:上限:估计总体均数至多是多大。下限:估计总体均数至少是多大。n较大时n较大时用于估计总体均数至少或至多是多大。13抽样调查某地100名12岁男孩身高,得均数为 139.6cm,标准差为6.85cm,试估计该地12岁 男孩身高均数的95%可信区间。例:即该地12岁男孩身高均数的95%可信区间为:138.3141.0 (cm)=0.05 u0.05=1.9614例 某卫生防疫站为了解某厂所生产的同一批罐装 午餐肉中亚硝酸盐的含量,随机抽取了该批罐装午 餐肉10听,测得亚硝酸盐含量的样本均数为17. 6mg/kg,标准差为1. 64 mg/kg 。试估

8、计该批罐装 午餐肉中亚硝酸盐平均含量的 95 CI。15由于罐装午餐肉中亚硝酸盐的含量应不高于某一数值 ,故取单侧(上限)可信区间:本例故该批罐装午餐肉中亚硝酸盐平均含量的 95 CI: 低于18.55mg/kg。16根据 例 某年某市抽样调查120名女孩身高的资料 ,我们可以知道以下信息: 频数表和频数图 - 了解资料大体分布特征 计算均数 - 平均水平,集中趋势 =110.15 cm 计算标准差 - 变异程度,离散程度 S = 5.86 cm 现欲了解: 该地区的所有5岁女孩身高的平均值是多少? 120名5岁女孩身高的平均值与全国平均水平有 没有差别?17四. 假设检验的意义和基本步 骤

9、例4 根据大量调查,已知健康成年男子的脉搏均数 为72次/分。某医生在某山区随机调查25名健康男 子,求得脉搏均数为74.2次/分,标准差为6.5次/ 分。能否认为该山区的成年男子的脉搏均数高于 一般成年男子的脉搏均数?已知总体 未知总体18造成 与0不等的原因: 假设检验 (hypothesis test)又称显著性检验 (significance test)。(1)抽样误差 ,即=0(2)非同一总体,即0 应用逻辑推理的方法,先对总体的特征建立一个 假设,然后通过抽样研究的统计推断来判定此假 设应该被接受还是拒绝.192.假设检验的一般步骤(1)建立假设,确定检验水准 H0: (无效假设)

10、 总体参数相等H1: (备择假设) 总体参数不等通常 = 0.05(2) 选定检验方法和计算检验统计量(test statistic)如:、F、X2 等(3)确定P值,作出推断结论20H0: (无效假设) 总体参数相等 H1: (备择假设) 总体参数不等双侧检验 单侧检验单侧检验与双侧检验:1. 检验假设:21怎样选择双侧检验或单侧检验? 根据专业知识 根据研究目的 在建立检验假设时,应当注意: 检验假设应针对总体而言,不能针对样本 H0和H 1缺一不可22在实际工作中通常取 = 0.05。但并非一成不变 ,可根据研究目的给予不同设置。2. 确定检验水准 (size of a test): 又

11、称显著性水准 为型错误的概率大小(详后),是预先规定的 概率值,即小概率事件的标准。233. 确定P值,作出推断结论根据计算出的检验统计量,查相应的界值表即 可得P值,将P值与事先规定的概率 进行比较 而得出结论。若:P 时,则拒绝H0,接受H1,有统计学意义 (统计结论),可认为不同或不等(专业结 论)。若: P 时,则不拒绝H0,无统计学意义(统 计结论) ,还不能认为不同或不等(专业 结论)。24第四节 t检验和u检 验t 检验: t-test 或称Students t-test; u 检验: u-test 或称 Z-test用途: 两个均数比较应用条件: 样本来自正态分布的总体; 两总

12、体方差相等。不同点: 样本含量大小25一、常见的两个均数比较的类 型v 样本均数与总体均数的比较 配对资料的均数比较 两个样本均数的比较 检验的基本步骤完全相同 检验统计量的计算公式不同26例 根据大量调查,已知健康成年男子的脉搏均 数为72次/分。某医生在某山区随机调查25名健 康男子,求得脉搏均数为74.2次/分,标准差为 6.5次/分。能否认为该山区的成年男子的脉搏 均数高于一般成年男子的脉搏均数?1. 样本均数与总体均数的比较单样本t检验(one sample t-test)27(1)H 0:=0H 1:0 = 0.05(2)计算t值:(3)确定P,作出统计结论:根据=n-1=24查t

13、界 值表,得0.05P0.10,按= 0.05水准,不拒绝 H0,差异无统计学意义,尚不能认为该山区成年男子 脉搏均数高于一般成年男子的脉搏均数。28例为研究女性服用某避孕新药后是否影 响其血清总胆固醇含量,将20名女性按年龄 配成10对。每对中随机抽取一人服用新药, 另一人服用安慰剂。经过一定时间后,测得 血清总胆固醇含量(mmolL),结果如下 表。问该新药是否影响女性血清总胆固醇含 量?29新药组与安慰剂组血清总胆固醇含量(mmol/L)配对对号12345678910新药组药组4.45.05.84.64.94.86.05.94.35.1安慰剂剂 组组6.25.25.55.04.45.45

14、.06.45.86.2302.配对设计的均数比较配对t检验(paired t- test for dependent samples)配对设计主要有以下情形:n为对子数(1)同对的两个受试对象分别接受两种不同的处理,目的是推断两种处理的效果有无差别。(2)同一受试对象分别接受两种不同的处理,目的同(1)。(3)同一受试对象处理前后的比较,目的是推断该处理有无作用。31新药组与安慰剂组血清总胆固醇含量(mmol/L)配对对号12345678910新药组药组4.45.05.84.64.94.86.05.94.35.1安慰剂剂 组组6.25.25.55.04.45.45.06.45.86.2差值d

15、-1.8 -0.2 0.3 -0.4 0.5 -0.6 1.0 -0.5 -1.5 -1.132(1)H0:d= 0H1:d 0 = 0.05(3)确定P,作出统计结论:根据=n-1=9查t界 值表,得0.10P0.20,按= 0.05水准不拒绝 H0,无统计学意义,尚不能认为该新药对女性血清 总胆固醇含量有影响。(2)计算t值:33例 某医生研究野木瓜用于手术后的镇痛疗效,以 哌替啶作为对照,观察两药的镇痛时间(h),得 到如下结果,问野木瓜与哌替啶的镇痛时间是否 不同?分组组n野木瓜306.21.4哌哌替啶啶283.51.2野木瓜与哌替啶的镇痛时间(h)343.成组设计的两样本均数的比较 成组t检验(two-sample t-test for independent samples) :35(1)H0:12H1:12 = 0.05(2)计算t值:(3)确定P,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号