《正态分布、区间估计》由会员分享,可在线阅读,更多相关《正态分布、区间估计(29页珍藏版)》请在金锄头文库上搜索。
1、实验三、参数估计抽样分布的特点n各样本均数未必等于总体均数;n样本均数之间存在差异;n样本均数的分布很有规律:围绕总体均数 ,中间多两边少,左右基本对称;n样本均数的变异范围较之原变量的变异范 围大大缩小;随着样本含量的增加,样本 均数的变异范围逐渐缩小。由于总体中个体变异的存在,在抽样过程 中产生的样本统计量与总体参数间的差异称 为抽样误差。抽样误差标准误n样本统计量的标准差称为标准误。n样本均数的标准差称为样本均数的标准误 ,反映样本均数的离散程度,反映样本均 数抽样误差大小。t分布n设从正态分布N(,2)中随机抽取含量为n的样本,设: n实际工作中,总体方差未知,用样本方差 代替,此时:
2、 t分布, = n 1 n单峰分布,曲线以0为中心,左右对称类似于标准正态分布。nt分布的形状与自由度有关t分布曲线-t/2,vt/2,v双侧:P(t-t/2,)+ P(tt/2,)=P(-t/2, n/2,所以用nX = 6查附表6,得8 38,即无效概率的95%置信区间为8% 38%,因此有效概率的95%置信区间为62% 92%。例5-8 用某种仪器检查已确诊的乳腺癌患者 120名,检出乳腺癌患者94例,检出率为 78.3%。估计该仪器乳腺癌总体检出率的95% 置信区间。解: n比较大,且np = 94及n(1p) = 26均大于5 ,所以可用正态近似法估计总体概率的置信 区间。2 正态近
3、似法data aa; input p n;Sp=sqrt(p*(1-p)/n);y1=p-1.96*Sp; /*可信区间的下限*/y2=p+1.96*Sp ; /*可信区间的上限*/cards;0.783 120;proc print;run;作业P83 6题7题n6. 某研究表明新研制的一种安眠药比旧安眠药增加睡 眠时间。某医师从已确诊的神经衰弱病人中随机抽取 了两份样本, 一份样本是20例病人服用该种新药,计 算得到平均睡眠时间为6.39小时, 标准差为2.24小时; 另一份样本是93例病人也服用该种新药,计算得到平 均睡眠时间为6.45小时, 标准差为2.51小时。若睡眠 时间服从正态分布,试分别估计这种新安眠药的平均 睡眠时间的95%置信区间;并比较这两个区间有何不 同,用哪一个估计总体参数更可靠?n7. 为了解中年男性高血压患病情况,某研究单位在某 市城区随机调查了4554岁男性居民2660人,检查 出高血压病人775人,试估计该市中年男子高血压患 病率的95%置信区间。