试验设计与数据分析

上传人:宝路 文档编号:46768706 上传时间:2018-06-27 格式:PPT 页数:42 大小:1.03MB
返回 下载 相关 举报
试验设计与数据分析_第1页
第1页 / 共42页
试验设计与数据分析_第2页
第2页 / 共42页
试验设计与数据分析_第3页
第3页 / 共42页
试验设计与数据分析_第4页
第4页 / 共42页
试验设计与数据分析_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《试验设计与数据分析》由会员分享,可在线阅读,更多相关《试验设计与数据分析(42页珍藏版)》请在金锄头文库上搜索。

1、试验设计与数据分析2008年2月修订 版本结束 HOW WE TEACH IS ALSO WHAT WE TEACH, HOW WE LEARN IS ALSO WHAT WE LEARN. 我们教育的方式本身也是我们教育的内容;我们学习的方式本身也是我们学习的内容。目 录 第一章 绪论 第二章 常用统计分布 第三章 参数估计 第四章 假设检验 第五章 方差分析 第六章 回归分析 第七章 试验设计 第八章 非参数统计分析 第九章 主成分分析和因子分析 第十章 科技绘图 第十一章 常用统计软件第三章 参数估计3.1 3.1 抽样分布抽样分布3.2 3.2 区间估计区间估计3.2 参数区间估计抽样

2、分布与区间估计前面讨论了总体分布和抽样分布。利用抽样分布,可以指在原总体的分布为已知的 情况下,用一定的概率保证计算出某个样本统计 量出现的区间范围。下面,我们将这个问题反过来讨论。即,利用样本 数据,以抽样总体的分布为理论基础,用一定的概 率保证来计算出原总体中未知参数的区间范围。即 区间估计。置信概率与置信区间所谓置信度就是表示人们所作判断的可靠把握的程度。 置信度有两重含义,一是置信概率,一是置信区间。在日常生活中,人们的判断若有90%或95%的把握性 ,就认为这种判断基本上是正确的。在化学实验中作 统计推断时,通常取95%的置信度,也采取90%、 99%等数值,或按研究目的来另行决定。

3、作区间估计时,通常计算两尾概率,即区间内的概率为 置信度1- ,区间外两边的概率各为显著水准 之半。区间估计的种类对正态总体均值的区间估计 已知总体标准差(正态分布) 未知总体标准差(t分布)对两个正态总体均值差的区间估计 已知两个总体标准差(正态分布) 未知两个总体标准差,假设 1 = 2 (t分布) 未知两个总体标准差,假设 1 = 2 (t分布)区间估计的种类对两个正态总体方差比的区间估计(F分布) 已知两个总体均值 未知两个总体均值对正态总体方差 2的区间估计(卡方分布) 已知总体均值 未知总体均值区间估 计类别 条 件 置信区间 计算公式 备 注 已知=0 正态总体 (,2)0为总体

4、标准差 n为样本容量 2丂为查正态分布表所得 正态总 体均值的 区间估计 未知 正态总体 (,2)(-x-2tns,-x+2tns) S为样本标准差 n为样本容量 2t为查t 分布表得 ,backbackbackbackback,(,) back,特别说明 以上置信区间计算的前提是:以上置信区间计算的前提是:数据连续且总体服从正态分布数据连续且总体服从正态分布 计算前应对样本数据进行计算前应对样本数据进行正态性检验正态性检验,确认是否服,确认是否服 从正态分布从正态分布 非正态分布数据的置信区间比较难算,另有办法非正态分布数据的置信区间比较难算,另有办法对正态总体均值的区间估计例 已知某品种玉

5、米的单株产量X服从正态分布N(, 2),其 中 未知, 5 g。现从该总体随机抽取一个大小为n 25的样本,算得样本平均数为35。问该品种玉米的单株产 量(即总体平均数 )有95%的可能落在什么区间?估计均值, 已知现在请计算以上例题当要计算95%估计区间时,两尾概率之和为 =1-95%=0.05, 单尾概率为 =0.025,查标准正态分布的两尾概率表,或 单尾概率表,查得的值为1.96。对应于 =1-90%=0.10的 值为1.64。 =1-99%=0.01的值为2.58。大部分科学试验中 最常用的显著水准就是这三个。所以1.64, 1.96和2.58这三 个值应该用心记住。计算计算公式公式

6、将 、 5、n =25代入,于是得 判定单株平均产量有95%可能落在(33.04 g,36.96 g)之间 。 按公式计算:本例属于正态总体均值 的区间估计,总体方差已知如果置信度 是99%呢? 请计算一下再举一个非正态资料的例子显然,你要说话更有把握 ,就要把区间扩得宽些。33.04 35 36.9695% =0.0532.42 35 37.5899% =0.01 若要用99%的把握作判断,要在附表查得当=0.01时 的u值(2.58),用它代入上式,重新计算。得:P ( 2.58 u 2.58 ) = P ( 32.42 37.58 )。例 某乡内各户人口数X的平均数 未知,标准差 3。

7、现从该乡随机调查36户,算得样本平均数为 ,问 该乡每户人家的平均人口数 有95%可能落在什么区间 ? 中心极限定理证明:不管原来的 X 服从什么分布,只要样本容量n足够大,样本平均数 都服从正态分布,并且总体平均数 等于x,总体方差 等于 。请回忆一 下现在请计算以上例题估计均值,已知下面顺便介绍一下确定样本容量的方法将 、 3代入,于是得 判定该乡每户平均人数 有95%可能落在(2.54,5.48)之间 。因为样本容量n3630,所以可以认为平均人口数服从正 态分布,并且, 3/60.5。于是有: 例 某灯泡厂要抽样检验一批灯泡的寿命。根据以往的经 验,灯泡寿命的标准差为 6小时。现要求调

8、查的误 差范围不超过2小时,置信度为95%,问至少应抽多大 的样本。确定样本容量请回忆一下 中心极限定理证明:不管原来的 X 服从什么分布,只要样本容量n足够大,样本平均数 都服从正态分布,并且总体平均数 等于x,总体方差 等于 。或 。解不等式 得 如果灯泡的真实寿命为,抽得大小为n的样本,并算得样 本平均数为 ,那么,误差范围为 。为了保证抽样 精确度,采用大样本公式。即例 从外地引进一个小麦良种,它在本地的千粒重X的平均数和 标准差都不知道。现种植了n8个小区,得其千粒重(单位 :g)为:34.6、35.9、36.8、32.7、35.1、33.4、37.6、35.6。 试求此品种千粒重的

9、95%置信区间。估计均值, 未知用样本方差s2代替总体方差 2,用 t 分布估计区间。不过,手工计算s2太费劲,我们还是用MINITAB先进行 正态性检验, 如果是正态分布 计算计算公式公式n8,当df 817时,t0.05 2.3646。将有关数值代入后,有: 95%置信区间为(33.84 g,36.58 g)。 估计均值, 未知例 有人分析纯明矾中Al含量,得出以下9个数据:(%)10.74;10.77;10.77;10.77;10.81;10.82;10.73; 10.86;10.81;试计算其平均值的95%置信区间。 对两个正态总体均值差的区间估计 如果有两个正态总体X1 和X2 。现

10、从第1个总体抽取一个大小为n1的样本并算得样本平均数 ;又独立地从第2个总体抽取一个大小为n2的样本并算得样本平均数 。记样本平均数之差 将 服从正态分布 ,其中总体平均数总体方差l 可以将d标准化为 。只要是大样本,不管方差是否已知,都可用正态分布计算。若 、 未知,但样本足够大,可以用 和 代替它们 进行计算,所得的标准化离差仍可视为服从正态分布。 利用此分布,可计算总体均数之差 1 2 的置信区间 。对两个正态总体均值差的区间估计对两个正态总体均值差的区间估计例 有两个品种的肉鸡,品种A八周龄时的体重X1服 从正态分布,平均数1未知,方差为 100 g;品种 B八周龄时的体重X2服从正态

11、分布,平均数2未知,方 差为 80 g。现分别调查 n110只A鸡和 n215只B 鸡,得 900 g, 850 g。问有95%的把握说,两 品种肉鸡的平均体重之差 将落在什么区间?估计均值差,方差已知现在请计算以上例题计算计算公式公式因为 将数据代入得 的95%置信区间(42.3251,57.6749)。 两个正态总体,方差 和 未知但可认为 例 调查某农场每亩30万苗6块和每亩35万苗的水稻田 7块,得每亩产量如下表所示(单位:kg)。假如两种 密度下水稻产量的变异程度相同,试求两种密度水稻平 均亩产差异的95%置信区间。要计算方差要计算方差 ? 还是用还是用 MINITABMINITAB

12、吧吧计算计算公式公式n16,n27,dfn1n211, 895, 875, 。因此当df 11时,t 0.052.201,于是有因为 ,不能合并方差,只好各算各的:用代替 ,用 代替 。于是有统计量它近似服从 t 分布,但自由度需要矫正,矫正公式为:其中小样本、两个总体方差 和 未知但可认为 利用此分布,可计算总体均值之差 1 2 的置信区间。例 测定玉米品种A的蛋白质含量(%)10次,得n1=10,;又测定另一玉米品种B的蛋白质含量 (%)8次,得 。试求两种玉米品种蛋 白质平均含量之差 的95%置信区间。根据数据,可算得:当df 11时,t0.05 2.201。将有关数值代入后,于是有:对

13、正态总体方差 2的区间估计按此关系,可以利用样本方差来s2对总体方差 2进行估计。如果原总体服从正态分布,并且方差为 ,从中抽取大 小为n的样本得样本方差s2。按卡方分布的性质有关系:例 从一批温度表中随机抽取13支,放在恒温水浴的同 一位置。当水沸腾时,同时记下它们的读数如表所示。 试求这批温度表读数方差的95%置信区间。估计方差, u未知先进行 正态性检验, 如果是正态分布手工计算s s2 2 ?太费事, 我们用MINITAB计算计算公式公式按数据得 n 13,s21.3759。当df12时, 。因而有: 95%于是求得 2的95%置信区间为(0.7074,3.7491)。 方差的置信区间

14、是不对称的95%对两个正态总体方差比的区间估计从一个方差为 的正态总体中随机抽取一个大小为n1的 样本,得到的样本方差为 ;又独立地从一个方差为 的正态总体中随机抽取一个大小为n2的样本,得到的样 本方差为 。那么,比值 将服从第1自由度为 df1n1,第2自由度为df2n2的F分布。利用F分布的这个性质可以求出两方差比值的置信区间。例 调查某农场每亩30万苗6块和每亩35万苗的水稻田 7块,得每亩产量如表5.4所示(单位:kg)。假如两种 密度下水稻产量的变异程度相同, 求两种密度下水稻亩产 的方差之比的95%置信区间。估计方差比, u未知分布表列出=0.005、0.01、0.025和0.05的值。 利用该表根据区间(F,)的右尾概率来查F。相应的 左尾概率需用公式F(1, df1 , df2)1/F( , df2, df1)算出 。 回忆计算计算公式公式查得F0.025,5,65.9875

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号