南农生课本示稿第6章卡平方测验

上传人:re****.1 文档编号:567965374 上传时间:2024-07-22 格式:PPT 页数:28 大小:610.03KB
返回 下载 相关 举报
南农生课本示稿第6章卡平方测验_第1页
第1页 / 共28页
南农生课本示稿第6章卡平方测验_第2页
第2页 / 共28页
南农生课本示稿第6章卡平方测验_第3页
第3页 / 共28页
南农生课本示稿第6章卡平方测验_第4页
第4页 / 共28页
南农生课本示稿第6章卡平方测验_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《南农生课本示稿第6章卡平方测验》由会员分享,可在线阅读,更多相关《南农生课本示稿第6章卡平方测验(28页珍藏版)》请在金锄头文库上搜索。

1、试验设计与统计分析试验设计与统计分析第四章第四章 理论分布和抽样分布理论分布和抽样分布本课程使用盖钧镒主编的试验统计方法一书作为课本。全程为38学时,占2学分。 第二章 试验设计与实施第三章 次数分布和平均数、变异数第五章 统计假设测验第八章 参数估计方法第六章 方差分析第七章 卡方测验第九章 直线回归和相关第一章 科学实验及其误差控制第十章 多元回归和相关第十四章 不完全区组设计和统计分析第十二章 单因素试验的统计分析第十三章 多因素试验结果的统计分析第十五章 抽样调查第十一章 曲线回归第七章 卡方测验第二节 样本方差同质性测验第一节 卡平方分布的定义和分布第三节 适合性测验第四节 独立性测

2、验第五节 卡方的可加性和联合分析第一节 卡平方分布的定义和分布 第四章介绍各种概率分布时,我们已经初步介绍过卡平方分布 的定义。现在先回忆一下当 时的介绍。第五节 几种常用的分布(回忆)l 2分布(卡平方分布)l 若随机变量2的概率密度函数为: 则称随机变量2服从自由度为n的2分布。l 2分布曲线的特性: 20,图象都在第一象限; 不对称的单尾型曲线,随着自由度增加变得稍对称, 但顶峰变矮; df3时,曲线与横轴间面积为1;df 3时,曲线与 纵横两轴间面积为1。例:随机变量2服从df =3的2分布,它在区间(0, 20.05)的概率为95%,即在此区间以外的概率为5%,查表求20.05的值。

3、p.367附表6列出了若干常用概率下()的2分布表值。df =1df =3df =5f( 2) 2第一节 卡平方分布的定义和分布l 课本p.131中的(7.1)式指出, 2的定义是互相独立的 多个正态差平方值的总和。即 因此,如果有k个随机变量yi (其中i=1,2,k), 并且各个 ,则它们的标准离差为 。 这时,就会有随机变量 服从自由度 df = k 的卡平方(2)分布。 如果所有yi都来自同一(平均数为,方差2为的)总体, 就有:第一节 卡平方分布的定义和分布l 实践中,常常是未知的,因此用样本平均数 来代 替它计算,于是 2就变成为 如果所有yi都来自同一(平均数为,方差2为的)总体

4、, 就有: 但是,这时的自由度变成为df=k-1。 2进一步变成第一节 卡平方分布的定义和分布l 实践中,常常是未知的,因此用样本平均数 来代 替它计算,于是 2就变成为 但是,这时的自由度变成为df=k-1。 2进一步变成l 对于属性资料,K.Pearson推导出一个统计量: 其中Oi为第i组的观察数,Ei为第i组的理论数,自由度 df 则由分组数 k 和它们之间的独立程度来决定。 本章中大多数统计假设测验都采用这些公式。尤其下面这条公式 应该牢牢记住。 注意:所有测验方法都是专门应用于计数资料的。不要将这些方法用来处理连续型随机变数资料!第二节 样本方差同质性测验l 统计测验的基本方法和一

5、般步骤 :2.利用试验数据计算一个统计量的值。再根据该样本统 计量的抽样分布,计算出当H0为正确时出现这样一个 值的概率。对不同资料进行测验时,由于统计量及其 的分布不同,计算统计量和概率的公式有所不同。3.当此概率小于预先设定的水平,就根据“小概率事件 实际上不可能发生”原理拒绝H0,接受HA。该水平称 为显著水准(记为)。常用的为5%或1%。1.针对研究的问题提出一对统计假设。其中: * 认为试验的处理没有效应的假设称为无效假设 (H0 - null hypothesis); * 当H0不能被接受时所采纳的假设称为备择假设 (HA - alternative hypothesis)。第二节

6、 样本方差同质性测验l 一个样本方差与已知总体方差的统计测验 若从一个总体抽取一个大小为n的样本,算得样本方差 为s2,想了解此总体方差 2是否与已知方差02间有显 著的差异。l 两个样本方差是否来自同一总体方差的统计测验l 多个样本方差是否来自同一总体方差的统计测验 若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。 若总共有k个样本,第i个样本的样本方差si2来自总体方 差i2。想了解这k个总体方差之间是否有显著差异。第二节 样本方差同质性测验2.利用试验数据计算一个统计量的值。3.根据“小概率事件实际上不可能发生”原理作判断。1.

7、针对研究的问题提出一对统计假设。 两尾测验时 H0: 2 = 02 vs HA: 2 02 (大端)一尾测验时 H0: 2 02 vs HA: 2 02 (小端)一尾测验时 H0: 2 02 vs HA: 2 02 两尾测验时, 2 2/2或 2 21-/2有(1-)概率推翻H0; (大端)一尾测验时, 2 2 ,则有(1-)概率推翻H0; (小端)一尾测验时, 2 21- ,则有(1-)概率推翻H0。 计算统计量:l 一个样本方差与已知总体方差的统计测验用df=n1查2分布表。 p.131 例7.1、例7.2。利用两尾测验的接受区域可以求得未知总体方差 2的置信区间: p.132例7.3。第

8、二节 样本方差同质性测验2.利用试验数据计算一个统计量的值。3.根据“小概率事件实际上不可能发生”原理作判断。1.针对研究的问题提出一对统计假设。 两尾测验时 H0: 12 = 22 vs HA: 12 22 (大端)一尾测验时 H0: 12 22 vs HA: 12 22 两尾测验时,F F/2或 F F1-/2有(1-)概率推翻H0; (大端)一尾测验时, F F ,则有(1-)概率推翻H0; 计算统计量:用df 1= n11, df 2= n21查 F 分布表。l 两个样本方差是否来自同一总体方差的统计测验 若大小为n1的样本方差s12来自总体方差12,大小为n2的 样本方差 s22 来

9、自总体方差 22,想了解这两个总体方差 12 之间是否有显著差异。p.361的附表5的数值是专为(大端)一尾测验使用的。p.102例6.2。 H0: 12 22 vs HA: 12 22 F = 1.621/0.135=12.01, df 1=10-1=9, df 2=5-1=4 因为F = 12.01F0.05 = 6.00,拒绝H0,判断12 22 。两尾测验怎么办?用附表5只能用=0.1或=0.02做。p.102例6.2做两尾测验时, H0:1222 vs HA:1222 F = 1.621/0.135=12.01, df 1=10-1=9, df 2=5-1=4,因为F = 12.01

10、F0.1/2 =F0.05 = 6.00,拒绝H0,判断12 22 。 按附表5的设计 F不会小于F0.9。第二节 样本方差同质性测验 计算统计量:l 多个样本方差是否来自同一总体方差的统计测验 若总共有k个样本,第i个样本的样本方差si2来自总体方 差i2。想了解这k个总体方差之间是否有显著差异。 H0: 12 = 22 = = k2 vs HA: 并非都相等 其中:2.利用试验数据计算一个统计量的值。1.针对研究的问题提出一对统计假设。3.根据“小概率事件实际上不可能发生”原理作判断。3.如果, 2 2 ,则有(1-)概率推翻H0。用df=k1查2分布表。 p.133例7.4。isi2df

11、iSSi=dfisi2lnsi2dfi lnsi214.2416.81.435085.7403226.0530.01.791768.9588033.11134.11.1314012.445402080.94.3582427.14452第三节 适合性测验l 适合性测验是比较实际比率与理论比率之间是否有显 著差异的方法。l p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比

12、率与理论比率1:1之间是否有显著差异。 这个问题实际上在第五章就解决了。我们看看 当时是怎样解决的。第三节 适合性测验l p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。l 因为样本大小为n = 6919,样本中淀粉粒百分率为 ,理论百分率为p0 = 50% = 0.5。 按二项资料百分率测验方法可以解决这个问题。 两尾测验 H

13、0: p = p0 = 0.5 vs HA: p p0 = 0.5 计算统计量: 因为|u|= 0.54101.96,接受H0,认为实际比率为1:1。 现在看看用2测验如何解决这个问题。第三节 适合性测验l p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。l 先将数据列成上面的表。 测验假设 H0: 比率为1:1 vs HA:比

14、率不是1:1 计算:碘反映观察数(O)理论数(E)变蓝34373459.5不变蓝34823459.5共计69196919 因为 2 = 0.2927 = 3.84,接受H0,认为实际比 率与理论比率1:1相符。 注意这里 2 的自由度为1。因为自由度= 分组数-限制条件数第三节 适合性测验l p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否

15、有显著差异。l 先将数据列成上面的表。 测验假设 H0: 比率为1:1 vs HA:比率不是1:1 计算:碘反映观察数(O)理论数(E)变蓝34373459.5不变蓝34823459.5共计69196919 因为 2 = 0.2927 = 3.84,接受H0,认为实际比 率与理论比率1:1相符。l 本章开头就指出,正态离差 u 的平方就等于2 。以本例为例,可以验证两种测验的本质是一样的。 u 测验中: 2 测验中:可以验证: 0.54102=0.2927。 甚至从它们的计算公式也 可以证明。碘反映观察数(O)理论数(E)变蓝3437(x)3459.5(n/2)不变蓝3482(n-x)3459

16、.5(n/2)共计6919(n)6919(n) u 测验中: 2 测验中:第三节 适合性测验l p.55例4.2 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。 甚至从它们的计算公式也 可以证明。碘反映观察数(O)理论数(E)变蓝3437(x)3459.5(n/2)不变蓝3482(n-x)3459.5(n/2)共计6919(n)6919(n) u

17、 测验中: 2 测验中: 再看它们 的连续性 矫正公式。 u 测验: 本例中: 未矫正前 u=0.5410。 未矫正前 u=0.2927。 可以验证: 0.54102=0.2927 p.135例7.5是一个 理论比率为3:1 (即p0 = 0.75)的例子。l u测验中,当n30,np5时,需要进行连续型矫正。l 2 测验中,当自由度为1时,需要进行连续型矫正。第三节 适合性测验你会说,既然是一样的,何必讲两种,前面讲过一种,后面就不要讲这种啦!不尽然!2测验不但可以测验两种结果的比率,还可以测验多种结果的比率。对于这种情况,u 测验就无能为力了! p.136例7.6是一个理论比率9:3:3:

18、1的例子。 注意它的自由度。 p.144习题7.4是一个 理论比率9:3:4的例子。 注意它的自由度。利用适合性测验还可以检查一组试验数据是否符合某种理论分布。看p.137例7.7和p.58例4.4。注意:自由度=组数-限制条件数。第三节 适合性测验于是你又会说,早知道后一种方法更好些,前面那种就不要讲了!这回你说对了,有些书就只讲后一种而不讲前一种的。只是我要你们两种都掌握,不是更好些吗!第四节 独立性测验l 独立性测验是检查两个(对计数指标有)影响(的)因素 是否相互独立(或有关)的方法。l 例如,“小麦种子是否经过灭菌处理”与“长出的麦穗是 否发病”这两件事情是否有关。所以它的统计假设为

19、: H0:两个因素相互独立 vs HA:两个因素相互有关根据各因素的水平数多少分为:l 22 相依表的独立性测验l 2C 相依表的独立性测验l RC 相依表的独立性测验第四节 独立性测验l 22 相依表的独立性测验l p.139例7.8 调查经过灭菌处理与未经过灭菌处理的两 类小麦种子长出的麦穗发生小麦散黑穗病的株数,得 下表,试分析种子灭菌与否和植株是否发病有无关系。用于处理有两行两列的计数资料,即两个因素各自可分为两种水平时的情况。发病穗数无病穗数合计种子经灭菌265076种子未灭菌184200384合计210250460 这个问题实际上在第五章就解决了。我们看看 当时是怎样解决的。第四节

20、 独立性测验l 用两个样本百分数相比较的假设测验就可以解决发病穗数无病穗数合计种子经灭菌265076种子未灭菌184200384合计210250460H0: p1 = p2 vs HA: p1 p2 经灭菌的种子调查了76株,发病26株, ; 未经灭菌的种子调查了384株,发病184株, ; 混合样本共460株,发病210株, 。两种种子发病率大不相同。 再看看用2 测验如何做第四节 独立性测验H0: 灭菌与否和发病无关 vs HA:发病与灭菌与否有关发病穗数无病穗数合计种子经灭菌265076种子未灭菌184200384合计210250460 如果H0正确,灭不灭菌的发病率都应该等于210/4

21、60。经 灭菌的种子调查了76株,理论上应有76(210/460) = 34.7 株发病,统计推断:种子灭菌与否和发病不发病有显著关系。26(34.7)50(41.3)184(175.3)200(208.7)76-34.7=41.3株无病; 未经灭菌的调查了384株,理论上有384(210/460) =175. 3株发病, 384-175.3株无病。 可以验证: 2.19172=4.9036 可以验证: 1.962=3.84 注意2的自由度df =1 比较两种测 验的结果。 再看连续性 矫正公式。 可以验证: 2.06572=4.2671第四节 独立性测验l 2C 相依表的独立性测验l p.1

22、40例7.9 根据野生大豆193份和栽培大豆223份的某 同工酶电泳分析结果,将两类大豆各分为三种基因型, 数据资料如下表所示,试问该同工酶的基因型与大豆 物种类型之间是否有显著关系。用于处理有两行多列的计数资料,即两个因素各自可分为多种水平或多个因素各自分为两个水平时的情况。 这个问题只能用 2测验,用u测验 就比较困难。物种等位基因型总计123野生大豆296896193栽培大豆221992223总计5126798416第四节 独立性测验物种等位基因型总计123野生大豆296896193栽培大豆221992223总计5126798416H0: 物种与基因型无关 vs HA: 物种与基因型有关

23、 如果H0正确,野生大豆与栽培大豆的基因型1频率都应该 等于51/416。野生种调查193份,理论上应有193(51/416) =23.66份基因型1,29(23.66) 栽培种调查223份,应有223(51/416) =27.34份基因型1;22(27.34) 如果H0正确,两物种的基因型2频率都应该等于267/416。野生种调查193份,有193(267/416)=123.87份基因型2,68(123.87) 其它各个理论数也可以类似地算出。199(143.13)96(45.47)2(52.53)算出各个理论值后,就可以计算 2值了。注意:2 分布的自由度=(2-1)(C-1)=2。查得2

24、0.05=5.99。 统计推断:大豆物种的两种类型与该同工酶的等位基因 型之间有显著的联系。 当自由度1时,进行2测验无需要 做连续型矫正。第四节 独立性测验l RC 相依表的独立性测验l p.141例7.10 不同灌溉方式下水稻叶片衰老情况的调 查资料如下表。试问测验水稻叶片的衰老情况与灌溉 方式是否有关。用于处理有多行多列的计数资料,即多个因素各自可分为多种水平时的情况。 用前面所介绍的方法计算出各个实际观察值 所对应的理论值。灌溉方式绿叶株数黄叶株数枯叶株数总计深水14677160浅水183813205湿润1521416182总计4813036547灌溉方式绿叶株数黄叶株数枯叶株数总计深

25、水146(140.69)7(8.78)7(10.53)160浅水183(180.26)8(11.24)13(13.49)205湿润152(160.04)14(9.98)16(11.98)182总计4813036547 H0: 灌溉方式与叶片衰老无关 vs HA: 两因素之间有关 df =(3-1)(3-1)=4,自由度1时,无需 做连续型矫正。 统计推断:由95%把握说灌溉方式与叶片衰老无关。第五节 卡方的可加性和联合分析l 第一节中已经提到过卡方的可加性。即若干个卡方统 计量的和仍然服从卡方分布,只是自由度发生了变化 而已。利用卡方的这个性质,可以把若干个卡方测验 合并在一起进行联合分析,也

26、可以将一个大的卡方测 验分解为若干个卡方测验。 各个组合是否符合3抗:1感的理论比率;l p.142例7.11举了一个联合分析的简单例子。例中举了 三个大豆杂交组合对一种虫害的抗性和敏感型基因型 比例的数据。要测验: 综合群体是否符合3抗:1感的理论比率; 三个群体的理论比率是否同质(即均为3抗:1感);注意:只有未经连续性矫正的 2才具有可加性。在联合分析中只能使用未经连续性矫正的 2公式。组合1OE737527251001002=0.213.84组合2OE6268.252922.7591912=2.293.84组合3OE9095.253731.751271272=1.163.84综合群体OE225238.59379.59183182=3.063.84三个组合的 2之和减去综合群体的 2,剩余的值仍是一个 2。 2 =(0.21+2.29+1.16)-3.06=3.66 -3.06=0.605.99。其自由度为3-1=2。它测验了第项。第七章 卡方测验第二节 样本方差同质性测验第一节 卡平方分布的定义和分布第三节 适合性测验第四节 独立性测验第五节 卡方的可加性和联合分析

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号