拟合优度检验【优质参照】

上传人:s9****2 文档编号:569982406 上传时间:2024-08-01 格式:PPT 页数:64 大小:522.51KB
返回 下载 相关 举报
拟合优度检验【优质参照】_第1页
第1页 / 共64页
拟合优度检验【优质参照】_第2页
第2页 / 共64页
拟合优度检验【优质参照】_第3页
第3页 / 共64页
拟合优度检验【优质参照】_第4页
第4页 / 共64页
拟合优度检验【优质参照】_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《拟合优度检验【优质参照】》由会员分享,可在线阅读,更多相关《拟合优度检验【优质参照】(64页珍藏版)》请在金锄头文库上搜索。

1、第七章 拟合优度检验1专业课件拟合优度检验的应用n总体分布未知,从样本数据中发总体分布未知,从样本数据中发现规律(现规律(总体分布总体分布),再利用拟),再利用拟合优度检验对合优度检验对假设的总体分布假设的总体分布进进行验证。行验证。2专业课件【引例引例1】某地区某地区在在1500到到1931年的年的432年间,共爆发了年间,共爆发了299次战次战争,具体数据如下(每年爆发战争,具体数据如下(每年爆发战争的次数可以看作一个随机变量争的次数可以看作一个随机变量X):):战争次数战争次数 X01234 22314248154 发生发生 X 次战争的年数次战争的年数3专业课件 根据我们对泊松分布产生

2、的一般条件的理根据我们对泊松分布产生的一般条件的理解,可以用一个泊松随机变量来近似描述解,可以用一个泊松随机变量来近似描述每每年爆发战争的次数。年爆发战争的次数。也就是说,我们可以假也就是说,我们可以假设每年爆发战争次数分布设每年爆发战争次数分布 X 近似泊松分布。近似泊松分布。现在的问题是:现在的问题是: 上面的数据能否证实上面的数据能否证实 X 具有泊松分布的具有泊松分布的假设是正确的?假设是正确的?4专业课件【引例引例2】某钟表厂对生产的钟某钟表厂对生产的钟进行精确性检查,抽取进行精确性检查,抽取100个钟个钟作试验,校准作试验,校准24小时后进行检小时后进行检查,将每个钟的误差(快或慢

3、)查,将每个钟的误差(快或慢)按秒记录下来。按秒记录下来。问该厂生产的钟的误差是否服从正态分布?问该厂生产的钟的误差是否服从正态分布?5专业课件【引例引例3】某工厂制造了一批某工厂制造了一批骰子,声称它是均匀的。骰子,声称它是均匀的。 为检验骰子是否均匀,要把骰子实地投掷为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与若干次,统计各点出现的频率与1/6的差距。的差距。问题是:问题是: 得到的数据能否说明得到的数据能否说明“骰子均匀骰子均匀”的假的假设是可信的?设是可信的?6专业课件K.皮尔逊皮尔逊 解决这类问题的工具是英解决这类问题的工具是英国统计学家国统计学家K.皮尔逊在皮尔

4、逊在1900年发表的一篇文章中介绍了年发表的一篇文章中介绍了 2 检验法。检验法。7专业课件拟合优度检验的工具- 2 检验n2 检验法检验法是在总体是在总体 X 的分布未知时,的分布未知时,根据来自总体的样本,检验关于总根据来自总体的样本,检验关于总体分布的假设的一种检验方法。体分布的假设的一种检验方法。 8专业课件 H0:总体:总体 X 的分布函数为的分布函数为 F(x) 然后根据样本的然后根据样本的经验分布经验分布和所假设的和所假设的理论分布理论分布之间的吻合程度来决定是否接之间的吻合程度来决定是否接受原假设。受原假设。 这种检验通常称作这种检验通常称作拟合优度检验拟合优度检验,它,它是一

5、种是一种非参数非参数检验。检验。使用使用 2 检验法检验法对总体分布进行检验时,对总体分布进行检验时,先提出原假设先提出原假设:9专业课件拟合优度检验的一般步骤1.将总体将总体 X 的取值范围分成的取值范围分成 k 个互不重叠个互不重叠的小区间,记作的小区间,记作A1, A2, , Ak。 2.把落入第把落入第 i 个小区间个小区间 Ai 的样本值的个数的样本值的个数记作记作 fi ,称为,称为实测频数实测频数; 所有实测频数所有实测频数之和(之和(f1+ f2+ + fk)等于样本容量)等于样本容量 n。3.根据所假设的理论分布,可以算出总体根据所假设的理论分布,可以算出总体X 的值落入每个

6、的值落入每个 Ai 的概率的概率 pi,npi就是落就是落入区间入区间 Ai 的样本值的的样本值的理论频数理论频数。10专业课件皮尔逊引进如下统计量表示皮尔逊引进如下统计量表示经验分布经验分布与与理论分布理论分布之间的差异之间的差异:在理论分布在理论分布已知的条件下已知的条件下,npi是常量是常量实测频数实测频数理论频数理论频数4.观测频数观测频数与与理论频数理论频数比较,判断二者比较,判断二者不符合程度是否由于机会所造成。不符合程度是否由于机会所造成。11专业课件统计量统计量 的分布是什么的分布是什么?皮尔逊为什么会选用这个统计量皮尔逊为什么会选用这个统计量?两个问题:12专业课件关于第一个

7、问题,皮尔逊证明了如下关于第一个问题,皮尔逊证明了如下定理定理: 若原假设中的理论分布若原假设中的理论分布 F(x) 已经完全给定,已经完全给定,那么当那么当 n 时,统计量:时,统计量:的分布的分布渐近渐近 (k-1) 个自由度的个自由度的 分布。分布。 如果理论分布如果理论分布 F(x) 中有中有 r 个未知参数需用相个未知参数需用相应的估计量来代替,那么当应的估计量来代替,那么当 n 时,统计时,统计量量 的分布渐近的分布渐近 (k-1-r)个自由度的个自由度的 分布。分布。13专业课件皮尔逊定理的几点说明n统计量的选择统计量的选择n自由度的确定自由度的确定n连续性矫正连续性矫正14专业

8、课件统计量的选择n求求 k 个个 OiTi 之和,之和,显然它们恒等于显然它们恒等于0n求求 k 个个 (OiTi)2 之和,之和,得不出相对的不符合程度得不出相对的不符合程度nOi9、Ti6,OiTi3;Oi49、Ti46,OiTi3。前者的不符合程度远大于后者。前者的不符合程度远大于后者。n求求 k 个个 (OiTi)/Ti2 之和,之和,但仍有问题但仍有问题n如:如:Oi8、Ti5以及以及Oi80、Ti50时时 (OiTi)/Ti 都都等于等于0.6。15专业课件统计量的选择n为了解决上述问题,以为了解决上述问题,以 Ti 为权求加权值为权求加权值16专业课件自由度的确定变量之间存在着一

9、个制约关系:变量之间存在着一个制约关系:故统计量故统计量 渐近渐近 (k-1) 个自由度的个自由度的 分布。分布。17专业课件 在在 F(x) 尚未完全给定尚未完全给定的情况下,每个未知的情况下,每个未知参数用相应的估计量代替,就相当于增加一个参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个。制约条件,因此,自由度也随之减少一个。若有若有 r 个未知参数需用相应的估计量来代替,个未知参数需用相应的估计量来代替,自由度就减少自由度就减少 r 个。个。故统计量故统计量 渐近渐近 (k-1-r) 个自由度的个自由度的 分布。分布。18专业课件 如果根据所给的样本值如果根据

10、所给的样本值 X1,X2, ,Xn算得统算得统计量计量 的实测值落入拒绝域,则拒绝原假设,的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设。否则就认为差异不显著而接受原假设。得拒绝域得拒绝域:(不需估计参数不需估计参数)(估计估计 r 个参数个参数)根据根据皮尔逊皮尔逊定理,对给定的显著性水平定理,对给定的显著性水平 ,查查 分布表可得临界值分布表可得临界值 ,使得,使得19专业课件连续性矫正n当当df1时应做连续时应做连续性性矫正,矫正方法如矫正,矫正方法如下:下:20专业课件 皮尔逊定理是在皮尔逊定理是在 n 无限增大时推导出来的无限增大时推导出来的,因而在使用时要注意,

11、因而在使用时要注意 n 要足够大要足够大,以及,以及 npi 不太小不太小这两个条件。这两个条件。 根据根据计算实践计算实践,要求,要求 n 不小于不小于50,以及,以及npi 都不小于都不小于 5。否则应适当合并区间,使。否则应适当合并区间,使 npi 满足这个要求满足这个要求 。皮尔逊定理小结皮尔逊定理小结21专业课件 奥地利生物学家孟德尔进行了长达奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试验,并根据试八年之久的豌豆杂交试验,并根据试验结果,运用他的数理知识,发现了验结果,运用他的数理知识,发现了分离规律分离规律。孟德尔孟德尔 以遗传学上的一项伟大发现为例,说明统计以遗传学上的一项

12、伟大发现为例,说明统计方法在研究自然界和人类社会的规律性时,是方法在研究自然界和人类社会的规律性时,是起着积极的、主动的作用。起着积极的、主动的作用。22专业课件【例例1】子二代子二代子一代子一代黄色纯系黄色纯系绿色纯系绿色纯系他的一组观察结果为:他的一组观察结果为:黄黄70,绿,绿27近似为近似为2.59:1,与理论值相近。,与理论值相近。 根据他的理论,子二代中,黄、绿之比根据他的理论,子二代中,黄、绿之比 近近似为似为3:1,23专业课件这里,这里,n=70+27=97,k=2,检验孟德尔的检验孟德尔的3:1理论理论:提出假设提出假设H0: O-T=0 (p1=3/4,p2=1/4)理论

13、频数为:理论频数为: np1=72.75,np2=24.25实测频数为实测频数为70(黄黄),),27(绿绿)。)。24专业课件自由度为自由度为2-1=1未未落入拒绝域落入拒绝域。故认为试验结果符合孟德尔的故认为试验结果符合孟德尔的3:1理论。理论。按按 =0.05,自由度为,自由度为1,查表得,查表得由于统计量由于统计量=0.41583.84125专业课件【引例引例1】某地区某地区在在1500到到1931年的年的432年间,共爆发了年间,共爆发了299次战次战争,具体数据如下(每年爆发战争,具体数据如下(每年爆发战争的次数可以看作一个随机变量争的次数可以看作一个随机变量X):):战争次数战争

14、次数 X01234 22314248154 发生发生 X 次战争的年数次战争的年数26专业课件【例例2】引例引例1,检验每年爆发战争次数分布,检验每年爆发战争次数分布是否服从泊松分布。是否服从泊松分布。 按参数按参数 为为0.69的泊松分布,计算事件的泊松分布,计算事件X=i 的概率的概率pi ,pi的估计是:的估计是:H0:O-T=0 (X 服从参数为服从参数为 的的泊松分布)泊松分布)根据观察结果,得参数根据观察结果,得参数 的极大似然估计为:的极大似然估计为:解:解:将有关计算结果列表如下将有关计算结果列表如下:27专业课件2. 因因H0所假设的理论分布中有一个所假设的理论分布中有一个未

15、知参数未知参数 ,故自由度为故自由度为4-1-1=2。1. 将将npi 5的组予以合并,即将发生的组予以合并,即将发生3次及次及4次战争次战争的组归并为一组。的组归并为一组。28专业课件按按 =0.05,自由度为,自由度为4-1-1=2,查表得:,查表得:统计量统计量:未未落入拒绝域落入拒绝域。 故认为每年发生战争的次数故认为每年发生战争的次数 X 服从参数为服从参数为 0.69的泊松分布。的泊松分布。29专业课件 2 检验的另一应用-独立性检验独立性检验n是指研究是指研究两个或两个以上两个或两个以上的的计数资料计数资料(或属性资料)之间是否相互独立的(或属性资料)之间是否相互独立的假设检验,

16、先假设所观测的各属性之假设检验,先假设所观测的各属性之间没有关联,然后检验这种无关联的间没有关联,然后检验这种无关联的假设是否成立。假设是否成立。n方法方法1:列联表:列联表 2 检验检验30专业课件【例例】下表给出不同给药方式与给药效果下表给出不同给药方式与给药效果,问问给药方式与给药效果给药方式与给药效果是否有是否有关联关联。检验统计量:检验统计量:?31专业课件【例例】下表给出不同给药方式与给药效果下表给出不同给药方式与给药效果,求证:求证:给药方式与给药效果有无关联给药方式与给药效果有无关联。若事件若事件 A 和事件和事件 B 是相互独立的,则是相互独立的,则P(AB)=P(A)P(B

17、)32专业课件列联表 2 检验一般步骤1.提出零假设:假设实测数提出零假设:假设实测数与与理论数无差异。即理论数无差异。即H0:OT0。2.计算理论数:若事件计算理论数:若事件 A 和事件和事件 B 是相互独立的是相互独立的,则则 P(AB)=P(A)P(B)。n例如:例如:在给药方式和效果之间是相互独立的前提下,在给药方式和效果之间是相互独立的前提下,计算口服(事件计算口服(事件B)有效(事件)有效(事件A)的)的概率概率 P(BA)P(B)P(A) = (98/193) (122/193)。其。其理论数理论数T1(98/193)(122/193) 193 = (98)(122)/193 。

18、n每个理论值用每个理论值用Tij表示,表示,Tij=(i行总数行总数)(j列总数列总数)/总数。总数。33专业课件列联表 2 检验一般步骤3.计算计算 2 值:若值:若 2 2,则拒绝,则拒绝H0。4.确定确定 df:因为每一行的各理论数受该行总数:因为每一行的各理论数受该行总数约束,每一列的各理论数受该列总数约束,约束,每一列的各理论数受该列总数约束,所以所以 df(r-1)(c-1)。5.给出结论。给出结论。34专业课件2. 计算理论数:计算理论数:1. 零假设零假设H0:OT0Tij=(i行总数行总数)(j列总数列总数)/总数总数35专业课件3. 计算计算 2 值值36专业课件4. 确定

19、确定dfdf(r-1)(c-1) (2-1)(2-1) 1取取 =0.05,5. 给出给出结论:结论: 接受接受H0,不同给药方式的治疗效果没有显著,不同给药方式的治疗效果没有显著不同。不同。注意:本例的注意:本例的 df =1应当矫正,矫正后的应当矫正,矫正后的 2 值更值更小,不会影响结论,可以不再矫正。小,不会影响结论,可以不再矫正。37专业课件rc 列联表列联表 2 检验nrc列联表是列联表是 22 表的扩展;反之,表的扩展;反之, 22 表也可以看成是表也可以看成是 rc列联表的一个特例。列联表的一个特例。nrc 列联表理论数的计算与列联表理论数的计算与22列联表相列联表相同:同:n

20、Tij=(i行总数行总数)(j列总数列总数)/总数。总数。ndf=(r-1)(c-1)。38专业课件【例例】检查鱼的饲养方式与鱼的等级是否有检查鱼的饲养方式与鱼的等级是否有关,设计了如下试验:按不同方式分为三种关,设计了如下试验:按不同方式分为三种网箱饲养类型:网箱饲养类型:A、B、C,统计不同饲养方,统计不同饲养方式下鱼的等级情况,得如下数据,试分析。式下鱼的等级情况,得如下数据,试分析。 等级等级饲养方式饲养方式总数总数ABC甲甲22181656乙乙18161448丙丙11131438丁丁8111029总数总数59585417139专业课件等级等级饲养方式饲养方式总数总数ABC甲甲22(1

21、9.32)18(18.99)16(17.68)56乙乙18(16.56)16(16.28)14(15.16)48丙丙11(13.11)13(12.89)14(12.0)38丁丁8(10.01) 11(9.84) 10(9.16)29总数总数5958541712. 计算理论数:计算理论数:1. 零假设零假设H0:OT0Tij=(i行总数行总数)(j列总数列总数)/总数总数40专业课件3.计算计算2值值41专业课件等级等级饲养方式饲养方式总数总数ABC甲甲22(19.32)18(18.99)16(17.68)56乙乙18(16.56)16(16.28)14(15.16)48丙丙11(13.11)1

22、3(12.89)14(12.0)38丁丁8(10.01) 11(9.84) 10(9.16)29总数总数5958541714. 计算计算df:df=(r-1)(c-1) =(4-1)(3-1) =642专业课件 接受原假设,即商品鱼的规格与饲接受原假设,即商品鱼的规格与饲养方式无关。养方式无关。5. 结论结论43专业课件rc 列联表列联表 2 检验的局限性与吻合度检验一样,理论数不得小于与吻合度检验一样,理论数不得小于5。44专业课件22 列联表的精确检验法列联表的精确检验法aba + bcdc + da + c b + dN45专业课件0443253691342353692241453693

23、14055369表1表2表3表44536946专业课件044325369表145369根据组合公式, 9分解为4和5,共: 9分解为3和6,共:9在行间分解为4和5,在列间分解为3和6,共:根据组合公式, 9分解为0,4,3和2,共:47专业课件044325369表145369出现表1的概率是:48专业课件044325369134235369224145369314055369表1表2表3表4各列联表的概率:各列联表的概率:49专业课件求任一列联表概率的通式:求任一列联表概率的通式:aba + bcdc + da + c b + dN注意:注意:原假设是处理间不存在差异;原假设是处理间不存在差

24、异;如果如果 P ,接受原假设;,接受原假设;如果如果 P ,接受备择假设。,接受备择假设。50专业课件饲料未增重/只增重/只总数A415B066总数4711【例例1】用两种饲料用两种饲料 A 和和 B 饲养小白鼠,一周后测饲养小白鼠,一周后测小白鼠增重情况(如下表)。问用小白鼠增重情况(如下表)。问用不同饲料不同饲料饲养的饲养的小白鼠体重是否小白鼠体重是否存在差异存在差异?51专业课件饲料未增重/只增重/只总数A415B066总数4711解:解:1. 原假设原假设H0:两种饲料的饲养效果相同:两种饲料的饲养效果相同2. 计算计算 P 值值52专业课件饲料未增重/只增重/只总数A415B066

25、总数4711解:解:3. 结论结论双侧检验,双侧检验,P 值与值与 /2比较比较P =0.015 0.025接受原假设,男女对该药物的反应没区别。接受原假设,男女对该药物的反应没区别。57专业课件适合性检验适合性检验独立性检验独立性检验变异变异性性检验检验2检验的应用(小结)58专业课件1. 变异性检验n在在连续型资料连续型资料的假设检验中,对的假设检验中,对一个假一个假设的总体标准差设的总体标准差的同质性检验。的同质性检验。n【例例】一个混杂的小麦品种,株高标准差一个混杂的小麦品种,株高标准差014 cm,经提纯后随机抽出,经提纯后随机抽出10 株,它们的株高为:株,它们的株高为:90、10

26、5、101、95、100、100、101、105、93、97 cm,考查提纯后的群体是否比原群体整齐?,考查提纯后的群体是否比原群体整齐?n检验统计量:检验统计量:59专业课件2. 适合性检验n是指通过一定的理论分布推算出样本的是指通过一定的理论分布推算出样本的理论数,然后用理论数,然后用实际观测值与理论数实际观测值与理论数相相比较,从而判断实际观测值与理论数之比较,从而判断实际观测值与理论数之间是否吻合(吻合度检验)。间是否吻合(吻合度检验)。n检验统计量检验统计量60专业课件2.适合性检验-二项分布的检验n【例例1】独立分配规律的验证。独立分配规律的验证。子二代子二代子一代子一代黄色纯系黄

27、色纯系绿色纯系绿色纯系61专业课件2.适合性检验-泊松分布的检验n【例例2】某地区某地区在在1500到到1931年的年的432年年间,共爆发了间,共爆发了299次战争,检验每年爆发次战争,检验每年爆发战争次数分布是否服从泊松分布(上次战争次数分布是否服从泊松分布(上次课内容)。课内容)。62专业课件3.独立性检验n是指研究是指研究两个或两个以上两个或两个以上的的计数资料计数资料(或属性资料)之间是否相互独立的(或属性资料)之间是否相互独立的假设检验,先假设所观测的各属性之假设检验,先假设所观测的各属性之间没有关联,然后检验这种无关联的间没有关联,然后检验这种无关联的假设是否成立。假设是否成立。63专业课件检验统计量:检验统计量:64专业课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号