生物统计-分类资料的假设检验(本科)课件

上传人:我*** 文档编号:143843012 上传时间:2020-09-02 格式:PPT 页数:76 大小:795.50KB
返回 下载 相关 举报
生物统计-分类资料的假设检验(本科)课件_第1页
第1页 / 共76页
生物统计-分类资料的假设检验(本科)课件_第2页
第2页 / 共76页
生物统计-分类资料的假设检验(本科)课件_第3页
第3页 / 共76页
生物统计-分类资料的假设检验(本科)课件_第4页
第4页 / 共76页
生物统计-分类资料的假设检验(本科)课件_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《生物统计-分类资料的假设检验(本科)课件》由会员分享,可在线阅读,更多相关《生物统计-分类资料的假设检验(本科)课件(76页珍藏版)》请在金锄头文库上搜索。

1、第十三章 分类资料的假设检验,相对数:一般的相对数,是两个有联系的指标的比值,它可以从数量上反映两个相互联系的现象之间的对比关系。 强度相对数:在一定范围内,某现象的发生数与可能发生某现象的总数之比,说明某现象出现的强度或频度(即频繁的程度)。计算公式为: 强度相对数=某现象的发生数/可能发生某现象的总数100(或1000) 例如:某部队某年发生菌痢136人次,该部队同年平均人数为14,080人。求该部队的痢疾发病率。 痢疾发病率=136/1408010000=9.66 即平均每千人中有9.7人发病。,第十三章 分类资料的假设检验,结构相对数:结构相对数(比)表示某部分在全部分中所占比重。 计

2、算公式为:结构相对数=某一构成部分的例数/各构成部分例数之和100% 全体内各组结构相对数的总和应为100%. 例如:医学教育网搜集整理某年某地区各种疟疾发病例数为:恶性疟68名,间日疟12名,三日疟17名。则三种疟疾分别占疟疾患者总数的百分比为: 恶性疟=68/(68+12+17)100%=70.1% 间日疟=12/(68+12+17)100%=12.4% 三日疟=17/(68+12+17)=17.5% 各部分百分比之和为100%,即 70.1%+12.4%+17.5%=100%,三个鸡场某年雏鸡死亡率,平均率 (合并率),ni相等,ni不相等,率的假设检验:在分类资料中,最简单情况只有两个

3、类别,率就是其中某个类别出现的概率。如成活率、死亡率、治愈率等。 分类资料作假设检验的根据:当样本中的个体相互独立时,某个类别的个体数服从二项分布。,Jacob Bernoulli (16541705), Swiss scientist, known for Bernoulli trial.,单个率的假设检验: 检验某个类别出现的概率P是否等于理论概率P 0,例 某牛场采取性别控制技术提高新生犊中母犊的比例。实施该技术的 6 头母牛产 2 头公犊和 4 头母犊,问该技术是否有效? 解:H 0 :无效,新生犊中母犊的比例仍为0.5 , H A :有效 , 新生犊中母犊的比例大于0.5,例 有人在

4、孵化的鸡蛋内注入雌性激素,以期达到性别控制的目的,孵出20只小鸡中公母的比例为 614,问这一措施能否提高雌性比例? 解:H 0 :无效,孵出的小鸡中雌性比例仍为0.5 , H A :有效,孵出的小鸡中雌性比例大于0.5 。,相伴概率?,例:有人在孵化的鸡蛋内注入雌性激素,以期达到性别控制的目的,孵出的40只小鸡中公母的比例为12 28,问这一措施能否提高雌性比例? 解:H 0 :无效,孵出的小鸡中雌性比例仍为0.5 , H A :有效,孵出的小鸡中雌性比例大于0.5 。,率的区间估计 当XB(n,P),X的观测值为x,p=x/n 时,E(p)=P,Var(p)=P(1-P)/n,,两个率的比

5、较: (1)利用两个独立样本进行率的比较 设n1 , x1 , p1 , P1 ,分别表示第一个样本的样本含量、某个类别出现的次数、样本的率及总体的率,设n2 , x2 , p2 , P2 ,分别表示第二个样本的样本含量、某个类别出现的次数、样本的率及总体的率。,例:研究抽烟人的死亡率是否高于不抽烟人,结果如下,试作统计分析。,解:H 0:P1= P2,H A:P1 P2,(2)利用配对样本进行率的比较 例:比较两种药物的疗效,将性质相同的个体进行两两配对,对内两个个体分别接受药物A和B,试验结果如下:,放弃结果相同的个体,利用结果不同的个体进行检验。 设r+s=n,pA =r/n, pB =

6、s/n, H 0 为pA = pB , 则可构成统计量如下:,r+s=n=30,pA =r/n=0.7,Z=2.011.96,因此否定 H 0 ,认为pA pB 。,参数检验中,2- 检验即利用一个服从2分布的检验统计量来进行检验。 一般分为:适合性检验与独立性检验,卡(平)方检验( Chi-square test)概论,一、概念,资料的分类(types of data),(一) 连续性资料 (continuous data),(二) 离散性资料(discrete data),2- 检验原理:(Pearson定理),视作理论值E i,当p1, p2, pr是总体的真实概率分布,n为样本容量,n

7、i为样本中第i种属性出现的次数,当n时,统计量,视作观测值O i,二、2 的理论分布,df=属性分类数r-约束条件数,三、2 值的矫正,计数资料是间断型资料,而2 分布是连续型分布,因此在计算时需要注意:,(一) 当 df=1,(二),否则会使统计量明显地偏离卡平方分布,可能会导致错误的结果,四、2 检验的步骤,接受H0,接受HA,五、2 检验的应用,(一) 用于适合性检验,(二) 用于独立性检验,适合性检验,1、检验总体是否服从某个指定的分布,2、实验结果与先验理论的适合性,检验总体是否服从某个指定的分布,(1)设指定的分布的分布函数为F(x)。,(2)计数观察次数,将 x 取值的区域分成

8、r 个不相重合的小区间,统计样本含量为 n 的一次抽样中,观测值落入各个小区间的次数,得到O i,(3)计算理论次数,根据F(x)计算在指定分布下,x 落入各个小区间的概率p i ,得到E i = n p i,对分布类型的适合性检验 1)二项分布的适合性检验 例 某猪场116窝产仔数据,每窝均有5头仔猪,统计窝产公猪数目如表,试检验窝产公猪数是否服从二项分布。,2)泊松分布的适合性检验 例 在不同显微镜视野内观察细菌数资料如表,试检验细菌数是否服从泊松分布。,例 用血球计数板计数每微升培养液中的酵母细胞,数据如下表中的前两列。问此细胞计数数据是否符合Poisson分布?,3)正态分布的适合性检

9、验:现有200头母猪所产仔猪一月龄窝重的分组资料如表,试检验窝重是否服从正态分布。,例:调查某地200名男孩的身高,平均值139. 5,标准差7.42,分组数据见下表,试检验男孩的身高是否服从正态分布?,群体中性别比例是否符合11 的理论比例?群体中各种基因型的比例是否符合12 1 的假设?,二、实验结果与先验理论的适合性,对不同类型分布比例的适合性检验 例 果蝇的颜色受一对基因A和 a 的控制,AA与Aa 表现为灰色,a a表现为黑色。翅膀的形状受一对基因B和 b 的控制,BB与Bb 表现为长翅,b b表现为残翅。用AABB与a a b b型交配得到子一代,子一代再交配得到子二代,各表型的数

10、量为:灰色长翅175,灰色残翅42,黑色长翅38,黑色残翅25,试检验四种表型的比例是否符合孟德尔的自由组合定律93 31 ?,Gregor Johann Mendel (18221884), Augustinian priest and scientist, knownfor discovering genetics,H 0:符合,H A:不符合。 175+42+38+25=280,四种表型的理论值为,灰色长翅2809/16=157.5,实际值175, 灰色残翅2803/16=52.5 ,实际值42, 黑色长翅2803/16=52.5 ,实际值38, 黑色残翅2801/16=17.5,实际值

11、25,,例:红米非糯稻和白米糯稻杂交,子二代检测179株,数据如下表,问子代分离是否符合9:3:3:1的规律?,例:已知牛血液中白细胞类型的理论比例为嗜酸性白细胞占7%,嗜碱性白细胞占1%,嗜中性白细胞占31%,淋巴细胞占54%,大单核细胞占7%。今有一头牛,血样中各类型白细胞的频数分别为嗜酸性白细胞2个,嗜碱性白细胞1个,嗜中性白细胞9个,淋巴细胞占15个,大单核细胞3个,试问该病牛的血象是否异常。,RC列联表的独立性检验,将研究对象按照两种标志进行分类,如果按照其中一种标志分作 r 类,按照另一种标志分作 C 类 , 共计rC类 ,将分类结果汇总成 r 行 c 列的表 , 称为 RC 列联

12、表(Contingency table)。,列联表的独立性检验的目标: 用于检验两个事件是否相互独立; 通常是检验处理方法与效果是否相互独立; 可以间接推断不同处理效果间差异的显著性;,例为了解某种药品对某种疾病的疗效是否与患者的年龄有关,91名老年患者、100名中青年患者、109名儿童患者的疗效记录,整理后得到3 3列联表如下:,要检验疗效与患者的年龄是否相互独立?,例:检验某种药物的给药方式与效果是否相互独立?,如果药物的给药方式与效果是相互独立的,就可推断这两种给药方式的效果没有差异,独立性检验的方法 0 :不同处理与不同类别的概率分布无关(独立); :不同处理与不同类别的概率分布有关(

13、相关)。,在H0成立的前提下,例:检验新措施治病的效果,例:检验两地区水牛体型有无差异。,22表的精确概率检验法 对于22 列联表,当出现理论频数小于 5 时,由于不能进行合并,便不能应用卡平方法进行独立性检验,为此,Fisher根据排列组合及概率论知识提出精确概率检验法,现举例说明。 例:检验两药的疗效有无显著的差别 H0:两药的疗效无 显著的差别 HA:两药的疗效有 显著的差别,这里行边际和为9和9,列边际和为11和7,保持这些边际和不变,任意变动4个格子中的数。 由于,O11 + O12 =9, O21 + O22 =9,O11 + O21 =11, O12 + O22 =7,因此在4个

14、格子中只有一个格子的数是可以自由变动的,一共有8种情形: (1) (2) (3) (4) (5) (6) (7) (8),H0:两种处理无 显著的差别 HA:两种处理有 显著的差别,检验时只检验类型不同的频数(即b和c)有无显著的差别,配对22表的独立性检验法,例某牛场采取性别控制措施来提高产母犊的概率,40头犊牛中有25头为母犊。问能否据此推断该措施有效? 解:H 0 为这一措施无效,产出母犊的比例仍为 0.5 , H A 为这一措施有效,产出母犊的比例大于0.5 。,卡平方检验的分解 例13-7 果蝇的颜色受一对基因A和 a 的控 制,AA与Aa 表现为灰色,a a表现为黑色。翅 膀的形状

15、受一对基因B和 b 的控制,BB与Bb 表 现为长翅,b b表现为残翅。用AABB与a a b b 型交配得到子一代,子一代再交配得到子二代, 各表型的数量为:灰色长翅175,灰色残翅42, 黑色长翅38,黑色残翅25,试检验四种表型的 比例是否符合孟德尔的自由组合定律93 3 1 ? 结论为4种表型的比例不符合93 3 1,进一步,将卡平方检验进行分解,两对相对性状杂交子二代4种表现型A-B-、A-bb、aaB-、aabb的观察次数依次为152、39、53、6,问这两对性状的遗传是否符合孟德尔遗传规律中9331的比例。,因为20.05(3) 2 20.01(3), 故0.01P0.05,表明

16、实际观察次数与理论观察次数差异显著,即该资料不符合9331的遗传规律,有必要进一步检验,以具体确定哪样的表现型的实际观察次数不符合9331的比例。这时须采用2检验的再分割法。,检验A-B-,A-bb, aaB- 3种表现型是否符合 933的比例。分割后2值(记为 ),计算表(理论比例933),df1=3-1=2,查2值表得,2 0.05(2)=5.991,P0.05,表明实际观察次数与理论观察次数差异不显著,可以认为3种表现型符合933的理论比例,2. 检验aabb表现型与其它三种表现型的合并组是否符合1:15的比例,分割后2值(记为 ),由df2 =2-1=1,2 0.05(12)=3.841,P0.05,表明实际观察次数与理论次数差异显著,即aabb表现型与其它三种表现型组合不符合115的比例,这样的结论可为我们进一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号