离散型随机变量的参数估计与检验

上传人:人*** 文档编号:586618765 上传时间:2024-09-05 格式:PPT 页数:37 大小:445.50KB
返回 下载 相关 举报
离散型随机变量的参数估计与检验_第1页
第1页 / 共37页
离散型随机变量的参数估计与检验_第2页
第2页 / 共37页
离散型随机变量的参数估计与检验_第3页
第3页 / 共37页
离散型随机变量的参数估计与检验_第4页
第4页 / 共37页
离散型随机变量的参数估计与检验_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《离散型随机变量的参数估计与检验》由会员分享,可在线阅读,更多相关《离散型随机变量的参数估计与检验(37页珍藏版)》请在金锄头文库上搜索。

1、第六章 离散型变量的参数估计与检验1 1、总体率总体率:在伯努利概型中,事件:在伯努利概型中,事件A A出现的概率出现的概率P P(A A)称为总体率,它通常是一个未知的参数。)称为总体率,它通常是一个未知的参数。2 2、样本率样本率:在伯努利概型中,若容量为:在伯努利概型中,若容量为n n的某的某样本中事件样本中事件A A出现出现m m次,则事件次,则事件A A出现的频率的出现的频率的f f = m/n = m/n 称为样本率,它通常是一个统计量。称为样本率,它通常是一个统计量。一、总体率的区间估计一、总体率的区间估计定理定理 若若XB(n,p),则,则 证:证:3 3、小样本时总体参数的估

2、计、小样本时总体参数的估计 由定理知,样本率是总体率的无偏估计量。由定理知,样本率是总体率的无偏估计量。可查统计用表可查统计用表,得到得到p的置信区间的置信区间(p1,p2)例例1 用某种中医疗法治疗青少年近视用某种中医疗法治疗青少年近视15例例,其中其中10人近期有效人近期有效,求该法近期有效率求该法近期有效率95%置信区间置信区间 解:解:15例中的近期有效人数服从二项分布例中的近期有效人数服从二项分布 m=10,n-m=5,1-=0.95,查表得查表得p1=0.384,p2=0.882 近期有效总体率近期有效总体率p的的95%置信区间置信区间(0.384,0.882) A是大量伯努利试验

3、中的稀有事件是大量伯努利试验中的稀有事件,A出现次数出现次数XP(k;),总体均数总体均数EX=,总体方差总体方差DX=小样本时小样本时,根据根据n个单元的样本计数个单元的样本计数c查统计用表查统计用表,可得到可得到n的置信区间的置信区间(n1,n2),上上,下限分别除以下限分别除以n,即得总体均数即得总体均数的置信区间的置信区间 例例2 用计数器测量某种放射性标本用计数器测量某种放射性标本,3分钟读数分钟读数45,求每分钟读数的求每分钟读数的95%置信区间置信区间 泊松概率模型的参数估计泊松概率模型的参数估计每分钟读数服从泊松分布每分钟读数服从泊松分布 c=45,n=3,1-=0.95,查表

4、查表31=32.82,32=60.21 故每分钟读数即总体均数故每分钟读数即总体均数的的95%置信区间为置信区间为 =(10.94,20.07) 3.1.2 大样本时总体参数的估计大样本时总体参数的估计 定理定理2 XB(k;n,p),n足够大足够大,总体率总体率p的的1-置信区间为置信区间为 由定理由定理1,n足够大时足够大时,近似有近似有 N(0,1) 用频率代替概率用频率代替概率p,用用近似率的标准误近似率的标准误 N(0,1) 故总体率故总体率p的的1-置信区间为置信区间为 二项总体在样本容量二项总体在样本容量n50时时,总体率总体率p的置信区间为的置信区间为 泊松总体在泊松总体在n个

5、单元的样本计数个单元的样本计数c50时时,近似有近似有 N(0,1) 从而从而n的的1-置信区间为置信区间为 例例3 复方当归注射液治疗脑动脉硬化症复方当归注射液治疗脑动脉硬化症188例例,显效显效83例例,求复方当归注射液显效率的求复方当归注射液显效率的95%置信区间置信区间 188例患者中显效人数服从二项分布例患者中显效人数服从二项分布 n=188,m=83,得得故复方当归注射液显效率故复方当归注射液显效率p的的95%置信区间为置信区间为 =(0.3705,0.5125) 3.1.3 单样本的假设检验单样本的假设检验 二项总体在样本容量二项总体在样本容量n50时时对对H0:pp0,可用可用

6、u统计量统计量检验总体率检验总体率p与常量与常量p0的差异是否有统计意义的差异是否有统计意义 前提前提信息信息H1H0统计量统计量P值值拒拒H0二项二项分布分布n50 pp0pp0查双尾查双尾Pp与与p0不等不等p p0查单尾查单尾p p0查单尾查单尾泊松总体在泊松总体在n个单元的样本计数个单元的样本计数c50时时对对H0:0,可用,可用u统计量统计量检验检验与常量与常量0的差异是否有统计意义的差异是否有统计意义 例例4 胃溃疡患者胃溃疡患者20%发生胃出血症状发生胃出血症状,某医院观某医院观察察65岁以上胃溃疡患者岁以上胃溃疡患者304例例,有有96例发生胃出血例发生胃出血症状症状,65岁以

7、上患者是否比较容易胃出血?岁以上患者是否比较容易胃出血? 304例患者中胃出血人数服从二项分布例患者中胃出血人数服从二项分布 n=304,m=96,得得H0:p0.20,H1:p0.20 双尾概率双尾概率P p2单尾单尾p1 0.05,只能以,只能以0.05水准的单侧检水准的单侧检验接受验接受H0,p1与与p2的差异无统计意义,认为两批的差异无统计意义,认为两批首乌注射液的变质率相同首乌注射液的变质率相同3.1.5 分类资料分类资料的检验方法选择的检验方法选择 两组小样本分类资料不能使用两组小样本分类资料不能使用u检验检验,多组分类资料多组分类资料也不宜直接进行两两间的也不宜直接进行两两间的u

8、检验检验,因为这可能加大犯因为这可能加大犯第一类错误的概率第一类错误的概率.分类资料把数据按两个或更多属分类资料把数据按两个或更多属性分类编成列联表性分类编成列联表,选择相应的检验方法选择相应的检验方法 例例6 乙型脑炎重症病人乙型脑炎重症病人204例随机分为两组例随机分为两组,用某用某中草药方剂治疗中草药方剂治疗,其中一组人工牛黄其中一组人工牛黄.病人根据治疗病人根据治疗方法和治疗效果进行无重复无遗漏的完全分类方法和治疗效果进行无重复无遗漏的完全分类 组别组别治愈治愈未愈未愈合计合计不加牛黄不加牛黄324678加牛黄加牛黄7650126合计合计10896204把全部数据按两个分类原则进行完全

9、分类列成的频把全部数据按两个分类原则进行完全分类列成的频数表格称为列联表数表格称为列联表,分类频数排成分类频数排成R行行C列的列联表列的列联表称为称为RC列联表列联表, 22列联表也称为四格表列联表也称为四格表 3.2 计数资料的分析计数资料的分析 3.2.1 RC表独立性检验表独立性检验 例例1 为了解铅中毒病人是否有尿棕色素增加现象,为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组作定性检查分别对病人组和对照组作定性检查组别组别阳性数阳性数阴性数阴性数合计合计病人组病人组29(18.74)7(17.26)36对照组对照组9(19.26)28(17.74)37合计合计383573

10、双向无序双向无序,病人组阳性样本率病人组阳性样本率对照组阳性样本率对照组阳性样本率样本推断病人组样本推断病人组,对照组的阳性总体率对照组的阳性总体率p1,p2是否不是否不同同,需检验假设需检验假设H0:p1=p2H0可写为可写为“分组分组”对对“阳性数阳性数”无影响无影响,改写为改写为“分组分组”与与“阳性数阳性数”独立独立,双向无序表列联表独立性检验双向无序表列联表独立性检验 在在H0:“分组分组”与与“阳性数阳性数”独立假设下独立假设下,全部数据视为全部数据视为一个总体的样本一个总体的样本,计算阳性联合样本率计算阳性联合样本率,作为阳性总作为阳性总体率的估计值体率的估计值,称阳性理论率称阳

11、性理论率,用理论率推算样本各用理论率推算样本各实际频数实际频数Oij的估计值的估计值,称理论频数或经验频数称理论频数或经验频数Eij 病人组阳性理论频数病人组阳性理论频数 阴性理论频数阴性理论频数 对照组阳性理论频数对照组阳性理论频数 阴性理论频数阴性理论频数 分类变量分类变量X的分类标志为的分类标志为X1,XR,分类变量分类变量Y的分类的分类标志为标志为Y1,YC,实际频数的行合计记为实际频数的行合计记为O1,OR,实实际频数的列合计记为际频数的列合计记为O1,OC,总频数记为总频数记为N分类分类Y1YC合计合计X1O11(E11)O1C(E1C)O1XROR1(ER1)ORC(ERC)OR

12、合计合计O1OCN列联表双向无序列联表双向无序,理论频数理论频数Eij等于等于所在行与列的合计数之积除以所在行与列的合计数之积除以N,在在H0:X与与Y独立假设下独立假设下,实际频数实际频数Oij与理论频数与理论频数Eij的差异是随机误差的差异是随机误差,Pearson用卡方统计量用卡方统计量 df(R1)(C1)反映实际反映实际Oij与理论与理论Eij吻合程度吻合程度,称称Pearson卡方检验卡方检验 定理定理1 Pearson卡方统计量卡方统计量 df1时用定理时用定理1计算卡方统计量可不写出理论频数计算卡方统计量可不写出理论频数若若RC列联表中理论频数出现小于列联表中理论频数出现小于1

13、或理论频数小或理论频数小于于5的格数超过总格数的格数超过总格数1/5时时,则必须增大样本例数则必须增大样本例数,或把理论频数太小的行或把理论频数太小的行,列与性质相近的邻行列与性质相近的邻行,列合列合并并,或删去理论频数太小的行或删去理论频数太小的行,列列 例例2 判断患鼻咽癌与血型有无关系判断患鼻咽癌与血型有无关系 分类分类A型血型血B型血型血O型血型血AB型型血血合计合计患癌者患癌者648613020300健康人健康人12513821026499合计合计18922434046799第一行合计数第一行合计数,第四列合计数最小第四列合计数最小,最小理论频数最小理论频数 H0:“患癌患癌”与与“

14、血型血型”独立独立,H1:“患癌患癌”与与“血型血型”不独立不独立 =1.921 df(21)(41)3,单尾概率,单尾概率P0.25以以0.05水准的单侧检验接受水准的单侧检验接受H0两组总体率的差异无统计意义两组总体率的差异无统计意义,患癌与血型没有关系患癌与血型没有关系 3.2.2 四格表独立性检验四格表独立性检验 定理定理2 df1,Pearson卡方卡方 O11E11 O12E12O21E21O22E22 双双向向无无序序四四格格表表,N40且且所所有有理理论论频频数数大大于于5,用用Pearson卡方统计量卡方统计量, 若所得若所得P,改用确切概率法改用确切概率法N40,理论频数小

15、于理论频数小于5(但但1),用校正卡方统计量用校正卡方统计量df1 N40,第一行合计数、第二列合计数最小,第一行合计数、第二列合计数最小最最小小理理论论频频数数5 Pearson卡方检验卡方检验 H0:“中毒中毒”与与“阳率阳率”独立独立,H1:“中毒中毒”与与“阳率阳率”不独立不独立df1,双尾概率双尾概率P40,第一行合计数、第一列合计数最小第一行合计数、第一列合计数最小 最最小小理理论论频频数数0.05.以以0.05水准单侧检验接受水准单侧检验接受H0,差异无统计意义差异无统计意义,不能认为两种服的皮炎患病率不同不能认为两种服的皮炎患病率不同 3.3 等级资料的分析等级资料的分析 3.

16、3.1 Ridit分析分析 例例1 中药与传统西医两种方法治疗小儿急性痢疾中药与传统西医两种方法治疗小儿急性痢疾 组别组别痊愈痊愈显效显效好转好转无效无效合计合计中医组中医组6826153112西医组西医组7373882551155单向有序单向有序24列联表列联表,不宜用卡方检验不宜用卡方检验,可用可用Ridit分析分析 relative to an identified distribution与与unit选一个大容量样本作基准称为参照组选一个大容量样本作基准称为参照组,分分k个等级个等级,第第i等级频数为等级频数为mi(1ik),参照组样本容量为,参照组样本容量为n 第第i等级的频率等级的

17、频率 定义定义1 参照组前参照组前i1个等级的频率与第个等级的频率与第i等级频率等级频率之半的和之半的和,称第称第i等级的参照单位或等级的参照单位或R值值,记为记为Ri (2ik1) 定理定理1 参照组参照组R值的样本均数值的样本均数 R值样本均数为各等级频数与相应值样本均数为各等级频数与相应R值的加权平均值的加权平均其它样本称为对比组其它样本称为对比组,均以参照组的均以参照组的R值为各等级值为各等级的标准的标准.对比组对比组R值的样本均数值的样本均数,按各等级频数与相按各等级频数与相应参照组应参照组R值的加权平均计算值的加权平均计算,一般与一般与0.5有差异有差异 Bross指出指出,R值理

18、论分布为值理论分布为0,1均匀分布均匀分布,密度函数密度函数f(x)1(0x1),总体均数总体均数1/2,总体方差总体方差1/12 定理定理2 n足够大足够大,R值总体值总体均数均数R的的1-置信区间置信区间 对比组对比组R值值总体均数总体均数 样本均数样本均数的标准误的标准误 近似服从近似服从N(0,1) R的的1-置信区间置信区间 对比组对比组R置信区间比较置信区间比较,称称Ridit或参照单位分析或参照单位分析 3.3.2 单个对比组的分析单个对比组的分析 对比组对比组n50, 据参照组据参照组R值作值作R的的1-置信区间置信区间.若若置信区间不含置信区间不含0.5,则以水准则以水准拒绝

19、拒绝H0:R=0.5.若对若对比组等级按比组等级按“差差”到到“好好”顺序排列顺序排列,则样本均数则样本均数0.5表示优于参照组表示优于参照组 参照组的样本容量参照组的样本容量n应尽可能取大应尽可能取大 西医组为参照组,西医组为参照组,n西西1155很大很大 等级等级k痊愈痊愈显效显效好转好转无效无效合计合计频数频数mi7373882551155频率频率fi0.63810.33590.02170.00431.0000Ri值值0.31910.80610.98490.9979H0:中医组中医组R值总体均数值总体均数中中=0.5,H1:中中0.5 中医对比组样本容量中医对比组样本容量n中中=11250,R值样本均数值样本均数 =0.5395 中中95%置信区间置信区间 =(0.4860,0.5930) 置信区间包含置信区间包含0.5,只能以,只能以0.05水准接受水准接受H0, 差异无统计意义差异无统计意义,不能认为中医与西医组疗效不同不能认为中医与西医组疗效不同

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号