定型数据分析习题答案

上传人:suns****4568 文档编号:89232952 上传时间:2019-05-21 格式:DOC 页数:35 大小:1.38MB
返回 下载 相关 举报
定型数据分析习题答案_第1页
第1页 / 共35页
定型数据分析习题答案_第2页
第2页 / 共35页
定型数据分析习题答案_第3页
第3页 / 共35页
定型数据分析习题答案_第4页
第4页 / 共35页
定型数据分析习题答案_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《定型数据分析习题答案》由会员分享,可在线阅读,更多相关《定型数据分析习题答案(35页珍藏版)》请在金锄头文库上搜索。

1、作业中的一些错误情况1:解题过程不完整,没有明确指出所检验的假设和检验统计量。2:算错检验统计量的值,或算错检验的p值。(P27Ex2)解法一:总体总共分3类,要检验顾客是否对这三种肉食的喜好程度相同,这是一个分布的拟合优度检验问题。(1)要检验的原假设为 :顾客对这三种肉食的喜好程度相同,即要检验:顾客对这三种肉食的喜好程度的分布为,(2)取检验统计量,检验分布为; (3)题中,则检验统计量的值为(计算过程略)(4)计算P值为: ,故在水平下拒绝,即调查数据不符合该均匀分布.解法二(采用似然比检验+p值形式)(1)要检验的原假设为 :顾客对这三种肉食的喜好程度相同,即要检验:顾客对这三种肉食

2、的喜好程度的分布为,(2)选取似然比检验统计量,检验分布为;(3)题中,则检验统计量的值为(计算过程略)(4)计算P值为: ,故在水平下拒绝,即顾客对这三种肉食的喜好程度的分布不是均匀分布.注:若显著性水平取,则临界值为。(P27Ex3)解法一:总体总共分10类,这是一个分布的拟合优度检验问题。(1)要检验的原假设为:学生对这十门课的选择没有倾向性,即要检验:学生选择这十门课的人数分布为,(2)取检验统计量,检验分布为; (3)题中,则检验统计量的值为(计算过程略)(4)计算P值为: ,故在水平下不能拒绝,即认为学生对这十门课的选择没有倾向性.解法二(采用似然比检验+ p值形式)(1)要检验的

3、原假设为:学生对这十门课的选择没有倾向性,即要检验:学生选择这十门课的人数分布为。(2)选取似然比检验统计量,检验分布为; (3)题中,则检验统计量的值为(计算过程略)(4)计算P值为: ,故在水平下不能拒绝,即认为学生对这十门课的选择没有倾向性.注:若采用拒绝域法,临界值为。(P27Ex4)解法一:(采用卡方拟合优度检验法+拒绝域形式)(一)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设为:股票投资的盈亏分布为,统计得到的频数分别为1697,1780,2129。(2)取检验统计量,拒绝域为,(3)对显著性水平,临界值为,(4)题中,则检验统计量的值为故在水平下拒绝,

4、即调查数据不符合该偏好分布.(二)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设仍为:股票投资的盈亏分布为,统计得到的频数分别为151+122,240,517+240。(2)取检验统计量,拒绝域为,(3)对显著性水平,临界值为,(4)题中,则检验统计量的值为故在水平下拒绝,即调查数据不符合该偏好分布.解法二:(采用似然比检验法+拒绝域形式) (一)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设为:股票投资的盈亏分布为,统计得到的频数分别为1697,1780,2129。(2)选取似然比检验统计量,检验分布为,拒绝域为(3)对显著性水平,临界值为

5、,(4)题中,则检验统计量的值为故在水平下拒绝,即调查数据不符合该偏好分布.(二)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设仍为:股票投资的盈亏分布为,统计得到的频数分别为273,240,757。(2)选取似然比检验统计量,检验分布为,拒绝域为(3)对显著性水平,临界值为,(4)题中,则检验统计量的值为故在水平下拒绝,即调查数据不符合该偏好分布.注1:有同学混淆了两种解法(卡方拟合优度检验法与似然比检验法)的记号与称呼。注2:本题中两种方法得到的检验统计量的值相差很大。(P28Ex5)解法一:(卡方拟合优度检验)总体总共分3类,分布中有1个未知参数,这是一个含参数

6、的分布检验问题。(1)要检验的原假设为:红、白、粉红色花的分布为,其中。(2)先在为真时,似然函数为取对数得求关于的导数,并令之为0得对数似然方程为:解得的极大似然估计值为(3)算出的分布列中的极大似然估计值;。(4)取检验统计量,拒绝域为,(5)对显著性水平,临界值为,(6)题中,则检验统计量的值为故在水平下不能拒绝,即调查数据符合该偏好分布.注:有同学误认为检验的临界值为。解法二:(采用似然比检验)(1) (2) (3)步骤同上。(4)算出无假定条件下诸的极大似然估计:,(5)选取似然比检验统计量,拒绝域为,(6)对显著性水平,临界值为,(7)则检验统计量的值为故在水平下不能拒绝,即调查数

7、据符合该偏好分布.注:p值(P28Ex6)解法一:(卡方拟合优度检验)总体总共分4类,分布中有2个参数,这是一个含参数的分布拟合检验问题。(1)要检验的原假设为:人的血型分布为,其中(2)先在为真时,算出似然函数在约束条件下,取,化似然函数为无约束二元函数:取对数得注意到用微分法很难求出极大似然估计值的精确解,我们考虑近似计算。首先由“O”型和“B”型两类的矩估计算出参数向量的初始估计:然后参照课本25页利用EXCEL算得的极大似然估计值(3)算出诸的极大似然估计值;且在为真时,对数似然函数的最大值为。(4)取检验统计量,拒绝域为,(5)对显著性水平,临界值为,(6)题中,则检验统计量的值为(

8、计算过程略)故在水平下不能拒绝,即调查数据符合该偏好分布.解法二:(采用似然比检验)(1) (2) (3)步骤同上。(4)算出无假定条件下诸的极大似然估计:,(5)选取似然比检验统计量,拒绝域为,(6)对显著性水平,临界值为,(7)题中,则检验统计量的值为(计算过程略)故在水平下不能拒绝,即调查数据符合该偏好分布.注1:本题中极大似然估计值的精确解很难得到,采用迭代法进行近似计算,计算量大,要使用软件进行计算,而且要确定未知参数向量的迭代初始值。由于实际未知参数只有两个,需要建立两个方程用于给出迭代初始值。一个很自然的考虑是利用诸的矩估计(也就是无假定条件下诸的极大似然估计)可建立四个方程:为

9、方便,关键是选择哪两个变量,和选择哪两个方程来建立方程组,计算用于迭代的初始值。本题中,我们选择了变量,选择了方程。注2: 无假定条件下似然函数对数似然函数的最大值为注:p值(P68Ex1)解:(本题是单边检验,采用四格表的U检验法)(1)建立四格表正常数病例数合计人数处理组20068857200745对照组201087142201229合计401775199401974(2)记概率P(正常|处理组),P(正常|对照组),疫苗有效是指,所以本题是要检验假设 ,(3)取检验统计量,拒绝域为,(4)对显著性水平,临界值,(5)由题中数据算得检验统计量的值为故在水平下拒绝,即疫苗有效.注1:假设检验

10、的第一步是建立假设,要正确建立原假设,并且要正确建立备择假设!对于备择假设,具体场合下要能正确区分 “双边检验”与“单边检验”。(P68Ex3)解法一:(本题是单边检验,采用四格表的U检验法)(1)建立四格表长势良好长势不好合计A种肥料5347100B种肥料783117900合计8361641000(2)记概率P(长势良好|施A种肥料), P(长势良好|施B种肥料),B种肥料效果显著的好是指,所以本题是要检验假设 ,(3)取检验统计量,拒绝域为,(4)对显著性水平,临界值,(5)由题中数据算得检验统计量的值为故在水平下拒绝,即B种肥料效果显著的好.解法二:(本题是单边检验,采用修正的四格表的U

11、检验法)(1)建立四格表长势良好长势不好合计A种肥料5347100B种肥料783117900合计8361641000(2)记概率P(长势良好|施A种肥料), P(长势良好|施B种肥料),B种肥料效果显著的好是指,所以本题是要检验假设 ,(3)取检验统计量,拒绝域为,(4)对显著性水平,临界值,(5)由题中数据算得检验统计量的值为故在水平下拒绝,即B种肥料效果显著的好.注1:本题中的样本量比较大,故是否使用连续性修正,和似乎差异不大。一般样本容量比较大时不必使用连续性修正。注2:本题应采用单边检验,所以不能使用卡方检验!(P68Ex4)解法一:(本题是双边检验,采用四格表的U检验法)(1)建立四

12、格表有自杀情绪无自杀情绪合计精神病患者32225神经病患者91625合计123850(2)记精神病患者有自杀情绪的比例,神经病患者有自杀情绪的比例,本题要检验两比例是否相等,即要检验假设 ,(3)取检验统计量,拒绝域为,(4)对显著性水平,临界值,(5)由题中数据算得检验统计量的值为因为,故在水平下拒绝,即两比例不相等.解法二:(本题是双边检验,采用四格表的卡方检验法)(1)建立四格表有自杀情绪无自杀情绪合计精神病患者32225神经病患者91625合计123850(2)记精神病患者有自杀情绪的比例,神经病患者有自杀情绪的比例,本题要检验两比例是否相等,即要检验假设 ,(3)取检验统计量,拒绝域

13、为,(4)对显著性水平,临界值,(5)由题中数据算得检验统计量的值为故在水平下拒绝,即两比例不相等.解法三:(本题是双边检验,采用四格表的似然比检验法)(1)建立四格表有自杀情绪无自杀情绪合计精神病患者32225神经病患者91625合计123850(2)记精神病患者有自杀情绪的比例,神经病患者有自杀情绪的比例,本题要检验两比例是否相等,即要检验假设 ,(3)取检验统计量,拒绝域为,(4)对显著性水平,临界值,(5)由题中数据算得检验统计量的值为故在水平下拒绝,即两比例不相等.注1:拒绝域要与假设配套,主要看备择假设!本题是双边检验,U检验的拒绝域也应是双边形式的,不能再象P68ex1那样用单边形式的拒绝域!具体场合下要能正确区分 “双边检验”与“单边检验”。注2:考虑到本题中的样本量比较小,特别有的格子里的值为3(都小于5了!),故使用连续性修正似乎更好些。采用四格表的修正的卡方检验法(解法四),则(3)取检验统计量,拒绝域为,(4)对显著性水平,临界值,(5)由题中数据算得检验统计量的值为故在水平下不能拒绝,即两比例相等.有意思的是,这时候得出了相反的结论!注3:SPSS软件能很方便地计算四格表独立性双边检验的几种检验统计量和p值,下列为本题的SPSS卡方检验的程序输出。卡方检验值df渐进 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pear

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号