《高等统计学-New答案.doc》由会员分享,可在线阅读,更多相关《高等统计学-New答案.doc(100页珍藏版)》请在金锄头文库上搜索。
1、中国人民大学接收同等学历人员申请硕士学位考试试题 招生专业: 统计学 考试科目: 高等统计学(数理统计学) 课程代码:123101 考题卷号 : 1一、多项选择题(每题4分,一共20分,每题要求:选择正确答案,对选择或未选答案进行简要而清晰的原因解释。将答案填写在答题纸上,填写在试题上无效。得分规则:选对并对答案解释合理,得4分;没有对未选答案解释最多得2分;漏选得1分,选错可参考解释酌情给分;不选得0分)1. 有关样本的分布,以下陈述正确的是:ABCA. 如果样本X1,Xn独立同分布来自Gamma分布,在大样本下有近似的正态分布;B.如果样本X1,Xn独立同分布来自N(),在大样本情况下有精
2、确分布N();C.如果样本X1,Xn独立同分布来自N(),即使样本量不大,也服从正态分布;D.如果样本X1,Xn来自任意分布,在大样本情况下,由X1,Xn组成的数据有近似的正态分布; 2有关检验的p值,下面说法正确的是:BC A. 一般为0,0.1之间的一个很小的概率; B. 接受备择假设的最小显著性水平;C. 如果p值小于显著性水平,则拒绝零假设; D. 样本统计量的分布函数。3. 请问以下哪些方法可以用来判断数据可能背离正态分布:BA. Q-Q图上,如果数据和基线之间几乎吻合;(基线指的是什么?)B. Kolmogrov-Smirnov正态检验中的统计量所对应的p值小于0.05;C.对数据
3、直方图做光滑后没有发现数据有很大的发散趋势;D.拟合优度检验,统计量的值偏小。4若抽样误差为5,总体标准差为40,如果样本量足够大,正态分布的0.975分位数近似为2,要估计总体均值的95%的置信区间所需要的样本量大概为:BA 156;B 256;C 356 ; d) 456.5.关于假设检验,给定一组独立同分布的随机样本,给定显著性水平,如下理解正确的是:D A.单边检验拒绝,双边检验一定拒绝;B.双边检验接受,一定有一个单边检验是拒绝的;C.单边检验拒绝,双边检验一定拒绝。D.双边检验拒绝,一定有一个单边检验是拒绝的;二、简答题:(10分3=30分)1. 假设检验的零假设和备择假设的设立对
4、于检验的结论影响不大,请问这样的理解有问题吗?请给出你的解释。解:对同一样本信息,由于零假设的不同选择,可能会得到不同的结论。由于显著性检验只控制第一类错误的概率,而不考虑犯第二类错误的概率,因而寻找拒绝域的时候只涉及到原假设,不涉及备择假设。于是零假设的确定在假设检验中非常重要。事实上,假设检验所依据的小概率事件在一次实验中几乎不可能发生的原理。小概率事件在一次试验中发生与小概率事件原理相矛盾并非形式逻辑的绝对矛盾。如果统计量落入拒绝域,也就是小概率事件居然在一次实验中居然发生了,根据小概事件原理,说明零假设显著不成立,应该否定原假设。如果统计量落入接收域,并不能肯定原假设的正确性,只能说明
5、观测结果与零假设不矛盾,没有足够理由拒绝零假设。此时假设检验并不能检验出零假设的正确性。2. 解释下面符号的区别: , 和(提示:请按有放回和无放回抽样分别叙述)解:分别是样本方差,总体方差与样本均值的方差。一般来说,从总体中抽样的方式不同,会影响到样本均值的方差。样本的抽取方式为有放回的情况下,获得的样本为简单随机样本,即从总体中抽出的样本为相互独立并且与总体同分布。从总体中抽出容量为n 的样本,并且与总体同分布,从而样本均值的方差。当抽样方式为无放回的情况时,下一次抽样是受前一次抽样的结果的影响的。此时,设总体中包含 N个个体,从总体中抽取容量为n 的样本,=当总体N充分大的时候,接近于放
6、回抽样的均值方差。3统计推断与描述统计之间有哪些重要的区别?描述统计是指统计数据的搜集、整理、显示和分析等,统计推断是利用样本信息和概率论对总体的数量特征进行估计和检验等。三、计算题(25分)1.Hardy-Weinberg平衡问题中,父代有两种基因M和N,M在种群中的分布为b(1,p)现在测量到了子代基因分布为:MMNN总量频数3425001871029a) 请根据这些数据求父代的p的极大似然估计;(10分)b) 请给出p的置信区间的求解公式,并解释; (15分)解:a)设父代样本X服从b(1,p),,最大似然估计为:由于Hardy-Weinberg平衡,群体的基因频率在一代一代繁殖传代中保
7、持不变。从而子代的基因型频率分别为,从而,.b)当样本数n足够多时父代基因M的频率近似服从正态分布,从而从而参数p的置信区间为四、论述题:(25分)研究者想了解某种电子设备产品在一年的各个季节里被购买的情况是否存在不同。如果用销售量来解释这一问题,对这一问题可能提出的最简单的零假设可能是什么?在这一假设之下,研究者调查了有关这种产品过去3年的销售量2070万台。表1 某种电子设备产品在过去3年中的销售量季节O(万)EOi-Ei(Oi-Ei)2春季 495夏季 503秋季 491冬季581总计 20701解释表头字母的含义;2请将上面的表格填写完整。2如果,请给出你的推断过程和据此可能的结论。解
8、:1.这一问题可能提出的最简单的零假设可能是H0:各个季节里被购买的情况是相同。O表示各个季度观察次数,E表示各个季度的理论次数,表示卡方统计量。2.季节O(万)EOi-Ei(Oi-Ei)2春季 495517.5-22.5506.250.98夏季 503517.514.5210.250.41秋季 491517.5-26.5702.251.36冬季581517.563.54032.257.79总计 2070207010.543.由于,拒绝原假设,认为各个季节里被购买的情况是显著差异的。中国人民大学接收同等学历人员申请硕士学位考试试题 招生专业: 统计学 考试科目: 高等统计学(数理统计学) 课程
9、代码:123101 考题卷号 : 2一、多项选择题(每题4分,一共20分,每题要求:选择正确答案,对选择或未选答案进行简要而清晰的原因解释。将答案填写在答题纸上,填写在试题上无效。得分规则:选对并对答案解释合理,得4分;没有对未选答案解释最多得2分;漏选得1分,选错可参考解释酌情给分;不选得0分)1关于假设检验,给定一组独立同分布的随机样本,给定显著性水平,如下理解正确的是:D A.单边检验拒绝,双边检验一定拒绝;B.双边检验接受,一定有一个单边检验是拒绝的;C.单边检验拒绝,双边检验一定拒绝。D.双边检验拒绝,一定有一个单边检验是拒绝的; 2某汽车生产厂家为增加某型号汽车的销售量,采用促销手
10、段,促销一个月后,分别收集了8个销售点处促销前一个月和促销后一个月该车型的销售辆,如果不考虑其他影响销售量因素,仅通过观察和分析这些样本数据,是否认为这次促销有助于提高汽车的销售量。请将合适的可用于分析该类问题的检验过程选出来:C销售点代号: 1 2 3 4 5 6 7 8促销前(辆): 90 83 105 97 110 78 55 123 促销后(辆): 97 80 110 93 123 84 57 110 A. 两样本Z检验B. 两样本t检验C. 单一样本t检验D. 单一样本Z检验 3在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是该统计量随着样本量的增大,它与它估
11、计的总体参数越来越近,这种评价标准称为:C A.无偏性 B.有效性 C.一致性 D.充分性4. 请问以下哪些方法可以用来判断数据可能背离正态分布:BA. Q-Q图上,如果数据和基线之间几乎吻合;B. Kolmogrov-Smirnov正态检验中的统计量所对应的p值=0.001;C.对数据直方图做了光滑后没有发现数据有很大的发散趋势;D.拟合优度检验,统计量的值偏小。5研究人员对有糖尿病的老鼠和正常老鼠血液中某种矿物质的含量进行研究,经验表明有糖尿病的老鼠和正常老鼠血液中某种矿物质的含量测量方差相等,测得如下试验数据:糖尿病老鼠:9只,样本均值64.26,样本方差1.40正常老鼠: 7只,样本均
12、值75.66,样本方差1.32在置信水平为0.10之下,有糖尿病的老鼠和正常老鼠血液中Fe的含量之差的置信区间为(t(0.95,14)=1.76):(-12.43,-10.36)A. 5.68,15.56B. 8.02,19.47C.10.36,12.43D.6.53,16.325. 置信水平为,下列说法正确的是( BD ),A 在置信水平一定的条件下,提高置信估计精度需要缩小样本量;B 在置信水平一定的条件下,提高置信估计精度需要增加样本量;C 在样本量一定的条件下,提高置信估计精度,需要降低置信水平;D 在样本量一定的条件下,提高置信估计精度,需要增大置信水平。二、简答题:(10分3=30
13、分)1.解释p值检验的基本原理。 p值是在原假设下出现检验统计量的实现值及(向备择假设方向)更极端的值的概率。 p-值度量从样本数据得到的信息对原假设的支持程度。p-值越小,就越有理由说明样 本数据不支持原假设。如果p-值小于显著性水平,那么能够拒绝原假设,否则就不能拒绝。因此p-值常常被称为该检验的观测显著性水平。2.解释下面符号的区别: , 和(提示:请按有放回和无放回抽样分别叙述)。解:分别是样本方差,总体方差与样本均值的方差。一般来说,从总体中抽样的方式不同,会影响到样本均值的方差。样本的抽取方式为有放回的情况下,获得的样本为简单随机样本,即从总体中抽出的样本为相互独立并且与总体同分布
14、。从总体中抽出容量为n 的样本,并且与总体同分布,从而,样本均值的方差=。当抽样方式为无放回的情况时,下一次抽样是受前一次抽样的结果的影响的。此时,设总体中包含 N个个体,从总体中抽取容量为n 的样本,=当总体N充分大的时候,接近于放回抽样的均值方差。3.请说明Gamma分布与卡方分布之间有哪些区别与联系?自由度为n的卡方分布是Gamma分布Gamma(n/2,1/2)的特例.三、计算题(20分)用possion()分布参数的极大似然估计的渐进分布求置信区间。,最大似然估计为:.当n充分大时,渐进正态N(,), ,从而从而参数的置信区间为四、论述题:(30分)研究者想了解某地区的医院出院人数(DISC)和床位量(BEDN),调查了21家医院数据,分为甲级(I)和乙级(II)两类如下:等级IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII