统计学第七章、第八章汇总

上传人:F****n 文档编号:100117071 上传时间:2019-09-22 格式:DOC 页数:16 大小:174.50KB
返回 下载 相关 举报
统计学第七章、第八章汇总_第1页
第1页 / 共16页
统计学第七章、第八章汇总_第2页
第2页 / 共16页
统计学第七章、第八章汇总_第3页
第3页 / 共16页
统计学第七章、第八章汇总_第4页
第4页 / 共16页
统计学第七章、第八章汇总_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《统计学第七章、第八章汇总》由会员分享,可在线阅读,更多相关《统计学第七章、第八章汇总(16页珍藏版)》请在金锄头文库上搜索。

1、统计学复习笔记第七章 参数估计一、 思考题1 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。根据一个具体的样本计算出来的估计量的数值称为估计值。2 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。3 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两

2、部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。4 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。5 简述样本量

3、与置信水平、总体方差、估计误差的关系。1. 估计总体均值时样本量n为其中:2. 样本量n与置信水平1-、总体方差、估计误差E之间的关系为 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大; 与总体方差成正比,总体的差异越大,所要求的样本量也越大; 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。二、 练习题1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。1) 样本均值的抽样标准差等于多少?2) 在95%的置信水平下,估计误差是多少?2 某快餐店想要估计每位顾客午餐的平均花费金额

4、,在为期3周的时间里选取49名顾客组成了一个简单随机样本。1) 假定总体标准差为15元,求样本均值的抽样标准误差。2) 在95%的置信水平下,求估计误差。3) 如果样本均值为120元,求总体均值的95%的置信区间。3 从一个总体中随机抽取n =100的随机样本,得到 =,假定总体标准差 = 85414,试构建总体均值的95%的置信区间。4 从总体中抽取一个n =100的简单随机样本,得到 =81,s=12。要求:1) 构建的90%的置信区间。2) 构建的95%的置信区间。3) 构建的99%的置信区间。5 利用下面的信息,构建总体均值的置信区间。1) = 25, = 3.5,n =60,置信水平

5、为95%2) =119,s =23.89,n =75,置信水平为98%3) =3.149,s =0.974,n =32,置信水平为90%6 利用下面的信息,构建总体均值的置信区间:1) 总体服从正态分布,且已知 = 500,n = 15, =8900,置信水平为95%。2) 总体不服从正态分布,且已知 = 500,n = 35, =8900,置信水平为95%。3) 总体不服从正态分布,未知,n = 35, =8900,s =500,置信水平为90%。4) 总体不服从正态分布,未知,n = 35, =8900,s =500,置信水平为99%。7 某大学为了解学生每天上网的时间,在全校7500名学

6、生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)。3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为90%8 从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值的95%置信区间。9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是

7、:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。10 从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。1) 求确定该种零件平均长度的95%的置信区间。2) 在上面估计中,你使用了统计中的哪一个重要定理?请解释。11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下: 已知食品包重服从正态分布,要求:1) 确定该种食品平均重量的95%的置信区间。2) 如果规定食品重量低于100

8、克属于不合格,确定该批食品合格率的95%的置信区间。12 假设总体服从正态分布,利用下面的数据构建总体均值的99%的置信区间。(略)13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:小时):63218171220117902182516152916 假定员工每周加班的时间服从正态分布,估计网络公司员工平均14 利用下面的样本数据构建总体比例丌的置信区间:1) n =44,p = 0.51 ,置信水平为99%2) n =300,p = 0.82 ,置信水平为95%3) n =1150,p = 0.48,置信水平为90%

9、15 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。16 一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信水平为99%。应选取多大的样本?17 要估计总体比例丌,计算下列条件下所需的样本量。1) E=0.02,丌=0.40,置信水平96%2) E=0.04,丌未知,置信水平95%3) E=0.05,丌=0.55,置信水平90%18 某居民小区共有居民500户,小区管理者准备采用一项新的供

10、水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。1) 求总体中赞成该项改革的户数比例的置信区间(=0.05)2) 如果小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调查(=0.05)19 根据下面的样本结果,计算总体标准差的90%的置信区间:1)=21,S=2,N=502)=1.3,S=0.02,N=153)=167,S=31,N=2220.顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方

11、式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16.56.66.76.87.17.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310 要求:(1)构建第一种排队方式等待时间标准差的95的置信区间。(2)构建第二种排队方式等待时间标准差的95的置信区间。第八章 假设检验一、 思考题1 假设检验和参数估计有什么相同点和不同点?解:参数估计与假设检验是统计推断的两个组成部分。相同点:它们都是利用样本对总体

12、进行某种推断。不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数在估计前是未知的。而在假设检验中,则是先对的值提出一个假设,然后利用样本信息去检验这个假设是否成立。2 什么是假设检验中的显著性水平?统计显著是什么意思?解:显著性水平用表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)3 什么是假设检验中的两类错误?解:弃真错误(

13、错误):当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作。取伪错误(错误):当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,又称取伪错误。犯第II类错误概率常记作。发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性水平,记作。4 两类错误之间存在什么样的数量关系?在样本容量n一定的情况下,假设检验不能同时做到犯和两类错误的概率都很小。若减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容

14、量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。5 解释假设检验中的P值。解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。也称为观察到的显著性水平。P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致程度就越大。6 显著性水平与P值有何区别?解: (显著性水平)是一个判断的标准(当原假设为真,却被拒绝的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。可以通过计算置信区间,然后与统计量进行比较判断,也可以通过统计量计算对应的p值,然后与值比较判断。7 假设检验依据的基本原理是什么?解: 假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号