2017年河南大学统计学(同等学力加试)考研复试核心题库.doc

上传人:q****9 文档编号:100894656 上传时间:2019-09-25 格式:DOC 页数:10 大小:41.50KB
返回 下载 相关 举报
2017年河南大学统计学(同等学力加试)考研复试核心题库.doc_第1页
第1页 / 共10页
2017年河南大学统计学(同等学力加试)考研复试核心题库.doc_第2页
第2页 / 共10页
2017年河南大学统计学(同等学力加试)考研复试核心题库.doc_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《2017年河南大学统计学(同等学力加试)考研复试核心题库.doc》由会员分享,可在线阅读,更多相关《2017年河南大学统计学(同等学力加试)考研复试核心题库.doc(10页珍藏版)》请在金锄头文库上搜索。

1、2017年河南大学统计学(同等学力加试)考研复试核心题库一、简答题1 若有线性回归模型问:(1)该模型是否违背古典线性回归模型的假定,请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。【答案】(1)该模型违背了古典线性回归模型的假定。古典线性回归模型要求误差项具有等方差性,即对于不同的自变量x 具有相同的方差。而由题意可知,误差项的方差为量有关。(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘法是在平方和中加入权数以调整各项在平方和中的作用。即寻找参数的估计值使得离差平方和 与自变其中 达到最小。这样,就消除了异方差性的影响。 2 回归分析中的误差序列有何基

2、本假定?模型参数的最小二乘估计模型用于预测,影响预测精度的因素有哪些?【答案】(1)误差项是一个服从正态分布的随机变量,且独立,即为0的随机变量,即线性函数;无偏性具有最小方差的估计量。(3)影响预测精度的因素有:预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;总体y 分布的离散程度越大,相应的预测区间就越宽,预测精度越低;样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;样本观测点中,解释变量x 分布的离散度。x 分布越离散,预测精度越高;预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽,精度越低,越接近样本分布中心间越窄

3、,精度越高。3 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?【答案】相关系数r 的取值范围在关关系;若相关关系;若之间。若表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当第 2 页,共 36 页具有哪些统计特性?若)。独立性意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值对于所有的值分别是的方差都相同。为随机变量的是所有线性无偏估计量中(2)模型参数的最小二乘估计的统计特性:线性,即估计量的无偏估计;有效性区表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,二者之间即为函数关系;

4、当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性相关关系。当说明两个变量之间的线性关系越强时. 可视为中度相关;说明两个变量之间的线性关系越弱。对于一时,可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:当时。视为低度相关;当相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。4 简述时间序列的组成要素。【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;(2)季节性

5、也称季节变动,它是时间序列在一年内重复出现的周期性波动;(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。 5 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。 【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理

6、论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用值。第 3 页,共 36 页检验,检验方程是否存在一阶自相关问题,或采用或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法法,但使用方差-协方差矩阵的稳健估计 6 简述平稳序列和非平稳序列的含义。【答案】(1)平稳序列是基本上不存在趋势的序列。这类序列

7、中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律。其波动可以看成是随机的。(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。二、计算题7 某住宅调查居民用水情况,该区共有N=1000户,采用无放回抽样随机抽取了n=100户,测得吨,其中有40户用水超过了规定标准。要求计算(列出计算公式):(1)该住宅区的总用水量及95%的置信区间。(2)若要求估计的相对误差不超过10%,应抽多少户作样本? (3)以95%的可靠性

8、估计用水超过标准的户数。(4)若认为估计用水的超标户的置信区间过宽,要求缩短一半,这时应抽多少户作样本? 【答案】(1)由于是无放回抽样,则抽样平均误差为故用样本方差代替,则该住宅区平均用水量的95%的置信区间为: 即 代入数据解得由于总体的方差未知,(2)若要求估计的相对误差不超过10%,即要求即至少应抽取828户作样本。(3)设用户超过标准的比例为p , 由于是无放回抽样,从而p 的95%的置信区间为其中代入数据解得:所以以95%的可靠性估计用水超过标准的户数在309与491之间。(4)若要求置信区间的宽度缩小为原来的一半,即要求应抽取的户数代入数据解得满足方程:即若使用水的超标户的置信区

9、间缩短一半,则应取308户作样本。8 某家商场为了了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历表示为:1: 初中,2:高中或中专,3:大专,4:本科及以上。调查结果如表1所示。表1第 4 页,共 36 页 (1)上表中的数据属于什么类型? (2)制作一张频数分布表。(3)绘制一张条形图,反映顾客的学历分布。 【答案】(1)表中的数据属于顺序数据。 (2)制作频数分布表,如表2所示。表2 频数分布表 (3)绘制条形图,如图1所示。 图1 条形图 第 5 页,共 36 页 9 一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作 出估

10、计。下面是近8个月的销售额与广告费用数据。 以月销售收入为因变量,电视广告费用和报纸广告费用为自变量,得到结果如下。 根据上述信息,撰写一份报告,报告至少涵盖下面三项内容: (1)回归方程的假定;(2)电视广告费用对月销售收入的作用; (3)报纸广告费用对月销售收入的作用。 【答案】(1)由结果可得回归方程为: 回归方程的假定条件是:因变量y 与自变量x 之间具有线性关系。在重复抽样中,自变量x 的取值是固定的,即假定x是非随机的。误差项是一个期望值为0的随机变量,即对于所有的x 值,的方差且独立,即(2) 回归系数万元。由于素。(3)回归系数万元。由于表示,报纸广告费用每増加1万元,月销售收

11、入平均增加1.2929线性关系显著,说明报纸广告费用是影响月销售收入的一个因 表示,电视广告费用每増加1万元,月销售收入平均增加2.7687线性关系显著,说明电视广告费用是影响月销售收入的一个因都相同。误差项是一个服从正态分布的随机变量,素。10有两个正态总体,均值和方差未知,但已知方差相等,从第一个总体中抽取n=16的随机样本,均值为24,方差为64; 从第二个总体中抽取n=36的随机样本,均值为20, 方差为49。如何检验第一个总体的均值是否大于第二个总体的均值?【答案】设第一个总体的均值为第二个总体的均值为第 6 页,共 36 页则建立假设: 由于两总体均为正态总体,方差未知但相等,并且

12、 则 于是,检验统计量的值为: 给定检验的显著性水平大于第二个总体的均值;若若则拒绝原假设,即认为第一个总体的均值则接受原假设,即认为第一个总体的均值不大于第二个总体的均值。11某地区有1000名外事服务人员,随机抽选100名,其月工资情况如表所示。表 试以的可靠性推断;(1)平均每名外事服务人员的月工资范围是多少?(2)估计月工资在3000元以上的外事服务人员比重的区间范围。 【答案】(1)由分组数据求平均值计算公式为: 根据区间估计公式得 即该地区平均每名外事服务人员的月工资范围是元。(2)根据抽样结果计算的样本比例为:第 7 页,共 36 页 由比例估计公式得 即 12有两条茶叶包装生产

13、线,从每条生产线上各抽60桶,其中一条生产线上每桶茶叶的平均重量为克,方差为36; 另一条生产线的平均重量为克,方差为 (1)试构造两条生产线茶叶平均重量之差的置信度为95%的置信区间。 (2)能否判断两条生产线上茶叶的平均重量存在显著差异?【答案】(1)已知分布,即 因此,两条茶叶包装生产线上茶叶重量均值之差在95%置信水平下的置信区间为: 即克。(2)有两种方法可以判断两条生产线上茶叶的平均重量是否存在显著差异:a. 由于(1)中构造的置信度为95%的置信区间不包括零点,因此可以认为两条生产线上茶叶的平均重量存在显著差异。b. 建立假设: 两条生产线上茶叶的平均重量没有显著差异两条生产线上

14、茶叶的平均重量存在显著差异由于样本容量较大,故可用正态分布来近似,所以检验统计量的值为: 由于异。所以拒绝原假设,即两条生产线上茶叶的平均重量存在显著差两条茶叶包装生产线上茶叶重量均值之差在95%置信水平下的置信区间为故月工资在3000元以上的外事服务人员比重的区间范围是由于样本容量比较大,故两条茶叶包装生产线上茶叶重量均值之差经标准化后服从标准正态第 8 页,共 36 页 一、简答题1 简述非抽样误差类型。【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非

15、抽样误差有以下几种类型:(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。 (4)调查员误差,是指由于调查员的原因而产生的调查误差。(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。 2 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号