2017年河南农业大学统计学(同等学力加试)复试仿真模拟三套题.doc

上传人:q****9 文档编号:100894588 上传时间:2019-09-25 格式:DOC 页数:9 大小:39.50KB
返回 下载 相关 举报
2017年河南农业大学统计学(同等学力加试)复试仿真模拟三套题.doc_第1页
第1页 / 共9页
2017年河南农业大学统计学(同等学力加试)复试仿真模拟三套题.doc_第2页
第2页 / 共9页
2017年河南农业大学统计学(同等学力加试)复试仿真模拟三套题.doc_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《2017年河南农业大学统计学(同等学力加试)复试仿真模拟三套题.doc》由会员分享,可在线阅读,更多相关《2017年河南农业大学统计学(同等学力加试)复试仿真模拟三套题.doc(9页珍藏版)》请在金锄头文库上搜索。

1、2017年河南农业大学统计学(同等学力加试)复试仿真模拟三套题一、简答题1 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:(1)值能告诉我们什么信息?(2)当相应的值较小时为什么要拒绝原假设? (3)显著性水平与值有何区别?【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。

2、值越小,说之间不一致的程度就越大,检验的结果也就越显著。(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,如果选择的值相同,所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。2 简述均值、众数和中位数三者之间的关系及其在实际中的应用。【答案】(1)众数、中位数和平均数的关系从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而平均数 则是全部数据的算术平均。对于具有单峰分布的大多数数据而言

3、,众数、中位数和平均数之间具有以下关系: 如果数据的分布是对称的,众数中位数和平均数必定相等,即 如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位 置代表值,不受极值的影响,因此三者之间的关系表现为:如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则(2)众数、中位数和平均数在实际中的应用众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。 众数主要适合作为分类数据的集中趋势测度值。中位数是

4、一组数据中间位置上的代表值,不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。 但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择众数或中位数。3 说明回归模型的假设以及当这些假设不成立时的应对方法。【答案】(1)多元回归模型的基本假定有: 自变量对于自变量 误差项是一个服从正态分布的随机变量,且相互

5、独立,即(2)若模型中存在多重共线性时,解决的方法有:第一,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。 第二,如果要在模型中保留所有的自变量,那就应该:避免根据统计量对单个参数进行检验;对因变量Y 值的推断(估计或预测)限定在自变量样本值的范围内。若模型中存在序列相关时,解决的方法有:如果误差项不是相互独立的,则说明回归模型存在序列相关性,这时首先要查明序列相关产生的原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺少重要的自变量,则应増加自变量;如果以上两种方法都不能消除序列相关性,则需采用迭代法、差分法等方法处理。若模型中存在异方差性时,解决的方法有:当

6、存在异方差性时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同。4 概述相关分析与回归分析的联系与区别。【答案】(1)相关分析和回归分析的联系它们具有共同的研宄对象,都是对变量间相关关系的分析,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进行回归分析去寻求变量间相关的具体数学形式才有实际的意义。同时,在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又要

7、依赖于回归分析,而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。是非随机的、固定的,且相互之间互不相关(无多重共线性); 的方差都相同,且不序列相关,即的所有值误差项s 是一个期望值为0的随机变量,即 (2)相关分析和回归分析的区别从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值。从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分自变量和因变量,相关的变量不一定具有因果关系,均视为随机变量;回归分析是在变量因果

8、关系分析的基础上研宄其中的自变量的变动对因变量的具体影响,必须明确划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。5 在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否己知,以及样本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本情况。(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为为当总体方差已知时,总体均值的检验统计量为: 当总体方差为

9、: (2)在小样本情况下,假设总体服从正态分布: 当总体方差已知时,样本均值的抽样分布近似服从正态分布。总体均值检验的统计量为: 当总体方差未知时,需要用样本方差代替总体方差样本均值的抽样分布服从自由未知时,可以用样本方差来近似代替总体方差,此时总体均值检验的统计量总体方差!还是小样本此外还需要区分总体是否服从正态分布、总体方差是否已知等几种度为(n l )的t 分布。因此需要采用t 分布来检验总体均值。检验的统计量为: 6 给出显著性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设。【答案】P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明这种

10、情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P 值越小,我们拒绝原假设的 理由就越充分。从研宄总体中抽取一个随机样本,计算检验统计量的值和概率P 值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果数取值;如果即一般以样本间的差异比为显著,结果更倾向于接受假定的参数取值。说明是较强的判定结果,拒绝假定的参说明说明是较弱的判定结果,拒绝假定的参数取值;如果为非常显著,其含义是样本间的差异由抽样误差所致的概率时小于0.05或0.01。但是,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。时更大,这种说法是错误的。二、计算题7 假定总体比例从该总

11、体中分别抽取样本量为100、200、500和1000的样本。 (1)分别计算样本比例的标准差【答案】(1)(2)当样本量增大时,样本比例的标准差有何变化?时,样本比例的标准差为: 同理,可以计算出时的样本比例的标准差分别为 (2)当样本量增大时,样本比例的标准差越来越小。8 离散型随机变量X 的概率分布率如下。 (1)确定概率分布率中a 的值。 (2)试给出随机变量X 的分布 可知:(3)计算随机变量X 的均值和方差。【答案】(1)根据离散型随机变量的概率分布列的正则性,即得当当当当(2)当时,时,时,时,时, 所以随机变量X 的分布为: 9 某地区有1000名外事服务人员,随机抽选100名,

12、其月工资情况如表所示。表 试以的可靠性推断;(1)平均每名外事服务人员的月工资范围是多少?(2)估计月工资在3000元以上的外事服务人员比重的区间范围。 【答案】(1)由分组数据求平均值计算公式为: 根据区间估计公式得 即该地区平均每名外事服务人员的月工资范围是元。(2)根据抽样结果计算的样本比例为: 由比例估计公式得 即 故月工资在3000元以上的外事服务人员比重的区间范围是10某校某期“统计学”期末考试后,按不重复抽样方法随机抽取了5%即36份试卷进行分析。这些试卷平均得分为78分,标准差为12分,有四份试卷不及格。试以95%的置信度估计该校参加本次“统计学”考试的所 有同学的平均分数的置

13、信区间和及格人数的置信区间。【答案】由题意估计。 由于故可以按重复抽样进行(1)95%的置信度估计该校参加本次“统计学”考试的所有同学的平均分数的置信区间为: 即 (2)样本的及格率为: 则以95%的置信度估计该校参加本次“统计学”考试的及格率的置信区间为: 即 11一家房地产评估公司想对某城市的房地产销售价格(y )与地产评估价值和使用面积评估数据,经回归得到表1和表2中的结果表1 房产评估价值故95%的置信度估计该校参加本次“统计学”考试的及格人数的置信区间为: 建立一个模型,以便对销售价格作出合理预测。为此,收集了15栋住宅的房地产表2(1)写出销售价格对地产评估价值、房产评估价值、使用

14、面积的多元线性回归方程,并解释各回归系数的(2)检验回归方程的线性关系是否显著? (3)检验各回归系数是否显著? (4)计算多重判定系数(5)计算估计标准误差(6)你认为使用面积并说明它的实际意义。 并说明它的实际意义。在预测销售价格时是否有用?试说明理由。 表示当房产评估价值表示当地产评估价值表示当地产评估价值(2)建立假设: 由方差分析表可知(3)建立假设。对于任意参数拒绝原假设,即回归方程的线性关系是显著的。有 由表中数据可得应的P 值用面积吋应的所以地产评估价值的影响是不显著的。【答案】(1)由表中数据可得多元线性回归方程为: 和使用面积和使用面积不变时,地产评估价值不变时,房产评估价

15、值不变时,使用面积+每变动一个单每变动一个单每变动一个位,房地产销售价格(y )的平均变动量为1.4378个单位。位,房地产销售价格(y )的平均变动量为0.8545个单位。 和房产评估价值单位,房地产销售价格(y )的平均变动量为0.0626个单位。对应的和房产评估价值对的影响是显著的,而使(4)多重判定系数在销售价格的变动中,由释。 的变动可以由地产评估价值、房产评估价值和使用面积来解估计标准误差的实际意义:用地产评估价值、房产评估价值和使用面积来预测销售价格时,平均的预测误差为(6)使用面积 在预测销售价格时的影响不大。由于在(3)题中未通过显著性检验。 12独立重复地抛公平骰子2次,设表示出现1或2点的次数,表示出现6点的次数。(1)求二兀随机变量的联合分布与边际分布;(2)求与的相关系数。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号