统计学思考题－金锄头文库

资源描述

《统计学思考题》由会员分享，可在线阅读，更多相关《统计学思考题（5页珍藏版）》请在金锄头文库上搜索。

1、思考题：1、什么是统计学？怎样理解统计学与统计数据的关系？答：统计学是一门收集、整理、显示和分析统计数据的科学，其目的是探索数据的内在的数量规律性；统计学是由收集、整理、显示和分析统计数据的方法组成的，这些方法来源于对统计数据的研究，目的也在于对统计数据的研究；离开了统计数据，统计方法乃至统计学就失去其存在的意义。2、简要说明统计数据的来源。答：(1)统计数据来源于直接获取的数据和间接获取的数据；(2)直接获取的数据来自于直接组织的调查、观察和科学试验；(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。3、简要说明抽样误差和非抽样误差。答：(1)非抽样误差是

2、由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误，不完整的抽样框导致的误差，调查中由于被调查者不回答产生的误差等。从理论上看，这类误差是可以避免的；(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的，可以计量，可以控制。4、怎样理解均值在统计学中的地位？答：（1）反映了一组数据的中心点或代表值，是数据误差互相抵消后的客观事物必然性数量特征的一种反映；（2）是统计分布的均衡点；（3）任何统计推断和分析都离不开均值。5、解释洛伦茨曲线及其用途。答：(1)洛伦茨曲线是累积次数分配曲线，由（美）洛伦

3、茨（M.E.Lorentz）提出，依据（意）帕累托（V.Pareto）的“二八原理”和收入分配公式绘制；（2）用于描述收入和财富分配性质。6、简述基尼系数的使用。答：基尼系数用于反应收入分配的变化情况，取值在01之间基尼系数小于0.2，表明分配平均；在0.20.4之间，分配比较适当；0.4 是收入分配不公平的警戒线，超过0.4，收入分配不公平。7、一组数据的分布特征可以从哪几个方面进行测度？答：可以从三个方面测度：分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值；分布的离散程度反映的是分布离散和差异程度；分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平

4、程度。 8、简述频率与概率的关系。答：频率反映的是某一事物出现的频繁程度；概率是指事件在一次试验中发生的可能性；当观察次数很大时，频率与概率非常接近。9、概率的三种定义各有什么应用场合。答：古典概率实验的基本事件总数有限，每个基本事件出现的可能性相同；统计概率实验的基本事件总数有限，每个基本事件出现的可能性不完全相同；主观概率随机事件发生的可能性既不能通过等可能事件个数来计算，也不能根据大量重复试验的频率来估计。10、概率密度函数和分布函数的联系与区别表现在哪些方面？答：（1）联系:概率密度函数的积分是分布函数，分布函数的导数是概率密度函数；（2）区别：概率密度函数的函数值是某点的概率

5、密度，分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同？答：离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布，此外还有伯松分布、超几何分布；连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见的连续型随机变量的概率分布有正态分布、均匀分布等。12、正态分布所描述的随机现象有什么特点？为什么许多随机现象服从或近似服从正态分布？答：正态分布所描述的随机现象的特点：对称的分布；中间多两端少；许多随机现象的分布都会有集中趋势和离散趋势，即现象的分布表现为中间多两端少的特点

6、，这种分布与正态分布十分贴近。13、解释总体分布、样本分布和抽样分布的含义。答：总体分布是指总体的全部观察值形成的分布；样本分布是指一个样本的所有观察值形成的分布；抽样分布就是由样本观察值计算的统计量的概率分布。14、解释中心极限定理的含义。答：样本来自于任意总体,样本容量充分大；当样本容量充分大时，样本均值的抽样分布近似于一个均值和方差的正态分布。15、简述评价估计量好坏的标准答：无偏性估计量抽样分布的数学期望等于被估计的总体参数；有效性无偏估计量与总体参数的离散程度；相合性随着样本容量的增大，估计量与总体参数的接近程度。16、解释置信水平的含义。答：对总体参数进行区间估计时给定的一个概率

7、值；反应总体参数包括在置信区间的概率。17、简述样本容量与置信水平、总体方差、允许误差的关系。答：样本容量与置信水平成正比；样本容量与总体方差成正比；样本容量与允许误差成反比。18、第类错误和第类错误分别是指什么？它们发生的概率大小之间存在怎样的关系？答：第类错误是指当原假设为真时拒绝原假设所犯的错误；第类错误是指当原假设为假时没有拒绝原假设所犯的错误；两类错误的概率之间的关系：a 增大时，b 减小；b 增大时，a 减小。19、什么是显著性水平？它对于假设检验决策的意义是什么？答：（1）显著性水平是指假设检验中犯的第类错误的概率，记为a；（2）显著性水平a所围成的区域成为拒绝域；（3）检验统

8、计量落在拒绝域则拒绝原假设的概率，是人们事先指定的犯第类错误概率a的最大允许值。20、分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。答：（1）方差已知左侧检验为(-,-za),右侧检验为(za,+),双侧检验为(-,-za/2)(za/2,+)；（2）方差未知左侧检验为(-,-ta),右侧检验为(ta,+),双侧检验为(-,-ta/2)(ta/2,+)。21、什么是统计上的显著性？答：（1）由于随机因素的作用，点估计量与假设的总体参数出现差异是可以理解的；（2）点估计量与假设的总体参数出现较小差异是大概率事件，出现过大差异是小概率事件；（3）在一次试验中，点估计量与假设

9、的总体参数出现差异过大是不正常的，这就是统计上的显著性。22、方差分析中有哪些基本假定？答：每个总体都应服从正态分布；各个总体的方差2必须相同；观测值是独立的。23、简述方差分析的基本思想。答：将观测值之间的差异分为两类：组内误差和组间误差；组内误差只包含随机误差，组间误差既包括随机误差，也包括系统误差；衡量组内误差与组间误差的大小，推断观测值之间差异产生的原因。24、方差分析包括哪些类型？它们有何区别？答：主要是两种类型：单因素反差分析和双因素方差分析，双因素方差分析又分为无交互作用和有交互作用的方差分析两类；区别之一是考虑因素的数目不同；区别之二是两个因素是否有交互作用。25、解释方差分析

10、中的水平项平方和、误差项平方和的含义。答：水平项误差平方和是各组平均值与总平均值的误差平方和，反映各总体的样本均值之间的差异程度；误差项平方和是每个水平或组的各个样本数据与其组平均值误差的平方和，反映了每个样本各观测值的离散状况即反映随机误差的大小26、解释试验、试验设计、试验单元的含义？答：（1）试验是指收集样本数据的过程；（2）试验设计是研究如何科学地安排试验，使人们能用尽可能少的试验获得尽可能多的信息；（3）试验单元是指接受“处理”的对象或实体。27、简述相关分析与回归分析的联系。答：（1）具有共同的研究对象，都是对变量间相关关系的分析，两者可以相互补充；（2）只有当变量间存在相当程度的

11、相关关系时，进行回归分析去寻找变量间相关的具体数学形式才有实际的意义；（3）相关分析中相关系数的确定建立在回归分析的基础上。28、简述相关分析与回归分析的区别。答：（1）相关分析是用一定的数量指标度量变量间相互联系的方向和程度，回归分析是寻找变量间联系的具体数学形式，是要根据自变量的固定值去估计和预测因变量的平均值；（2）相关分析对称的对待相互联系的变量，不考虑二者的因果关系；回归分析对变量的处理是不对称的，必须明确划分自变量和因变量；（3）相关分析的两个变量均视为随机变量；回归分析中通常假定自变量为取固定值的非随机变量，因变量为随机变量。29、什么是随机误差项和残差？它们之间的区别是什么？答

12、：随机误差项是指因变量的观测值与其相应的条件期望值的偏差；残差是指因变量的实际样本观测值与样本条件期望的偏差。随机误差不能直接观测，残差可以直接计算。30、什么是总体回归函数和样本回归函数？它们之间的主要区别是什么？答：总体回归函数是指总体因变量的条件期望表示为自变量的某种函数；样本回归函数是指把因变量的样本条件期望表示为自变量的某种函数它们的主要区别是总体回归函数是确定的，样本回归函数随样本波动而变化。31、为什么在对参数进行最小二乘估计时，要对模型提出一些基本的假定？答：基本假定有：零期望值、同方差、无自相关、随机扰动与自变量不相关、正态性等假定；在基本假定满足的条件下，回归系数的最小二

13、乘估计是最佳线性无偏估计；如果多次进行估计值计算，或者是扩大样本容量进行估计值计算，按最佳估计方式计算的估计值接近真实值的可能性最大。32、为什么对计算的样本相关系数还要进行检验？答：（1）样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的，它只是对总体相关系数r的估计；（2）样本相关系数是随抽样而变动的随机变量，必需对估计的样本相关系数是否为抽样的偶然结果做出判断。33、为什么用可决系数能够度量回归方程对样本数据的拟合程度？答：（1）回归方程是通过对样本数据拟合而得到，在散点图上，样本回归线与样本观测值总是一定程度上存在或正或负的偏离，即拟合的优劣程度；（3）可决系数表示回归平方和占

14、总离差平方和的比重；（4）如果样本回归线对样本观测值拟合程度越好，各样本观测点与回归线靠得越近，由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大，反之拟合程度越差，这部分占的比重越小；34、利用回归方程作经济预测的基本条件和前提是什么？答：（1）变量分为因变量和解释变量两类，它们之间存在因果关系；（2）建立的回归方程通过各项统计检验，并且在经济上有实际意义；（3）影响经济现象的因素及条件始终保持不变。35、为什么对用回归方程计算的预测值要作区间估计？答：（1）由样本回归函数计算的只是对yf的平均值做的点估计；（2）回归方程中和是随机变量，因而也是随机变量；（3）对平均值的点估计

15、不一定等于因变量预测值的真实个别值yf，需要对yf可能的置信区间作出预测。36、对回归系数显著性作t检验的基本思想是什么？答：（1）回归分析中，最基本的是简单线性回归，人们最关心的是自变量x对因变量y是否有显著线性影响；（2）回归系数显著性检验的原假设是H0:b0，若不拒绝原假设，表明x对y没有显著的线性影响，若拒绝原假设，表明x对y存在显著的线性影响；（3）随机扰动项ui的方差s2未知，且样本量较小，统计量服从t分布，只能采用t检验法进行双侧检验。37、总指数的基本编制方式。答：先综合、后对比的方式就是先将各种商品的价格或销售量资料加总起来，然后通过对比得到相应的总指数；先对比、后平均的方式就是先将各种商品的价格或销售量资料进行对比，然后通过个体指数的平均得到相应的总指数。38、简述统计指数与数学上的指数函数有何不同？。答：统计学中的指数是一种对比性的分析指标；可以反映不同时间、不同空间现象水平的数量对比关系；再经济分析的各个领域得到广泛应用，又称为“经济指数”。39、与一般相对数比较，总指数所研究现象总体有何特点？答：一般反映的是多种现象的综合变动；在经济领域应用广泛，被称为“经济指数”；

展开阅读全文