贾俊平统计学思考题答案

上传人:M****1 文档编号:562979763 上传时间:2023-02-24 格式:DOCX 页数:10 大小:20.43KB
返回 下载 相关 举报
贾俊平统计学思考题答案_第1页
第1页 / 共10页
贾俊平统计学思考题答案_第2页
第2页 / 共10页
贾俊平统计学思考题答案_第3页
第3页 / 共10页
贾俊平统计学思考题答案_第4页
第4页 / 共10页
贾俊平统计学思考题答案_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《贾俊平统计学思考题答案》由会员分享,可在线阅读,更多相关《贾俊平统计学思考题答案(10页珍藏版)》请在金锄头文库上搜索。

1、贾俊平统计学思考题答案(总9页)-本页仅作为文档封面,使用时请直接删除即可-内页可以根据需求调整合适字体及大小-1、什么是统计学统计学是一门收集、分析、表述、解释数据的科学和艺术。2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。3、统计学据可以分成哪几种类型,个有什么特点按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。分类数据:只能归于某一类别的,非数字型数据。顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数 值。按收集方法不同。分为:观测数据、和实验数据观

2、测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领 域。按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一

3、次观察到下一次观察结果会呈现出 差别或变化。(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进 行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和 标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平 均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现 象某种特征的概念,比如说灯泡的寿命。)5、变量可以分为哪几类分类变量:说明事物类别;取值是分类数据。顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。变量也可以分为:随机变量和非随机变量;经验变量和理论变量

4、6、举例说明离散型变量和连续型变量。离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误 差)7、请举出统计应用的几个例子。市场调查、人口普查等。8、请举出应用统计学的几个领域。社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。第二章:1、什么是二手资料使用二手资料需要注意些什么 什么是二手资料:已经存在的;跟研究内容有关的;别人所做的调查或研究;会被我 们利用的,资料。注意:需要进行评估:考虑原始数据收集人、收集目的、收集途径、收集时间及数据 来源。2、比较概率抽样和非概率抽样的特点。举例

5、说明什么情况下适合采用概率抽样,什么情 况下适合采用非概率抽样。概率抽样:以一定的入样概率,按照一定的随机性原则选取样本(即样本被选中的概 率已知或可计算);技术含量高、成本高。用于描述性、解释性、推断性研究;研究目的在于掌握对象总体的数字特 征,得到总体参数的置信区间。非概率抽样:不按照入样概率和随机性原则,而按照方便、滚雪球或配额等抽样形式选取样本;技术含量低、成本低、时效快、操作简便。用于探索性研究;研究目的在于发现问题,为更深入的数量分析提供准 备。下面题目(略) 除了自填式,面访式和电话式还有什么搜集数据的办法 试验式和观察式等自填式,面访式和电话式各自的长处和弱点自填式;优点:1

6、调查组织者管理容易 2 成本低,可进行大规模调查 3对被调 查者,可选择方便时间答卷,减少回答敏感问题压力。缺点:1 返回率低 2不 适合结构复杂的问卷,调查内容有限 3 调查周期长 4 在数据搜集过程中遇见问 题不能及时调整。面访式;优点:1 回答率高 2 数据质量高 3 在调查过程中遇见问题可以及时调 整。缺点:1 成本比较高 2 搜集数据的方式对调查过程的质量控制有一定难度 3 对于敏感问题,被访者会有压力。电话式;优点:1 速度快 2 对调查员比较安全 3 对访问过程的控制比较容易。 缺点:1 实施地区有限 2 调查时间不能过长 3 使用的问卷要简单 4 被访者不愿 回答时,不易劝服。

7、如何控制调查中的回答误差 对于理解误差,学习一定的心理学知识,记忆误差,缩短所涉及的时间范围, 有意识误差,做好被调查者的心理工作,要遵守职业道德,为被调查者保密, 尽量在问卷中不涉及敏感问题。怎么减少无回答 对于随机误差,要提高样本容量,对于系统误差,只有做好准备工作并做好补 救措施。比如说要一百份的问卷回复,就要做好一百二十到一百三十的问卷准 备,进行面访式的时候要尽量的劝服不愿意回答的被访者,以小物品的馈赠提 高回复率。A/y ntzi第三章:1、数据的预处理包括哪些内容 数据审核:从完整性和准确性方面调查原始数据(完整性:单位、个体是否遗漏;准 确性:检查错误、异常值) 数据筛选:根据

8、需要找出符合特定条件的某类数据。 数据排序:按一定顺序将数据排列,体现数据特征或趋势。2、分类数据和顺序数据的整理和图示方法各有哪些 分类数据:整理:制作频数分布表,用比例、百分比、比率进行描述性分析。 图示:条形图、帕累托图、饼图。顺序数据:整理:制作频数分布表,用比例、百分比、比率进行描述性分析。 图示:累积频数、累计频率分布图、环形图、条形图、帕累托图、饼图。3、数值型数据的分组方法有哪些简述组距分组的步骤。分组方法:单变量分组:把每一个变量值做为一组(只适合离散型变量,变量值较 少)组距分组:将全部变量值依次划分为若干区间,一个区间变量值做为一 组。(组距分组又分为:等距分组、异距分组

9、) 分组步骤:确定组数(5,15);确定各组组距(5 倍数;组距最大变量值-最小变量 值);根据分组整理成频数分布表。4、直方图与条形图有何区别1、条形图用于展示分类数据;直方图用于展示数值型数据。2、条形图用长度表示个类别频数,宽度固定(无意义);直方图用面积表示各组频 数,长度表每组频数(或频率),宽度为组距(有意义)。3、条形图各矩形分开排列,直方图各矩形连续排列。(分组数据具有连续性)5、绘制线图应注意哪些问题时间在横轴,观测值在纵轴;横轴纵轴长度比例大概为 10:7;纵轴下端一般从 0 开 始,数据与0距离过大的话用折断符。6、饼图与环形图有什么不同 饼图:只能绘制一个样本或总体各部

10、分的比例。 条形图:可以同时绘制多个样本或总体各部分的比例。中间有一空洞,每个样本或总 体数据表现为一个环。7、茎叶图与直方图相比有什么优点他们的应用场合是什么 茎叶图在给出数据分布情况的同时,又能给出每一个原始数据(保留了原始数据的信 息); 直方图用于大批量数据,茎叶图用于小批量数据。8、鉴别图标优劣的准则有哪些 显示数据、强调数据间的比较、有对图形的统计描述和文字描述、避免歪曲、把读者 注意力集中于数据内容上、服务于一个明确的目的。8、制作统计表应注意哪几个问题 合理安排统计表结构; 表头一般包括表号,总标题和表中数据的单位等内容; 表中的上下两条横线一般用粗线,中间的其他用细线;在使用

11、统计表时,必要时可在下方加注释,注明数据来源。公式:组中值=(上限+下限)/2第四章:1、一组数据的分布特征可以从哪进几个方面进行测度 可以从以下三方面进行测度: 集中趋势:反映个数据向其中心值的靠拢或集中程度; 离散程度:反映各数据远离其中心值的趋势; 分布形状:数据分布的峰态和偏态;2、怎样理解平均数在统计学中的地位 平均数在统计学中具有重要地位:是集中趋势的最主要测度,是一组数据的重心所 在;是数据误差相互抵消的结果,利用了全部数据信息,具有无偏性;只适用于数值 型数据,不适用于分类或顺序数据。3、简述四分位数的计算方法:四分位数是一组数据排序后处于25%和75%位置上的值。具体计算方法

12、是:n/4; 3n/44、对于比例数据的平均为什么采用几何平均 对于比例数据采用几何平均比采用算数平均更合理。5、简述众数、中位数和平均数的特点和应用场合。 众数:主要用于分类数据集中趋势的度量;是一组数据的峰值;优点:不受极值的影响。缺点:具有不唯一性;只有数据量较大时才有效果 中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制; 优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。 优点:利用了所有数据信息;数据误差相互抵消,具有无偏性; 缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。6、简述

13、异众比率、四分位差、方差或标准差的应用场合。 异众比率:分类数据的离散程度测度;四分位差:顺序数据的离散程度测度;方差:数值型数据的离散程度测度7、标准分数有哪些用途标准分数:Xi-/s即:(变量值减去其平均数)/标准差 标准分数给出了一组数据中各数据的相对位置(其离平均数的距离用标准差衡量) 用途:在对多个具有不同量纲的变量进行处理时,需要对变量进行标准化处理; 检查一组数据中是否有离群值。8、为什么要计算离散系数离散系数=标准差/平均数 原因:方差和标准差反映的是数据离散程度的绝对值:一方面,受原变量值自身水平 高低的影响(与变量平均数大小有关);另一方面,与原变量值得计量单位有关,计 量

14、单位不同,离散程度也不同。因此,为消除变量值水平高低和变量值单位对离散程 度的影响,要计算离散系数。9、测度数据分布形状的统计量有哪些 峰态系数、偏态系数。A/V %T*?-第六章:1、什么是统计量为什么要引进统计量统计量为什么不含任何未知参数定义:设(X1,X2 Xn)是从总体X中抽取的容量为n的样本,如果由此构造一个函 数T (X1,X2Xn),不依赖于任何未知参数,则称函数T (X1,X2Xn)是一个统 计量。为什么:为了使统计推断成为可能。2、什么是次序统计量设(X1,X2Xn)是从总体X中抽取的容量为n的样本,若样本(X1,X2Xn) 是满足如下条件的函数:每当样本得到一个观测值x1

15、,x1xn时,其由小到大的排 序中,第i个值x(i)就作为次序统计量Xi的观测值,而X(1),X(2)X(n)就称为次序统计量。3、什么是充分统计量统计加工过程中一点信息都不损失的统计量称为充分统计量。4、什么是自由度独立变量的个数。5、简述三个重要分布及正态分布间的关系。卡方分布:设X1,X2,Xn是n个相互独立的随机变量,且XiN(0,1),则 X=X1八2+Xn八2为服从以n为自由度的卡方分布。F 分布:设 XX八2(m),Y八2X2(n),且 X,Y 相互独立,记 Z二X/m/Y/n,则 ZF(m,n)Z 分布:设 XN(0,1),YX八2(n),且 X,Y 相互独立,记 T=X/(Y/n厂(1/2),有 Tt(n)6、什么是抽样分布样本统计量(随机变量)的概率分布是一种理论概率分布。7、简述中心极限定理的意义。中心极限定理:设从均值为U,方差为。八2的任意任意总体中抽取样本量为n的样 本,当n充分大时,样本均值X的抽样分布近似服从均值为|1,方差为。八2/n的正态 分布。第七章:1、解释估计量与估计值。 估计量:用于估计总体参数的随机变量。 估计值:估计总体参数时计算出来的估计量的具体值。2、简述评价估计量好坏的标准。 无偏性:估计量抽样分布的数学期望=总

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号