统计学复习范围更新y

上传人:m**** 文档编号:432571999 上传时间:2023-08-24 格式:DOCX 页数:11 大小:60.78KB
返回 下载 相关 举报
统计学复习范围更新y_第1页
第1页 / 共11页
统计学复习范围更新y_第2页
第2页 / 共11页
统计学复习范围更新y_第3页
第3页 / 共11页
统计学复习范围更新y_第4页
第4页 / 共11页
统计学复习范围更新y_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《统计学复习范围更新y》由会员分享,可在线阅读,更多相关《统计学复习范围更新y(11页珍藏版)》请在金锄头文库上搜索。

1、各位;范围已经缩小,红色标示的内容是本书的重点,请注意红色标示的各类简答、计算、判断 改错。第一章11什么是统计学? 是收集、处理、分析、解释数据并从数据中得出结论的科学。12解释描述统计和推断统计。 描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统 计是研究如何利用样本数据来推断总体特征的统计方法。如人口特征统计就是推断统计。 13统计数据可分为哪几种类型?不同类型的数据各有什么特点?P714解释分类数据、顺序数据和数值型数据的含义。 统计数据分为分类数据、顺序数据和数值型数据。分类数据是只能归于某一类别的非数 字型数据,是对事物进行分类的结果,数据表现来类别,是

2、用文字来表述的。顺序数据是只 能归于某一有序类别的非数字型数据。有类别并是有序的。数值型数据是按数字尺度测量的 观察值,其结果表现为具体的数值。分类数据和顺序数据说明的是事物的品质特征,通常用文字来表述,结果表现为类别, 也可统称为定性数据或品质数据;数值型数据说明的现象的数量特征,通常用数值来表现, 也可称为定量数据或数量数据。1. 5举例说明总体、样本、参数、统计量、P9变量这几个概念。(区别、联系) 总体是包含所研究的全部个体(数据)的集合,由所研究的一些个体组成,如由多个人 构成的集合,每一个人就是一个个体,多个企业构成的集合,每一个企业就是一个个体;如 检验一批灯泡的寿命,这批灯泡构

3、成的集合就是总体。也可把这批灯泡的寿命集合作为总体。样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。抽样的 目的是根据样本提供的信息推断总体的特征。如从一批灯泡中随机抽取100 个,这100 个灯泡就构成了一个样本,然后根据这100个 灯泡的平均使用寿命去推断这批灯泡的平均使用寿命。参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。 如总体平均数、总体标准差、总体比例等统计量是用来描述样本特征的概括性数字度量。是根据样本数据计算出来的一个量,由 于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标准差。抽样的目的就是要根据样本统计量去估计

4、总体参数。如:用样本平均数去估计总体平均 数,用样本标准参去估计总体标准差,用样本比例去估计总体比例。变量是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别 或变化。变量的具体取值称为变量值。如商品销售额是变量,20 万元就是变量值。变量可以 分为分类变量、顺序变量、数值型变量(离散型变量可一一列举有限个数如企业数、产品数 量和连续型变量不能一一列举取值连续不断如年龄、温度)。AW- *第二章2. 1什么是二手资料?使用二手资料需要注意什么? 如果与研究内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使之成为 我们进行的统计分析可以使用的数据,间接来源的数据称为

5、二手资料。使用二手资料要注意 数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。以引用二手数据时,应 注明数据的来源,以尊重他人的劳动成果。2. 概率抽样和非概率抽样的区别与联系,P23 +P34举例说明什么情况下适合采用概率抽 样,什么情况下适合采用非概率抽样。概率抽样也称随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定机会被选 入样本,样本是采用概率抽样方式得到的,为统计估计结果的评估提供了有力的依据;非概 率抽样相对于概率抽样而言,不依据随机原则,而是根据研究目的对数据的要求,采用某种 方式从总体中抽出部分单位对其实施调查;样本统计量的分布不是确切的,取决于多种因素,

6、因而无法使用样本的结果对总体相应的参数进行推断。概率抽样在于掌握研究对象总体的数 量特征,得到总体参数的置信区间,技术含量较高。如航天器中精密仪器主轴加工精度的要 求;非概率抽样中如报刊上的调查问卷;3. P86 最上面一段需要简答:4 P15 最下面一行,从普查数据到重要内容判断改错题。答案:有误差5。P28实验数据:名词解释+实验是检验变量间因果关系的一种方法。6 误差的控制:抽样误差可以采用相应的措施进行控制。 P397 计算题:重点是平均值和方差。参考: 1.P93 例 4.7。例 4.118. P212 参数估计和假设检验的区别与联系。2. 3调查中搜集数据的方法主要有自填式、面访式

7、、电话式。除此之外,还有哪些搜集 数据的方法?除自填式、面访式、电话式外,还有观察式。2. 6 你认为应当如何控制调查中的回答误差? 导致回答误差的原因主要有理解误差、记忆误差和有意识误差。为防止每个人都按自 己的理解回答,在心理学知识帮助下,了解被调查者的心理活动,控制好理解误差在回答的 误差,措辞很重要,将频率改为数量级,进行相应的排序;由于调查的问题是关于一段时期 内的现象或事实,需要被调查者回忆,需要回忆的时间间隔越久,回忆的数据可能越不准确, 所以缩短调查所涉及的时间范围,以周期发生事件采取周期调查期,可以减少记忆误差。有 意识误差需要多方面的努力,调查人员要做好被调查者的思想工作,

8、让他们打消顾虑,调查 人员要遵守职业道德,为被调查者保密,调查中尽量避免敏感性问题。对于政府统计中的调 查,要加强法制化管理。第三章-数据的图表展示 P783.2 分类数据和顺序数据的整理和图示方法各有哪些?答:1)分类数据:是对事物进行分类的结果。因本身就是对事物的一种分类,所以在整 理时首先列出所分的类别,然后计算出每一类别的频数、频率或比例等,即可形成一张 频数分布表,最后根据需要选择适当的图形进行展示,以便对数据及其特征有一个初步 的了解。分类数据的图示方法有: 条形图:用宽度相同的条形盒高度或长短来表示数据多少的图行。 柱形图:条形图纵置时成为柱形图。帕累托图:按各类别数据出现的频数

9、多少排序后绘制的条形图。 饼图:是用圆形及圆内扇形的角度来表示数据大小的图形。只能显示一个样本各部分所 占的比例。环形图:与饼图类似,但中间有一个“空洞”。可显示多个样本各部分所占的相应比例。2)顺序数据:分类数据的频数分布表和图示方法,如频数、比例、百分比、比率、条形 图和饼图等,也都适用于对顺序数据的整理与显示。但一些适用于顺序数据的整理和显 示方法,并不适用于分类数据。对于顺序数据,除了可使用上面的整理和显示技术,还 可以计算累积频数和累积频率(百分比)。顺序数据的图示:根据累积频数或累积频率,可以绘制累积频数分布或频率图。3.4 直方图与条形图有何区别?答: 1. 条形图是用条形的长度

10、(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定 的。 2. 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比, 宽度则表示各组的组距,其高度与宽度均有意义。3. 直方图的各矩形通常是连续排列,条形图则是分开排列。4. 条形图主要用于展示分类数据,直方图则主要用于展示数值型数据。3.6 饼图和环形图有什么不同?答:1. 饼图也称圆形图,是用圆形及园内扇形的面积来表示数值大小的图形. 它主要用于 表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用。2. 环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示。环形图与圆形图 类似,但又有区别圆形

11、图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3. 环形图可用于结构比较研究,主要用于展示分类和顺序数据。3.7 茎叶图与直方图相比有什么优点?它们的应用场合是什么? 答:茎叶图与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值, 即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数 值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。第四章数据的概括性度量P1094.1 一组数据的分布特征可以从哪几个方面进行测量? 答:数据分布的特征可以从三个方面进行测度和描述:一是分布的集

12、中趋势,反映各数 据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势; 三是分布的形状,反映数据分布的偏态和峰态。这三个方面分别反映了数据分布特征的不同 侧面。4.5简述众数、中位数和平均数的特点和应用场合。简答题答:众数是一组数据中出现次数最多的变量值,用M0表示。它不受极端值影响,具有不 唯一性。众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。数据分布 偏斜程度较大时应用。中位数是一组数据排序后处于中间位置上的变量值,用M表示,也不受极端值影响。它e将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺序 数据的集中趋势,

13、当然也适用于数值型数据,但不适用于分类数据。数据分布偏斜程度较大 时应用。平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。它 易受极端值影响,数学性质优良。主要适用于数值型数据,而不适用于分类数据和顺序数据。 数据对称分布或接近对称分布时应用。4.8为什么要计算离散系数?与方差的区别答:离散系数是一组数据的标准差与其相应的平均数之比。是对数据相对离散程度的测度, 消除了数据水平高低和计量单位的影响,主要用于对不同组别数据离散程度的比较。离散系 数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。4.9测度数据分布形状的统计量有哪些?答:偏态和峰态是对数据

14、分布形状的测度。偏态是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。峰态是对数据分布平峰或尖峰程度的测度。测度峰态的统计量 则是峰态系数,记作 K。练习题 4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200-30019300-40030400-50042500-60018600以上11合计120要求:1、计算120 家企业利润额的平均数和标准差。答:平均数=(250*19+350*30+450*42+550*18+650*11)/120=426.67标准差= (250 - 426.67)2 *19 + (350 - 426.67

15、)2 *30 + (450 - 426.67)2 * 42 + (550 - 426.67)2 *18 + (650 - 426.67)2 * 11Y120 -1=116.482、计算分布的偏态系数和峰态系数 答:偏态系数=(250- 426.67)3*19 + (350- 426.67)3* 30 + (450- 426.67)3* 42 + (550- 426.67)3* 18 + (650- 426.67)3* 11120* S3323823.23= 120*116.483=0.203峰态系数=(250 - 426.67)4 *19 + (350 - 426.67)4 *30 + (450 - 426.67)4 *42 + (550 - 426.67)4 *18 + (650 - 426.67)4 *11 _3 120*S451087441648= 120*116.484=-0.687第四章重要公式如下:艺M fM f + M f +. + M fii平均数x =上12 2k k =亠f + f +. + fn12k工(X - X)2i未分组数据方差S2=亠n - 1(M - X)2 fii分组数据方差 S2=| 工(x - x)21i未分组数据平均差s=亠n -1另(M - X

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 机械/制造/汽车 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号