422编号统计学名词解释归纳

上传人:玩*** 文档编号:145839877 上传时间:2020-09-23 格式:PDF 页数:9 大小:184.09KB
返回 下载 相关 举报
422编号统计学名词解释归纳_第1页
第1页 / 共9页
422编号统计学名词解释归纳_第2页
第2页 / 共9页
422编号统计学名词解释归纳_第3页
第3页 / 共9页
422编号统计学名词解释归纳_第4页
第4页 / 共9页
422编号统计学名词解释归纳_第5页
第5页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《422编号统计学名词解释归纳》由会员分享,可在线阅读,更多相关《422编号统计学名词解释归纳(9页珍藏版)》请在金锄头文库上搜索。

1、 1 什么是统计学?统计方法可分为哪两大类?统计学是收集、处 理、分析、解释数据并从数据中得出结论的科学。方法有描述统计 和推断统计两类 2 统计数据可分为哪几种类型?不同类型数据各有什么特点?按 采取计量尺度,分类、顺序、数值型数据;按统计数据收集方法,观 测、实验数据;按被描述对象与时间关系,截面、时间序列数据 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对 事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它 也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺

2、度测量的观察值,其结果表现为 具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有 对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的 情况,也叫动态数据。 3 举例说明总体、样本、参数、统计量、变量这几个概念:对一千灯 泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进 行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的 平均值和标准差还

3、有合格率等描述特征的数值就是参数,这一百 个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就 是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿 命。 4 什么是有限总体和无限总体?举例说明 有限总体指总体的范围能够明确确定,而且元素的数目是有限可 数的,如若干个企业构成的总体,一批待检查的灯泡。无限总体指 总体包括的元素是无限不可数的,如科学实验中每个试验数据可 看做是一个总体的一个元素,而试验可无限进行下去,因此由试 验数据构成的总体是无限总体 5 变量可分为哪几类? 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 6 举

4、例说明离散型变量和连续型变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1 数据的预处理包括哪些内容? 数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排 序。 2 直方图和条形图有什么区别? 条形图使用图形的长度表示各类别频数的多少,其宽度固定, 直 方图用面积表示各组频数,矩形的高度表示每一组的频数或频率, 宽度表示组距,直方图各矩形连续排列,条形图分开排列,条 形图主要展示分类数据,直方图主要展示数值型数据。 3 饼图和环形图有什么不同? 饼图只能显示一个样本或总体各部分所占比例,环形图可以同时 绘制多

5、个样本或总体的数据系列,其图形中间有个“空洞”,每个样 本或总体的数据系类为一个环。 4 茎叶图和直方图相比有什么优点? 茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即 保留了原始数据的信息。在应用方面,直方图通常适用于大批量 数据,茎叶图适用于小批量数据。 5 使用图标应注意哪些问题? 合理安排统计表结构表头一般包括表号,总标题和表中数据 的单位等内容表中的上下两条横线一般用粗线,中间的其他用 细线在使用统计表时,必要时可在下方加注释,注明数据来源。 1.一组数据的分布特征可以从哪几方面进行测度。 一是分布的集中趋势,反映数据向其中心靠拢或聚集的程度;二是 分布的离散程度,反映各数

6、据远离其中心值的趋势;三是分布的形 状,反映数据分布偏斜程度和峰度。 2.简述四分位数的计算方法:首先对数据进行排序,然后确定四分 位数所在的位置,该位置上的数值就是四分位数。(设 25%的四分 位数为 Q25%,75%四分位数为 Q75%,根据四分位数定义有: Q25%位置=n/4,Q75%位置=3n/4。 3.对于比率数据为什么采用几何平均。 在实际应用中,对于比率数据的平均采用几何平均要比算数平均 更合理。从公式 n 1i i n GG1 1)( )( 中也可看出,G 就是平均增长率。 4.简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具

7、有不 唯一性。众数主要作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。 中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度 值。 均值是就数值型数据计算的,具有优良的数学性质,缺点是易受 数据极端值的影响。均值主要适合于作为数值型数据的集中趋势 测度值。 5. 为什么要计算离散系数。 第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝 对值,其数值的大小取决于原变量值本身水平高低的影响。第二, 它们与原变量值的计量单位相同,采用不同计量单位计量的变量 值,其离散程度的测度值也就不同。因此,为消除变量值水平高低 和计量单位不同对离散程度的测

8、度值的影响,需要计算离散系数。 6.简述异众比率、四分位差、方差或标准差的适用场合 对于顺序数据,但主要使用四分位差来测量其离散程度;对于数值 型数据,虽然可以计算异众比率和四分位差,但主要使用方差或 标准差来测量其离散程度。 7. 标准分数有哪些用途? 标准分数给出了一组数据中各数值的相对位置。在对多个具有不 同量纲的变量进行处理时,常需要对各变量进行标准化处理。它 还可以用来判断一组数据是否有离群数据。 1.抽样推断的含义:是在根据随机原则从总体中抽取部分实际数据 的基础上,运用数理统计方法,对总体某一现象的数量性作出具 有一定可靠程度的估计判断。 2.简单随机抽样:含义:从含有 N 个元

9、素的总体中,抽取 n 个元 素作为样本,使得每一个容量为 n 的样本都有相同的机会被抽中, 这样的方式称为简单随机抽样。特点:简单随机抽样是其他抽样 方法的基础。有两种抽取元素的方式:重复臭氧和不重复抽样。 分层抽样:含义:在抽样之前先将总体的元素划分为若干层,然 后从各个层中抽取一定数量的元素组成一个样本,这样的样本抽 样方式称为分层抽样,也成分类抽样。特点:除了可以对总体 进行评估外,还可以对各层的子总体进行评估。可以按自然区 域或行政区域进行分层,使抽 样的组织和实施都比较方便。分层 抽样的样本分布在各个层内,从而使样本在总体中的分布比较均 匀。可以提高估计的精度。 系统抽样:含义:先将

10、总体个元素按照某种顺序排列,并按某种 规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直 至抽取 n 个元素形成一个样本。特点:简单易行在总体中的 分布一般也比较均匀,由此估计的误差通常要小于简单随机抽样。 整群抽样: 含义:先将总体划分成若干群,然后以群作为抽样单 位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行 观察。特点:不需要有总体元素的具体名单而只要有群的名单就 可以进行抽样。整群抽样时群内各元素比较集中,对样本进行调 查比较方便,节约费用。在群内各元素存在差异时,整群抽样可以 提供较好的结果,理想的情况是每一群都是整个总体的一个缩影。 3.重复抽样:从总体中抽取一个

11、元素后,把这个元素放回到总体中 再抽取第二个元素,直至抽取 n 个元素为止。 不重复抽样:一个元素被抽中后不再放回总体,然后再从所剩下的 元素中抽取第二个元素,直到抽取 n 个元素为止。 4.抽样分布:重复选取容量为 n 的样本时,由每一个样本算出的统 计量数值的相对频数分布或概率分布,称为样本统计量的抽样分 布。 5.样本统计量的分布与总体分布的关系? 由于现实中我们不可能将所有的样本都抽出来,因此,统计量的 抽样分布实际上是一种理论分布,但它与总体分布存在着密切的 关系,以均值x的抽样分布为例,其抽样分布与原有总体的分布有 关,如果原有总体是正态分布,那么,无论样本容量的大小,样本 均值也

12、服从正态分布。其分布的数学期望为总体均值,方差为总 体方差的 1/n,即 00。如果原有总体的分布不是正态分布,就要看 样本容量的大小了,当 n 为大样本时(n30),根据统计上的中心极 限定理可知,当样本容量n增大时,不论原来的总体是否服从正态 分布,样本均值的抽样分布都将趋于服从正态分布。其分布的数 学期望为总体均值,方差为总体方差的 1/n。 6. Z/2 n 的含义:是估计误差。Z/2 的值和样本量 n 共同确定了 估计误差的大小,一旦确定了置信水平 1-,Z/2 的值就确定了。 对于给定的 Z/2 的值和总体标准差。可以确定任一允许的估计 误差所需要的样本量。 7.样本均值抽样分布的

13、两个主要特征值: 与总体参数的关系: 1.理解原假设与备择假设的含义:原假设:通常将研究者想收集证 据予以反对的假设称为原假设或零假设,用 H0 表示;备择假设:通 常将研究者想收集证据予以支持的假设称为备择假设或研究假 设,用 H1 表示。 2.统计检验量:根据样本观测结果计算得到的,并据以对原假设和 备择假设作出决策的某个样本统计量,称为检验统计量。 标准化检验统计量:是将统计检验量标准化,标准化的统计检验量 =(点估计量-假设值)/点估计量的抽样标准差。 3.第类错误:当原假设为真时拒绝原假设,所犯的错误称为类 错误。犯第类错误的概率通常记为。 第类错误:当原假设为假时没有拒绝原假设,所

14、犯的错误称为第 类错误,又称取伪错误。犯第类错误的概率通常记为。 它们发生概率之间的关系:在样本量不变的情况下,要减小就会 使增大,而要增大就会使减小,这两类错误此消彼长。 4.显著性水平:假设检验中犯的第类错误的概率,称为显著性水 平,记为。 它对于假设检验决策的意义:显著性水平是人们事先制定的犯第 类错误的概率的最大允许值,在实际应用中,显著性水平往往 是人们事先给出的一个值。 5.P 值:在原假设为真的条件下,检验统计量的观察值大于或等于 其计算值的概率,称为 P 值,也称为观察到的显著性水平。 利用 P 值决策的准则:如果 P 值,拒绝 H0;如果 P 值,不拒 绝 H0. 6.单侧检

15、验与双侧检验的区别:单侧检验中,P 值位于抽样分布的 一侧,而双侧检验 P 值位于分布的两侧,每一侧的 P 值为 1/2. 7.大样本情形下总体均值左侧检验的拒绝域:ZZ;右侧检验的 拒绝域:ZZ;双侧检验的拒绝域:|Z|Z/2。 8.小样本情形下总体均值检验应该构造的检验统计量 t 应用前提: 服从正态分布 9.小样本情形下总体均值左侧检验拒绝域:tt(n-1);右侧检验 拒绝域: tt(n-1);双侧检验的拒绝域:|t|t/2(n-1) 10.假设检验的一般步骤 :依照 题意建立原假设H0与备择假设H1 判断样本大小并计算检验统计量根据显著水平进行判断原假 设是否成立。 1、相关关系:变量

16、之间存在的不确定的数量关系。相关关系的特点: 一个变量的取值不能由另一个变量唯一确定,当变量 x 取某个值 时,变量 y 的取值可能有几个 2、相关系数的取值和意义 :取值范围 :1r1。若 0r1,x、y 之间 存在正线性相关关系;1r0,负线性相关关系;若 r=+1,x、y 之间 为完全正相关关系;r= 1,为完全负线性相关关系。当|r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系 ;当 r=0 时,说明 y 的 取值和 x 无关,即二者之间不存在线性关系(并不说明变量之间没 有任何关系)。若|r|1,说明变量之间线性关系越密切,|r|0,越 不密切。|r|0.8,高度相关;0.5|r|0.8,中度相关;0.3|r|0.5,低度相 关;|r|F,拒绝H0, 表明两个变量之间的线性关系是显著的 ;若 Ft/2,拒绝 H0,回归系数等 于 0 的可能性小于,表明自变量 x 对因变量 y 的影响是显著的 (两个变量之间存在着显著的线性关系);若

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号