统计学复习范围更新

上传人:子 文档编号:42441339 上传时间:2018-06-02 格式:DOC 页数:4 大小:78.50KB
返回 下载 相关 举报
统计学复习范围更新_第1页
第1页 / 共4页
统计学复习范围更新_第2页
第2页 / 共4页
统计学复习范围更新_第3页
第3页 / 共4页
统计学复习范围更新_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《统计学复习范围更新》由会员分享,可在线阅读,更多相关《统计学复习范围更新(4页珍藏版)》请在金锄头文库上搜索。

1、第一章第一章 13 统计数据可分为哪几种类型?不同类型的数据各有什么特点?统计数据可分为哪几种类型?不同类型的数据各有什么特点? 一、(按计量尺度分) 1.分类数据(categorical data) ,对事物进行分类的结果,数据表现为类别,用文字 来表述,例如:人口按性别分为男、女两类(可用数字代码来表示) 2.顺序数据(rank data) 对事物类别顺序的测度,数据表现为类别,用文字来表述, 例如,产品分为一等品、二等品、三等品、次品等 3.数值型数据(metric data) 对事物的精确测度,是按数字尺度测量的观察值,结果 表现为具体的数值,例如:身高为 175cm、168cm、18

2、3cm 二、(按收集方法分) 1.观测的数据(observational data) 通过调查或观测而收集到的数据,在没有对事物 人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据 2.试验的数据(experimental data) 在试验中控制试验对象而收集到的数据,比如, 对一种新药疗效的试验,对一种新的农作物品种的试验等,自然科学领域的数据 大多数都为试验数据 三、(按与时间的关系分) 1.截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据,描述 现象在某一时刻的变化情况,比如,2009 年我国各地区的国内生产总值数据 2.时间

3、序列数据(time series data) 在不同时间上收集到的数据,描述现象随时间变 化的情况,比如,1996 年至 2009 年国内生产总值数据15 参数、统计量、参数、统计量、P9(区别、联系)(区别、联系) 参数参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某 种特征值。如总体平均数、总体标准差、总体比例等 统计量统计量是用来描述样本特征的概括性数字度量。是根据样本数据计算出来的 一个量,由于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标 准差。抽样的目的就是要根据样本统计量去估计总体参数。如:用样本平均数去估 计总体平均数,用样本标准去估计总体标准差,

4、用样本比例去估计总体比例。第二章 2概率抽样和非概率抽样的区别与联系,概率抽样和非概率抽样的区别与联系,P23 +P34 概率抽样也称随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一 定机会被选入样本。概率抽样.特点:按一定的概率以随机原则抽取样本;抽取样 本时排除主观意识,使每个单位都有一定的机会被抽中;每个单位被抽中的概率 是已知的,或是可以计算出来的 ;当用样本对总体目标量进行估计时,要考虑 到每个样本单位被抽中的概率 非概率抽样相对于概率抽样而言,不依据随机原则,而是根据研究目的对数 据的要求,采用某种方式从总体中抽出部分单位对其实施调查;非概率抽样.特点: 操作简便、时效快、成

5、本低;而且对于抽样中的统计学专业技术要求不是很高。 联系与区别:1.概率抽样:依据随机原则抽选样本;样本统计量的理论分布 存在;可根据调查的结果推断总体 2.非概率抽样(操作简便、时效快、成本低)不是依据随机原则抽选样本;样本统计量的分布是不确定的;无法使用样本的结果推断总体(探索研究) 。3P86 最上面一段需要简答: 即:4.1 一组数据的分布特征可以从哪几个方面进行测量?一组数据的分布特征可以从哪几个方面进行测量?答:数据分布的特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数 据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势; 三是分布的形状,

6、反映数据分布的偏态和峰态。这三个方面分别反映了数据分布特征的不同 侧面。4 P15 最下面一行,从普查数据到重要内容最下面一行,从普查数据到重要内容判断改错题。答案判断改错题。答案:有误差有误差5 。P28 实验数据:名词解释实验数据:名词解释+实验是检验变量间因果关系的一种方法。实验是检验变量间因果关系的一种方法。 实验数据是指在实验中控制实验对象而收集到的变量的数据。实验数据是指在实验中控制实验对象而收集到的变量的数据。 6 误差的控制:抽样误差可以采用相应的措施进行控制。误差的控制:抽样误差可以采用相应的措施进行控制。P39 1.抽样误差可计算和控制(主要方法是改变样本量) 2.非抽样误

7、差的控制:调查员的挑选,调查员的培训,督导员的调查专业水平,调查过程控 制,调查结果进行检验、评估,现场调查人员进行奖惩的制度。7 计算题:重点是平均值和方差。计算题:重点是平均值和方差。 参考:参考:1.P93 例例 4.7。例。例 4.118 P212 参数估计和假设检验的区别与联系。参数估计和假设检验的区别与联系。 答:答:参数估计和假设检验是统计推断的两个组成部分,他们都是利用样本对总体进行某 种推断,然而推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法, 总体参数 在估计前是未知的。而在假设检验中,则是先对 的值提出一个假设。然后 利用样本信息去检验这个假设是否成立。第

8、三章-数据的图表展示 P783.4 直方图与条形图有何区别?直方图与条形图有何区别?答: 1. 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固 定的。 2. 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比, 宽度则表示各组的组距,其高度与宽度均有意义。 3. 直方图的各矩形通常是连续排列,条形图则是分开排列。 4. 条形图主要用于展示分类数据,直方图则主要用于展示数值型数据。 3.6 饼图和环形图有什么不同饼图和环形图有什么不同?答:1. 饼图也称圆形图,是用圆形及园内扇形的面积来表示数值大小的图形. 它主要用 于表示总体或样本中各组成部分所

9、占的比例,对于研究结构性问题十分有用。 2. 环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示。环形图与圆形 图类似,但又有区别 圆形图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个 环 3. 环形图可用于结构比较研究,主要用于展示分类和顺序数据。 3.7 茎叶图与直方图相比有什么优点茎叶图与直方图相比有什么优点?它们的应用场合是什么?它们的应用场合是什么?答:茎叶图与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值, 即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的 数值。在应用方

10、面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。第四章数据的概括性度量 P109 4.5 简述众数、中位数和平均数的特点和应用场合简述众数、中位数和平均数的特点和应用场合。简答题答:众数是一组数据中出现次数最多的变量值,用 M0表示。它不受极端值影响,具有不 唯一性。众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。数据分布 偏斜程度较大时应用。中位数是一组数据排序后处于中间位置上的变量值,用 Me表示,也不受极端值影响。 它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺 序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。数

11、据分布偏斜程度较 大时应用。平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。它 易受极端值影响,数学性质优良。主要适用于数值型数据,而不适用于分类数据和顺序数据。 数据对称分布或接近对称分布时应用。 4.8 为什么要计算离散系数?与方差的区别为什么要计算离散系数?与方差的区别答:离散系数是一组数据的标准差与其相应的平均数之比。是对数据相对离散程度的测 度,消除了数据水平高低和计量单位的影响,主要用于对不同组别数据离散程度的比较。离 散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。第五章概率与概率分布例例 5.21 设设 X-N(0,1) ,求以下

12、概率:重点记住:,求以下概率:重点记住:=1,=2,=3 时的值是多少?时的值是多少? (1)P(X2)。 (3)P(-12)=1-P(X2)=1-=1-0.9773=0.0227)2((3)P(-1X3)= P(X3)-P(X-1)=-= -1-=0.9987-1+0.8413)3() 1()3() 1 (=0.84(4)P(IXI2)=2-1=2*0.9773-1=1.9546-1=0.9546)2(P148 例例 5.23 某种零件的长度服从正态分布,平均长度为某种零件的长度服从正态分布,平均长度为 10MM,标准差为,标准差为 0.2mm。试问:。试问: (1)从该批零件中随机抽取一件

13、,其长度不到从该批零件中随机抽取一件,其长度不到 9.4mm 的概率。的概率。 (2)为了保证产品质量,要求以为了保证产品质量,要求以 95%的概率保证该零件的长度在的概率保证该零件的长度在 9.5mm-10.5mm 之间,之间, 这一要求能否实现?这一要求能否实现? 解:已知 XN(10,0.22),则(1) P(X9.4)= 0013. 09987. 0131)3(2 . 0 104 . 9 (2)P(9.5x10.5)=9876. 019938. 0*215 . 225 . 25 . 22 . 0 105 . 9 2 . 0 105 .10 即可以用 98.76%的概率保证该批零件的长度

14、在 9.5mm10.5mm 之间,也就是说,该批零件的 质量要求可以实现。做练习题:P1545.18 一本书排版后一校时出现错误处数 X 服从正态分布 N(200,400) ,求: 1、出现错误处数不超过 230 的概率。 2、出现错误处数在 190-210 之间的概率。 解:已知 XN(200,202),则1.P(X230)= 9332. 05 . 12030 20200230 2.P(190X210)=3830. 016915. 0*25 . 015 . 020200190 20200210 注意:P166. 的抽样分布xP178 中间的图形95%的 值=1.96,90%的值=1.645

15、第七章 参数估计 正态总体、方差2已知,或非正态总体、大样本:例例 7.4 某城市想要估计下岗职工中女性所占比例,随机抽取了某城市想要估计下岗职工中女性所占比例,随机抽取了 100 位下岗职工,其中位下岗职工,其中 65 人为女性人为女性 职工。试以职工。试以 95%的置信水平估计该城市下岗职工中女性比例的置信区间。的置信水平估计该城市下岗职工中女性比例的置信区间。 解:已知 n=100, 1-=95%。根据抽样结果计算的样本比例为:p=65/100=65%)35.74%,65.55(%35. 9%65100%)651%(6596. 1%65)1 (2/nppzp该城市的置信区间为 55.65%74.35%。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号