统计学复习资料.doc

上传人:工**** 文档编号:544266992 上传时间:2022-09-06 格式:DOC 页数:25 大小:706.02KB
返回 下载 相关 举报
统计学复习资料.doc_第1页
第1页 / 共25页
统计学复习资料.doc_第2页
第2页 / 共25页
统计学复习资料.doc_第3页
第3页 / 共25页
统计学复习资料.doc_第4页
第4页 / 共25页
统计学复习资料.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《统计学复习资料.doc》由会员分享,可在线阅读,更多相关《统计学复习资料.doc(25页珍藏版)》请在金锄头文库上搜索。

1、第一章 绪论(客观题)重点:统计学的定义与分类,分支 基本概念(总体、总体单位、样本、标志)一、 统计学1. 统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是认识客观世界的有力工具。2. 统计的研究对象的特点:a) 数量性。统计数据是客观事物量的反映。b) 总体性。统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析。c) 变异性。总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的。3. 学是关于数据的科学,研究如何收集、分析、表述数据,并通过数据得出基本结论。4. 统计分为描述统计,推断统计、核算统计、理论统计、应用统计描述统计:汇总的表、图和

2、数值。包括搜集数据、整理数据、展示数据推断统计:用样本数据对总体性质进行估计,检验核算统计:对国家或地区经济运行过程及各类总量进行描述和分析二、统计学中的几个主要概念1.总体:根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。总体单位(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。根据总体所包含的单位数量,总体可以分为有限总体和无限总体两类。2.样本:由总体的部分单位组成的集合样本容量:样本所包含的总体单位数3.标志(变量):总体各单位普遍具有的属性或特征。标志的分类:

3、品质标志:单位属性方面的特征。品质标志的表现只能用文字、语言来描述数量标志:单位数量方面的特征。数量标志可以用数值来表现三、几种常用的统计软件SAS SPSS MINITAB STATISTICA Excel第二章 数据 (选择,判断,简答)重点:1.数据及其相关概念 2.品质数据与数量数据 3.数据的计量尺度 4.统计调查方式 5.调查误差 6.数据分组一、数据及其相关概念1.数据:所收集、分析、汇总表述和解释的事实及数字数据是进行统计分析研究的基础数据是统计学研究对象的特征,是客观事实数据不仅仅局限于数字范畴,包括非数字形式的其他信息 2.个体总体单位:收集数据的实体,也就是数据的承载者

4、变量:个体的特征或者属性变量值:个体在变量上的具体表现指标亦称统计指标,是说明总体的综合数量特征的。标志:总体各单位普遍具有的属性或特征指标与标志的区别:标志是说明总体单位特征的,而指标是说明总体特征的。指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的。二、品质数据与数量数据 1.品质数据:不能用数字来表述的特征。如人的性别,民族,宗教信仰等 2.数量数据:用数字能够表述的特征,数值型特征,如人的身高,体重等 3.区别:数量数据总是以数字形式表现,品质数据可以是数值型,也可以是非数值型。只有数量数据可以进行数学运算三、数据的计量尺度 1. 数据的计量尺度分为定类尺度、定序尺

5、度、定距尺度、定比尺度 2.定类变量:“名义型变量”,值只能用文字表述计量层次最低,对事物进行平行的分类,地位平等,没有高低优劣之分各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求,数据表现为“类别”具有=或的数学特性,如性别,民族,党派3.定序变量:“顺序型”变量,变量值只能用文字表述 对事物分类的同时给出各类别的顺序比定类尺度精确,但未测量出类别之间的准确差值数据表现为“类别”,但有顺序性具有或的数学特性,如优秀,良好,及格,不及格4.定距变量:变量值为数值型对事物的准确测度,比定序尺度精确,没有绝对零点具有 + 或 - 的数学特性,如温度,公元纪年等极少数现象属于定距变量5.

6、定比变量:数据表现为“数值”对事物的准确测度,与定距尺度处于同一层次,有绝对零点具有 或 的数学特性,可以进行任何形式的计算6.四种计量尺度的比较四种计量尺度的比较琰茞定类尺度定序尺度定距尺度定比尺度 分类(, ) 排序( ) 间距( + ,- ) 比值( ,) 四、统计调查方式1.统计调查方式有普查、抽样调查、典型调查、重点调查2.普查:为特定目的专门组织的非经常性全面调查通常是一次性或周期性的;一般需要规定统一的标准调查时间应用范围比较狭窄,如人口普查,工业普查3.抽样调查:从总体中随机抽取一部分单位(样本)进行调查分重复抽样和不重复抽样目的是推断总体的未知数字特征遵循随机性原则;存在调查

7、误差,并且可以加以控制具有经济性、时效性强、适应面广、准确性高等特点4.典型调查:从调查对象的全部单位中选择少数典型单位进行调查目的是描述和揭示事物的本质特征和规律调查结果不能用于推断总体5.重点调查:从调查对象的全部单位中选择少数重点单位进行调查调查结果不能用于推断总体优点在于调查单位少,可以调查较多的项目和指标,了解较详细的情况。即用较少的人力和时间,取得较好的效果。组织重点调查的关键问题是确定重点单位。五、调查误差1.调查误差:收集的数据资料与真实情况之间的差距调查误差本身不确定,或者说是未知量2.调查误差的种类:登记性误差和代表性误差登记性误差:由于调查者或被调查者的人为因素所造成的误

8、差。理论上讲可以消除代表性误差:用样本数据进行推断时所产生的误差。通常无法消除,但事先可以进行控制和计算六、调查分组 1.分组方法:单变量值分组和组距分组(等距分组和异距分组)2.单变量值分组:将一个变量值作为一组适合于离散变量和变量值较少的情况单变量值分组表:表2 某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221123.组距分组:将

9、变量值的一个区间作为一组适合于连续变量和变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组4.组距分组步骤:(1) 确定组数:组数的确定没有专门的规定,应以能够显示数据的分布特征和规律为目的。建议组数:5-20组(2) 组限:变量值区间两端的值,上限和下限(3) 确定各组组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定注意:开口组只有一个组限,无法计算组距,开口组以相邻一组的组距作为其组距(4) 根据分组整理成频数分布表 编制频数分布表的步骤:确定组数确定组距计算频数编制表格5.下限:一个组的最小值 上限:一个组的最大值组距:上限与

10、下限之差组距( 最大值 - 最小值) 组数 组中值:下限与上限之间的中点值组中值=(下限值+上限值)/26.等距分组表(使用开口组)表5 某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110114115119120124125129130134135以上358141064610162820128第三章 单变量描述统计 (计算,客观题) 重点:1.频数与累计频数 2.集中趋势的度量 3.离散程度的度量 4.偏态与峰度的测度 一、频数与累计频数 1.频数次数:对总体经过分组后形成各组单位数在各组间的分布。也就是各类别中的数据个数。2.累计频数 (P62 表3-3) 向

11、上累计:将各组次数和比率,由变量值低的组向变量值高的组逐组累计。向下累计:将各组次数和比率,由变量值高的组向变量值低的组逐组累计。二、集中趋势1.定类数据:众数 (M0)众数:出现次数最多的变量值。不受极端值的影响,可能没有众数或有几个众数主要用于定类数据,也可用于定序数据和数值型数据对单项式分组数列确定众数:出现次数最多的标准值就是众数(书P63例3.2)对组距数列确定众数:出现次数最多的组作为众数所在组 2.定序数据:中位数和分位数 a.中位数(Me):排序后处于中间位置上的值.不受极端值的影响主要用于定序数据,也可用数值型数据,但不能用于定类数据 中位数位置的确定: (看书P65 例3.

12、4)未分组数据:组距分组数据: (根据向上/下累计法确定中位数) 未分组数据的中位数的计算公式: b四分位数:把数据分为4部分,处在分位点的数值 第1个四分位数为下四分位数(QL),第3个为上四分位数(QU),间为QM=Me不受极端值的影响 主要用于定序数据,也可用于数值型数据,但不能用于定类数据四分位数位置的确定:未分组数据:下四分位数位置=(N+1)/4 上四分位数位置=3*(N+1)/4组距分组数据:下四分位数位置=N/4 上四分位数位置=3N/4 c.百分位数 P百分位数: p%据项的值小于等于P百分位数(100-p)%的数据项的值大于等于P百分位数3.定距和定比数据:均值 (P69

13、例3.10)a.值易受极端值的影响用于数值型数据,不能用于定类数据和定序数据简单均值的计算公式为 权均值的计算公式为 各变量值与均值的离差之和等于零各变量值与均值的离差平方和最小b.调和平均数:于定比数据,能用于定类数据和定序数据 计算公式:=Xf/f=Xf/(1/X)*XF=m/(1/X)*m4.众数、中位数和均值的比较 对称分布:均值=中位数=众数 左偏分布:均值中位数中位数众数 三、离散趋势及其测度 1.离中趋势:反映各变量值远离其中心值的程度。2.定类数据:异众比率 (P76 例3.14)异众比率:数组的频数占总频数的比率计算公式为越大代表性越不好,反之越少代表性越好 3.定序数据:四分位差(QD) 上四分位数与下四分位数之差: QD = QU - QL反映了中间50%数据的离散程度(越少越好)4.定距和定比数据:方差及

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号