中级经济基础--Part-5-统计

上传人:jiups****uk12 文档编号:40249611 上传时间:2018-05-25 格式:DOC 页数:8 大小:77.61KB
返回 下载 相关 举报
中级经济基础--Part-5-统计_第1页
第1页 / 共8页
中级经济基础--Part-5-统计_第2页
第2页 / 共8页
中级经济基础--Part-5-统计_第3页
第3页 / 共8页
中级经济基础--Part-5-统计_第4页
第4页 / 共8页
中级经济基础--Part-5-统计_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《中级经济基础--Part-5-统计》由会员分享,可在线阅读,更多相关《中级经济基础--Part-5-统计(8页珍藏版)》请在金锄头文库上搜索。

1、孔凯旋中级经济基础-统计1第五部分第五部分 统计统计第二十二章第二十二章 统计与统计数据统计与统计数据1、统计学的两大分支: 1、描述统计通过图形、数学方法,表格,描述数据的一般性特征 2、推断统计样本总体:利用样本的数据来推断总体的特征 (1)参数估计:利用样本的数据来推断总体的特征。用 100 个人的考试结果来估计 1000 个人的考试结果 (2)假设检验:利用样本的数据来判断对总体的假设是否成立。事先已对 1000 个人的考试结果做了假设,现在用 100 个人的考试结果来检查原来的假设是否 成立2、变量 1、定量变量数量、数值 2、定性变量 (1)分类变量如性别。是类别,没有大小、好坏之

2、分 (2)顺序变量如对事物的满意程度、员工的受教育水平。是类别,有好坏之分,可以排序3、数据 1、定量数据又叫数值型数据,如企业的销售额、年龄、温度、长度 2、分类数据如性别里面,男性、女性 3、顺序数据如员工的受教育水平里面,本科、硕士、博士4、统计数据 1、按收集方法,分为: (1)观测数据通过观察、调查、测量而得到的数据。如社会经济领域的数据 (2)实验数据做实验获取的数据。如自然科学领域的数据 2、站在使用者的角度来看,分为: (1)一手数据使用者亲自调查或实验获取的 (2)二手数据别人调查或实验获取的,你直接拿来用5、统计调查的分类 1、按调查对象的范围(是所有还是部分) ,分为:

3、(1)全面调查所有。如普查 (2)非全面调查部分。如抽样调查、重点调查、典型调查孔凯旋中级经济基础-统计22、按调查时间是否连续,分为: (1)连续调查一段时间累加的结果,导致总数的变化。如国内生产总值、人口的出生/死亡、原材料投入、工厂的产品生产、能源消耗 (2)不连续调查一个时间点一次性调查总数。如生产设备的拥有量、耕地面积6、统计调查的方式 1、统计报表全面报表(大多数) ,非全面报表 2、普查人口普查、经济普查 特征: (1)一次性的,或者周期性的 (2)规定统一标准调查时间 (3)数据准确 (4)适用范围窄 3、抽样调查应用最广泛 特征: (1)经济性最显著优点 (2)时效性强 (3

4、)准确性高 (4)适用范围广 4、重点调查选择重点单位,在总额中占绝大多数比重。大中型 5、典型调查选择有典型意义、有代表性的单位第二十三章第二十三章 描述统计描述统计1、对统计数据分布特征的测度从三个方面进行: 1、集中趋势找中心值(1)均值(2)中位数(3)众数平均数从小到大或者从大到小先排顺序,再找位置居中的数, 位置(N + 1) 2出现次数最多的数均值是集中趋势最主要的测度值 适用于数值型数据,不适用于顺序数据和分类数据适用于数值型数据、顺序数据,不适用于分类数据 适于偏斜分布(不是正态分布)的数值型数据适用于数值型数据、顺序数据、分类数据 不唯一优点:充分利用全部数据,稳定性优 缺

5、点:易受极端值影响优点:不受极端值影响 缺点:没有充分利用全部数据,稳定性差于均值,优 于众数优点:不受极端值影响 缺点:没有充分利用全部数据,稳定性差孔凯旋中级经济基础-统计32、离散程度各变量值远离中心值的程度,各数据的差异程度 离散程度越大,差异程度越大,集中趋势的代表性越差(1)方差(2)标准差(3)离散系数(变异系数、标准差系数)差方标准差 = 方差的开平方根离散系数 = 标准差 算术平均数只适用于数值型数据只适用于数值型数据不能直接用标准差来比较不同变量的离散程度可以直接用离散系数来比较不同变量的离散程度3、分布形态(1)偏态系数(2)标准分数数据分布的偏斜方向和程度,对称程度标准

6、分数的平均数为 0,标准差为 1偏态系数等于 0,数据分布对称;大于 0,右偏;小于 0,左偏。00.5,轻度;0.51,中度;大于 1,严重。 偏态系数的绝对值越大(离 0 越远) ,数据分布越偏斜。68%的数据与平均数的距离在 1 个标准差之内,95%的在 2 个标准差之内,99%的 在 3 个标准差之内2、相关关系 1、按相关的程度,分为:完全相关、不相关、不完全相关 2、按相关的方向,分为:正相关(同方向变化) 、负相关(反方向变化) 3、按相关的形式,分为:线性相关(直线) 、非线性相关(曲线)3、散点图展示两变量之间的相关关系4、Pearson 相关系数:1 r 1度量两变量之间的

7、线性相关关系 1、I r I = 1,完全线性相关,r = 1,完全正线性相关,r = 1,完全负线性相关 2、r = 0,不存在线性相关关系(可能存在其他关系) 3、0 r 1,正线性相关,1 r 0,负线性相关相关程度:相关系数的绝对值越大,线性相关程度越高 I r I 0.3,无线性相关关系;0.3 I r I 0.5,低度相关;0.5 I r I 0.8,中度相关;I r I 0.8,高度相关第二十四章第二十四章 推断统计之抽样调查推断统计之抽样调查1、抽样 1、概率抽样(随机抽样) (1)特点:抽取样本依据随机原则;概率是已知的,但不一定相等;每个都有被抽中的可能性孔凯旋中级经济基础

8、-统计4(2)方法:等概率抽样,不等概率抽样 2、非概率抽样(非随机抽样) (1)特点:抽取样本不是依据随机原则,而是根据自己的方便或主观判断 (2)方法:判断抽样,方便抽样,自愿样本,配额抽样二、抽样调查的步骤:1、确定调查问题,2、设计调查方案,3、实施调查过程,4、数据处理分析,5、撰写调查报告三、调查的误差 1、抽样误差随机导致抽样误差,普查没有抽样误差 2、非抽样误差随机之外的所有原因导致非抽样误差,普查有抽样误差 (1)抽样框误差抽样框不完善 (2)无回答误差调查人员没能从受访者那里得到所需要的数据:受访者不在家,受访者拒绝回答,受访者因病无法回答 (3)计量误差:调查人员有意作弊

9、,调查人员提问或记录错误,问卷设计存在缺陷,受访者记忆模糊,受访者提供虚假数据4、概率抽样的方法 1、简单随机抽样最基本的随机抽样方法(1)缺点(2)适用条件没有利用抽样框中更多信息抽样框中没有更多信息可利用如果样本分布很分散,增加调查时间和费用样本分布范围不广阔如果个体差异很大,例如普通员工和经理的工资差别很大,算平均工资误差大个体差异不是很大2、分层抽样先分层,每一层之间有明显差别,再从每一层中随机抽取个体构成样本。 (1)从每一层中抽取个体的数量可以 等比例这层单位数量多,抽取的样本就多 不等比例这层单位数量少,增加抽取的样本;方差大的层多抽,方差小的层少抽。不等比例抽样比等比例抽样误差

10、小 (2)适用条件:抽样框中有足够信息可利用,能分层,层内个体之间差别小,层与层之间差别大 3、系统抽样先排序。最简单的系统抽样是等距抽样 (1)无关标识排列排列顺序与调查内容无关 (2)有关标识排列排列顺序与调查内容有关。有关标识排列比无关标识排列误差小 4、整群抽样先分群,群与群之间没有明显差别,群内个体之间差别大。抽出来的群全部都要调查,没抽中的群一个都不用调查 5、多阶段抽样五、估计量的性质(记忆:一无所有) 1、一致性即使样本量增大,估计量的值总是稳定于总体参数的真值孔凯旋中级经济基础-统计52、无偏性样本均值估计量的无偏性,是指所有可能样本均值的平均值总是与总体均值相等 3、有效性

11、两个估计量,哪个更密集在总体参数真值附近,哪个更有效6、估计量的方差 = (1 样本量 总体量) X (样本方差 样本量)= 没被抽中的比例 X 单位方差7、影响抽样误差大小的因素: 1、总体单位值之间的差异大小总体的数据分布差异越大,总体方差越大,抽样误差越大 2、样本量的大小抽中的样本量越多,没被抽中的比例越小,抽样误差越小 3、抽样方式的选择分层抽样的估计量方差比简单随机抽样的小 4、估计量的选择利用有效辅助信息的估计量可减小抽样误差8、影响样本量小大的因素: 1、调查的精度精度要求越高,误差越小,所需样本量越大 2、总体的离散程度总体离散程度越大,所需样本量越大 3、总体规模在大规模的

12、总体当中,总体容量对样本量没有影响;在小规模的总体当中,随着总体容量增加,样本量要增加 4、无回答的情况无回答情况越多,样本量要增加 5、经费的制约经费越多,样本量越多,经费越少,样本量越少第二十五章第二十五章 回归分析回归分析1、回归分析与相关分析的区别相关分析回归分析研究对象相同:都是研究两个变量之间的关系研究目的不同:研究变量之间的相关方向、相关程度,不能指出变量之间相关关 系的具体形式研究变量之间相关关系的具体形式研究方法不同:不能从一个变量的变化来推测另一变量的变化数学模型,可以从一个变量的变化来推测另一变量的变化,是因 果分析,首先需要确定自变量、因变量能起预测作用,利用估计的回归

13、模型预估因变量数值二、一元线性回归模型:Y = a + bX + c 自变量 X,因变量 Y,误差项 c 是随机变量一元线性回归方程:Y = a + bX 去掉 c,能起预测作用,a 是直线在 Y 轴上的截距,b 是直线的斜率 确定 a、b 的方法最小二乘法:因变量的观测值与估计值之间的离差的平方和最小孔凯旋中级经济基础-统计63、决定系数 R测度一元线性回归模型的拟合效果的指标,因变量变化占因变量总变化的比例 0 R 1R 越接近 1,回归直线的拟合效果越好,解释因变量的能力越强;R 越接近 0,回归直线的拟合效果越差 R = 1,所有观测点都落在回归直线上,回归直线可以解释因变量的所有变化

14、 R = 0,回归直线无法解释因变量的变化,因变量的变化与自变量无关第二十六章第二十六章 时间序列分析时间序列分析一、时间序列 1、绝对数时间序列总量 (1)时期序列:如国内生产总值 (2)时点序列:如年底总人口数、期末 2、相对数时间序列:如城镇人口比重 3、平均数时间序列:如人均国内生产总值二、时间序列的水平分析时间序列的水平分析平均发展水平 1、时期序列的平均数:一次简单算术平均 2、时点序列的平均数 (1)连续时点 每天登记:一次简单算术平均 指标值变动时才登记:一次加权算术平均 (2)间断时点:每隔一段时间登记 间隔相等:两次平均,第一次各时间间隔内的平均数,第二次简单算术平均 间隔

15、不相等:两次平均,第一次各时间间隔内的平均数,第二次加权算术平均三、增长量 = 报告期水平 - 基期水平 1、逐期增长量 = 报告期水平 前一期水平,以报告期前一期水平为基期 2、累计增长量 = 报告期水平 最初水平或固定水平,以最初水平或固定水平为基期累计增长量 = 逐期增长量的合计 3、平均增长量 = 逐期增长量的平均数 = 逐期增长量的合计 逐期增长量的个数 = 累计增长量 (最末时间 最初时间)四、时间序列的速度分析时间序列的速度分析孔凯旋中级经济基础-统计7发展速度增长速度1、发展速度 = 报告期的水平 基期的水平 (1)定基发展速度以某一固定时期的水平(通常是最初水平)为基期 (2)环比发展速度以报告期前一期的水平为基期1、增长速度 = 增长量 基期的水平2、定基积:定基发展速度 = 各个环比发展速度的连乘积环比比:环比发展速度 = 两个相邻的定基发展速度的比率(后期的除以前期 的) 求谁先说谁2、增长速度 = 发展速度 1 (1)定基增长速度 = 定基发展速度 1 (2)环比增长速度 = 环比发展速度 1 求增长速度必须通过发展速度3、例如各期的环比增长速度为 3%、6%、4%、8%,求定基增长速度: (1)环比增长速度为 3%、6%、4%、8%,意味着环比发

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号