高级统计学统计学课件上课讲义

上传人:yulij****0329 文档编号:137508172 上传时间:2020-07-08 格式:PPT 页数:108 大小:2.60MB
返回 下载 相关 举报
高级统计学统计学课件上课讲义_第1页
第1页 / 共108页
高级统计学统计学课件上课讲义_第2页
第2页 / 共108页
高级统计学统计学课件上课讲义_第3页
第3页 / 共108页
高级统计学统计学课件上课讲义_第4页
第4页 / 共108页
高级统计学统计学课件上课讲义_第5页
第5页 / 共108页
点击查看更多>>
资源描述

《高级统计学统计学课件上课讲义》由会员分享,可在线阅读,更多相关《高级统计学统计学课件上课讲义(108页珍藏版)》请在金锄头文库上搜索。

1、高级统计学,哈尔滨工业大学管理学院 葛 虹,高级统计学研究的对象,多指标或多变量数据 企业管理:产值、单位成本、原材料消耗、工资、劳动生产率、销售收入、利润、全要素生产率 居民家庭消费:家庭收入、家庭人口、阶层、中高档消费品支出等等,必备知识,概率论与数理统计 统计学 点估计 区间估计 假设检验,研究内容,简化数据结构,箱式数据,平面数据,变换,主成分分析 Principle Analysis,因子分析 Factor Analysis,变量间的依存关系+关系的强弱分析 寻找变量间的依存关系是一切科学研究的主要内容 寻找一般的规律:预测、控制,内容提要,教学内容结构,回归分析,One,Two,T

2、hree,定性数据建模,聚类分析,判别分析,主成分分析,因子分析,高级统计学,结构方程,预 测,回归分析,定性数据建模,分 类,聚类分析,判别分析,判 别,主成分分析,因子分析,结构方程,关联性分析,综合评价,统计学方法的应用以及内容之间的逻辑关系,应用范围,教学内容,参考书,多元统计分析(何晓群 编著) 中国人民大学出版社 应用统计(陆璇 编著) 清华大学出版社,预备知识,随机向量及其分布,随机向量的数字特征,随机向量的样本及其数字特征,多元正态分布,随机向量及其分布,P维随机向量: 联合分布函数: 联合密度函数:,随机向量的数字特征,随机向量的数学期望 随机向量的方差阵,随机向量的相关系数

3、阵,随机向量的样本及其数字特征,P维随机向量 的一个容量为n的样本:,的样本,的样本,的样本,样本均值,样本离差阵与样本方差阵,样本离差阵,样本方差阵,样本相关系数阵,与 的样本相关系数,相关系数阵计算的SPSS实现,多元正态分布,定义1 q维标准正态分布 设 独立同分布于 ,则称随机向量 服从q 维正态分布,记 Y 密度函数:,定义2 p 维一般正态分布 设 ,B为 实数矩阵, 为 维实数向量,则 是 维正态随机向量,记为: 其中 为非负定阵。,定理 1 若 服从 ,则 (1) , (2)密度函数: 定理2 与 分别是 和 的无 偏估计,即,回归分析,回归模型的诊断以及SPSS实现,2,多元

4、回归模型的诊断以及SPSS实现,5,为什么要建立线性模型,一般函数线性化,特殊函数线性化,简单易分析,相关性=线性性,线性模型,一元回归的SPSS实现,观察散点图 Graphs Scatter,点击1,点击2,点击1,点击2,点击3,点击4,点击,执行回归过程 Analyze Regression Linear,点击1,点击2,点击3,点击4,点击5,点击1,点击2,点击3,点击1,点击5,点击2,点击3,点击4,点击6,点击,点击2,可选,点击1,一元回归模型的建立,观察由n个样本 构成的散点图或计算样本相关系数,若呈现明显的相关性,建立数学模型 其中 是未知参数,需要利用样本对它们进行估计

5、.,散点图(1),参数 的最小二乘估计(1),模型1 最小二乘解:,矩阵偏导数与样本矩阵表达,模型2 最小二乘解: (1) 为y关于x的回归方程 (2)称 为方程的回归系数( ) (3)称 为残差, 为残差向量 (4)称 为残差平方和,参数 的最小二乘估计(2),散点图(2),与 的性质,性质1 , 性质2 ,且 即 的无偏估计是 性质3 与 相互独立,性质4 若 ,则 于是 的 置信区间是:,的样本标准差,一元回归模型的显著性,决定系数法 R Square + Adjusted-R Square 回归方程的显著性检验 方差分析 = F-检验,决定系数法,总平方和分解 决定系数,总平方和,回归

6、平方和,残差平方和,df = n-1,df = n-2,df = 1,方差分析法(回归方程的显著性检验),零假设 检验统计量,含义?,拒绝域(临界值法):,回归方程显著,P值法:,P0.05回归方程显著,方差分析表(ANOVA),Analysis of Variance,回归系数的显著性检验(1),零假设 检验统计量,含义?,拒绝域(临界值法),常数项显著,P值法,P0.05回归系数显著,回归系数的显著性检验(2),零假设 检验统计量,一元回归模型的诊断,前提假设,等方差性,独立性,正态性,误差的估计,残差与残差图,残差图(独立、等方差),残差图,残差不独立,异方差,检验 的正态性(Q-Q图)

7、,的,分位数,理论分位数,样本分位数,Q-Q图(Quantile-Quantile Plot),回归分析过程,建模过程 显著性检验过程 回归诊断过程,回归方程的显著性F检验,回归系数的显著性t检验,残差图,Q-Q图,参数估计,误差估计,多元回归模型的建立,模型 基本形式: 样本表达: 矩阵表达:,参数 和 的估计,参数 的最小二乘估计是 参数 的无偏估计是 其中 是残差平方和,与 的性质,性质1 性质2 即 是 的无偏估计 性质3 与 相互独立,性质4 若 ,则 于是 的 置信区间是:,的第i+1个对角元,性质5 若 (1) (2) 且与 相互独立 (3) ,多元回归模型显著性检验(1),决定

8、系数法 方差分析法 零假设: 检验统计量与其分布: ,含义?,回归系数的显著性检验(2),零假设 检验统计量与其分布: 其中 是 的第j+1个对角元,含义?,多重共线性,什么是多重共线性 p个自变量 在某种程度上是线性相关的 多重共线性可以造成参数的估计值严重偏离实际值 一个解释 : 的共线性使 接近奇异阵,从而使 中的对角分量或 的方差很大.,随机模拟方法,多重共线性对参数估计影响的例 原线性模型: 的观测值: 正态随机数: 由模型得到: 回归模型:,多重共线性的判定,方法1 相关系数法 若自变量间的相关系数1 ,则相应的两个变量之间有较强的共线性。 方法2 方差膨胀系数法( ) 若 是把第

9、j个自变量看作因变量,用其余p-1个变量作线性回归所得到的决定系数,则第j个自变量的方差膨胀系数为:,方法3 检查统计量的显著性. 很大,但没有几个显著的t统计量或 F统计量高度显著,而每个t统计量都不显著. 方法4 检查系数的标准差. 如果几个系数的标准差都很高,而且从方程中去掉一个或几个变量会降低剩下几个变量系数的标准差,此时有可能存在多重共线性.,共线性诊断的SPSS实现,点击,点击,原方程:,回归方程:,克服多重共线性的统计方法,逐步回归,岭回归,主成分回归,消除多重共线性,主成分回归,第一步:寻找主成分,第二步:如果第一和第二主成分的累积贡献率超过85%,则建立回归模型,随机模拟例的

10、主成分回归结果,第一主成分的贡献率为0.993 y关于第一主成分的回归模型为: 最后的整理结果为:,岭回归,逐步回归,引进变量过程,剔除变量过程,逐步回归的SPSS实现,习题 一,方差分析表,33.240,2,9,13.740,参数估计表,constant,x1,x2,B,Std. Error,11.307,-6.591,1.463,4.719,-1.486,t,7.719,回答如下问题,写出回归方程的表达式 回归方程是显著的吗? 回归系数是显著的吗?回归系数不显著的原因可能是什么? 计算决定系数和调整的决定系数 总体标准估计误差是多少? 临界值:,科研案例,刘小玄. 民营化改制对中国产业效率

11、的效果 分析2001年全国普查工业数据分析. 经济研究, 2004,(8):16-26,内容提要,本项研究利用了第二次全国基本单位普查数据(2001年),在全部工业的基础上,考察了最新的民营化发展动态,考察20多年来形成的改制面和所产生的相应绩效效果。按照现行的国家规定的企业产权注册的详细分类指标,我们得以将改制企业从一般公有制或私有制中加以分离,从而能够通过相应的实证模型,来检验不同所有权因素,尤其是改制形式的不同股权类型对于产业效率的影响及程度。主要的发现如下:(1)国有企业(包括传统国有、国有独资企业),对于效率具有明显的负效率,私营企业、股份制企业和三资企业则都表现为积极地对于效率的正

12、相关推动作用。其中,私营企业推动产业效率的作用最强,三资和股份合作企业其次,再次则是股份企业和集体企业。(2)对于改制企业的不同资本股份来说,个人资本普遍具有最显著的对于效率的正相关的积极效果,法人资本表现为显著性不稳定的正相关作用,集体资本表现与效率不相关的结果,而国家资本则表现出十分显著的负相关效果。(3)对于股份有限、有限责,任和股份合作企业这三种股份企业之间差异的分析表明:股份有限公司的规模效益作用明显小于股份制企业,这是较多的国有产权的消极作用抵消了规模效益的积极作用的结果。相对于股份有限公司,股份合作或有限责任公司的劳动贡献率明显高于资本贡献率,表明这类改制企业在改制后初期主要依靠

13、“劳动推动”或“人力资本推动”来提高企业效率。,产业效率决定因素的估计模型,销售收入,固定资产净值,就业人数,所有权结构变量,规模变量,所有权变量的度量:不同注册类型企业的实收资本占该行业总资本的比重 (国有、集体、私营、股份合作、有限公司、股份有限、港澳台合资、港澳资、外商合资、外商独资和其他,总共11种产权变量) 规模变量的度量:一行业内大型、中型或小型企业的市场份额,影响产业效率的国有因素,因变量,参数估计,(T检验值),截距,2.699,(14.36),LK,0.424,(12.56),LL,0.577,0.566,-0.555,0.801,(16.44),(3.21),(6.93),

14、(-8.37),大型,中型,国有,结论:国有企业对于效率具有明显的负效率,影响产业效率的其他所有制因素 股份公司中的不同资本所有权对于效率的作用 股份公司中的国家资本所有权对于效率的作用,读书报告(研究生网站上下载),至少两篇文献(所学专业) 报告内容包括: 研究的目的和意义 研究内容 研究方法 模型、变量的选择;模型的估计结果 结论 参考文献(格式按研究生毕业论文要求),实验报告(用于上机实验),寻找与本专业研究方向有关的数据 (报告中要给出数据,并说明数据的来源) 通过对数据的整理建立相关模型并说明: 研究的目的和意义 研究内容 研究方法 模型、变量的选择;模型的估计结果 结论 参考文献(格式按研究生毕业论文要求),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号