高级统计方法简介PPT课件

上传人:工**** 文档编号:593311201 上传时间:2024-09-24 格式:PPT 页数:22 大小:177KB
返回 下载 相关 举报
高级统计方法简介PPT课件_第1页
第1页 / 共22页
高级统计方法简介PPT课件_第2页
第2页 / 共22页
高级统计方法简介PPT课件_第3页
第3页 / 共22页
高级统计方法简介PPT课件_第4页
第4页 / 共22页
高级统计方法简介PPT课件_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《高级统计方法简介PPT课件》由会员分享,可在线阅读,更多相关《高级统计方法简介PPT课件(22页珍藏版)》请在金锄头文库上搜索。

1、管理学院管理学院高级统计方法简介管理学院管理学院汇报提纲p数据的分类数据的分类p统计方法的分类体系统计方法的分类体系p各种统计方法简介各种统计方法简介p推荐书目推荐书目管理学院管理学院1 数据的分类定类变量(名义数据)定类变量(名义数据)定序变量(等级数据)定序变量(等级数据)定距变量(间距数据)定距变量(间距数据)定比变量(比例数据)定比变量(比例数据)非测量型非测量型测量型测量型管理学院管理学院2 统计方法的分类体系关系类型关系类型?因果模型因果模型因变量数?因变量数?非测量型非测量型多元回归多元回归单因变量单因变量Logistic回归回归因变量类型因变量类型?鉴别鉴别分析分析测量型测量型

2、非测量型非测量型自变量类型自变量类型?测量型测量型对数线对数线性模型性模型多重因多重因果关系果关系有有有否潜变量?有否潜变量?结构方结构方程模型程模型路径路径分析分析无无典型相典型相关分析关分析因变量类型因变量类型?多因变量多因变量测量型测量型非测量型非测量型自变量类型自变量类型?测量型测量型非测量型非测量型多元方多元方差分析差分析虚拟变量典虚拟变量典型相关分析型相关分析相依模型相依模型变量类型变量类型?测量型测量型关系结构类型?关系结构类型?变量之间变量之间聚类聚类分析分析因子因子分析分析类别结构类别结构对应对应分析分析非测量型非测量型案例之间案例之间A A:截面数据:截面数据管理学院管理学

3、院2 统计方法的分类体系事件史分析事件史分析B B:时间序列数据:时间序列数据连续时间模型连续时间模型离散时间模型离散时间模型Cox比例风险模型比例风险模型Logit 模型模型事件历史分析的主要目的是研究某一事件发生的方式和它的决定因素。事件历史分析的主要目的是研究某一事件发生的方式和它的决定因素。指数模型指数模型Gompertz模型模型Weibull模型模型加速失效时间模型加速失效时间模型管理学院管理学院3.1 因子分析p主要功能:缩减变量数(降维)主要功能:缩减变量数(降维)p基本步骤:基本步骤:计算所有变量相关矩阵,判别是否适合因子分析计算所有变量相关矩阵,判别是否适合因子分析(相关矩阵

4、大部分相关系数大于(相关矩阵大部分相关系数大于0.3适合;反映像适合;反映像相关矩阵很多元素值较大不适合;相关矩阵很多元素值较大不适合;Bartlett test of sphericity显著显著;KMO0.7以上)以上)提取公共因子提取公共因子(常用主成分分析法)(常用主成分分析法)因子旋转因子旋转(便于为公共因子命名,常用(便于为公共因子命名,常用Varimax)一种重要用法:评价一种重要用法:评价管理学院管理学院3.2 聚类分析p主要功能:对研究对象进行分类主要功能:对研究对象进行分类p基本步骤:基本步骤:选择变量选择变量(注意克服(注意克服“加入尽可能多的变量加入尽可能多的变量”的倾

5、向;的倾向;所选变量之间不应高度相关)所选变量之间不应高度相关)计算相似性计算相似性(相关测度(相关测度pearson相关系数相关系数;距;距离测度离测度欧式距离欧式距离*、绝对值距离、明科夫斯基、绝对值距离、明科夫斯基距离、马氏距离距离、马氏距离;关联测度;关联测度*简单匹配系数、雅简单匹配系数、雅克比系数、果瓦系数克比系数、果瓦系数)聚类聚类(层次聚类(层次聚类聚集法、分解法;迭代聚类聚集法、分解法;迭代聚类/快快速聚类)速聚类)聚类结果的解释与证实聚类结果的解释与证实管理学院管理学院3.3 对应分析p主要功能:揭示定性主要功能:揭示定性/非测量变量之间的联系非测量变量之间的联系p基本步骤

6、:基本步骤:对定性对定性/非测量型变量进行交叉汇总,得到对应分析非测量型变量进行交叉汇总,得到对应分析要求的汇总表要求的汇总表(注意检查(注意检查Crosstabs中是否有频数为中是否有频数为零的单元格)零的单元格)运行程序运行程序(AnalyseData reduction correspondence)检查运行结果和各种统计图,看是否已反映变量关系;检查运行结果和各种统计图,看是否已反映变量关系;若否,调整参数重新运行若否,调整参数重新运行解释分析结果解释分析结果管理学院管理学院3.4 多元线性回归p主要功能:分析一个测量型因变量与多个自变主要功能:分析一个测量型因变量与多个自变量之间的线

7、性关系量之间的线性关系p注意事项:注意事项:因变量必须是测量型随机变量因变量必须是测量型随机变量若自变量为非测量型,则需设置若自变量为非测量型,则需设置虚拟变量虚拟变量重点是回归模型的各项检验重点是回归模型的各项检验(整体线性拟合度检验(整体线性拟合度检验方差分析方差分析+判定系数判定系数R2;回归系数的检验回归系数的检验T检验检验;多重共线性的检验;多重共线性的检验容忍度和方差膨胀系容忍度和方差膨胀系数数;残差项异方差检验和自相关检验);残差项异方差检验和自相关检验)难点:多重共线性、异方差和自相关的诊断和排除难点:多重共线性、异方差和自相关的诊断和排除管理学院管理学院3.5 Logisti

8、c回归p主要功能:分析一个定性因变量与多个自变量主要功能:分析一个定性因变量与多个自变量之间的关系之间的关系p注意事项:注意事项:因变量是非测量型二值变量;若自变量为非测量型,因变量是非测量型二值变量;若自变量为非测量型,也需设置也需设置虚拟变量虚拟变量重点是回归模型的各项检验重点是回归模型的各项检验(整体检验(整体检验对数似对数似然比的卡方检验然比的卡方检验;回归系数的检验回归系数的检验Wald统计量统计量的卡方检验的卡方检验;系数子集的联合假设检验;系数子集的联合假设检验对数似对数似然比的卡方检验然比的卡方检验)难点:回归系数的解释难点:回归系数的解释(以(以logit p方程的线性表达方

9、程的线性表达式来解释;以发生比的指数表达式解释式来解释;以发生比的指数表达式解释)管理学院管理学院3.6 鉴别分析p主要功能:进行统计鉴别和分组主要功能:进行统计鉴别和分组(根据一些已经(根据一些已经分组的已知案例建立鉴别函数,然后根据鉴别函数对分组的已知案例建立鉴别函数,然后根据鉴别函数对所有案例重新分组)所有案例重新分组)p注意事项:注意事项:因变量是非测量型的分组变量因变量是非测量型的分组变量;自变量是用以分组自变量是用以分组的特征变量称为鉴别变量的特征变量称为鉴别变量重点掌握鉴别分析模型即鉴别函数的各参数指标及重点掌握鉴别分析模型即鉴别函数的各参数指标及统计检验统计检验(非标准化鉴别系

10、数、标准化鉴别系数;结构系(非标准化鉴别系数、标准化鉴别系数;结构系数数/鉴别负载;鉴别力指数鉴别负载;鉴别力指数/方差百分比、残余鉴别力方差百分比、残余鉴别力WilkS lambda;Fisher鉴别系数)鉴别系数)管理学院管理学院3.7 对数线性模型p主要功能:主要功能:通过数学方法来描述多个分类变量的交通过数学方法来描述多个分类变量的交互频数分布;可以在控制其他变量的情况下研究任意互频数分布;可以在控制其他变量的情况下研究任意两个变量之间的关联两个变量之间的关联p注意事项:注意事项:对数线性模型包括三类分析程序:分层模型分析对数线性模型包括三类分析程序:分层模型分析(从饱和模型入手得到简

11、约模型)(从饱和模型入手得到简约模型)、一般模型分析、一般模型分析(检验(检验简约模型能否准确拟合观测数据并推断总体)简约模型能否准确拟合观测数据并推断总体)和和logit 模型模型分析分析(直接服务于分类变量之间的因果关系)(直接服务于分类变量之间的因果关系)运用不同的模型,变量设置、项目设置均不同,能运用不同的模型,变量设置、项目设置均不同,能够提供的功能类型也不同够提供的功能类型也不同(整体检验整体检验、分层检验、单项分层检验、单项偏关联检验、自动筛选偏关联检验、自动筛选、参数估计、参数估计、Z值、置信区间、观测频值、置信区间、观测频数、期望频数、残差数、期望频数、残差)管理学院管理学院

12、3.8 典型相关分析p主要功能:两组变量之间的相关分析主要功能:两组变量之间的相关分析p注意事项:注意事项:它描述的是两个它描述的是两个变量组变量组之间的之间的整体的整体的相关形式;相关形式;要求两组变量之间为线性关系,即每对典型变量之要求两组变量之间为线性关系,即每对典型变量之间为线性关系;每个典型变量与本组所有观测变量间为线性关系;每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线的关系也是线性关系。如果不是线性关系,可先线性化(如取对数);所有观测变量为定量数据,定性化(如取对数);所有观测变量为定量数据,定性数据按照一定形式设为虚拟变量后也可放入典型性数据按照一

13、定形式设为虚拟变量后也可放入典型相关模型中进行分析相关模型中进行分析 管理学院管理学院3.9 多元方差分析p主要功能:同时分析和检验不同类别在多个测主要功能:同时分析和检验不同类别在多个测量型变量上是否存在显著差别量型变量上是否存在显著差别p注意事项:注意事项:因变量有多个且必须是测量型变量,自变量是非测因变量有多个且必须是测量型变量,自变量是非测量型变量量型变量因变量应为正态分布且方差相等,而且需要存在一因变量应为正态分布且方差相等,而且需要存在一定程度的线性相关定程度的线性相关例:例:Income、EduRatio、Natinality、Rural可构可构建单因素二元模型、双因素二元饱和模

14、型、双因素建单因素二元模型、双因素二元饱和模型、双因素二元非饱和模型二元非饱和模型管理学院管理学院3.10 路径分析p主要功能:确定多个变量之间的因果关系是否主要功能:确定多个变量之间的因果关系是否存在或因果关系强弱程度存在或因果关系强弱程度p注意事项:注意事项:实质内容就是计算路径系数实质内容就是计算路径系数(=标准回归系数,可通过标准回归系数,可通过回归分析得到回归分析得到)、残值项路径系数、残值项路径系数(=根号下根号下1-R2,通,通过回归分析得到的过回归分析得到的R2手工计算)手工计算)更重要的功用更重要的功用是通过是通过对变量间的简单相关系数进行对变量间的简单相关系数进行分解分解(

15、=直接效应直接效应+间接效应间接效应+虚假相关虚假相关+未析部分)未析部分),从而从而获得变量间相互作用的更深刻认知获得变量间相互作用的更深刻认知路径分析的检验是路径分析的检验是通过回归分析中对标准回归系数通过回归分析中对标准回归系数的的T检验检验实现的实现的管理学院管理学院3.11 结构方程模型p主要功能:确定多个变量之间的因果关系是否主要功能:确定多个变量之间的因果关系是否存在或因果关系强弱程度存在或因果关系强弱程度p基本步骤:基本步骤:模型设定模型设定(应根据理论或以往研究成果设定初始模型)(应根据理论或以往研究成果设定初始模型)模型识别模型识别(判定模型能否求出参数估计的唯一解:数据点

16、的(判定模型能否求出参数估计的唯一解:数据点的数目不能少于自由参数的数目)数目不能少于自由参数的数目)模型估计模型估计(最大似然估计、广义最小二乘估计)(最大似然估计、广义最小二乘估计)模型评价模型评价(GFI、AGFI、NFI、NNFI、IFI、CFI、RMSEA)模型修正模型修正软件:软件:LISRELAMOS管理学院管理学院3.12 离散时间Logit模型p主要功能:研究离散时间单位下的某一事件的主要功能:研究离散时间单位下的某一事件的发生与否及其决定因素发生与否及其决定因素p注意事项:注意事项:首先要对原始数据进行预处理,建立首先要对原始数据进行预处理,建立人年(人年(person y

17、ear)数据文件)数据文件然后运用然后运用Logistic回归模型回归模型分析分析例:晋升否、进入公司时间长短、进入前有否工作例:晋升否、进入公司时间长短、进入前有否工作经验、性别经验、性别管理学院管理学院3.13 Cox比例风险模型p主要功能:研究连续时间单位下的某一事件的主要功能:研究连续时间单位下的某一事件的发生与否及其决定因素发生与否及其决定因素p注意事项:注意事项:首先要对原始数据进行首先要对原始数据进行预处理预处理,建立,建立人年人年(person year)数据文件)数据文件然后利用然后利用“分析分析生存生存Cox regeression”进进行分析行分析例例:已婚妇女初育间隔、

18、学历、结婚年龄已婚妇女初育间隔、学历、结婚年龄管理学院管理学院3.14 其他一些连续时间模型p指数模型指数模型 常被称为单纯模型,因为它假设事件发生的概率为常数常被称为单纯模型,因为它假设事件发生的概率为常数pWeibull模型模型 b3被限制为必须大于被限制为必须大于1pGompertz模型模型 随机变量随机变量t服从服从Gompertz分布分布p加速失效时间模型加速失效时间模型 随机扰动随机扰动u有四种分布:正态分布、有四种分布:正态分布、logistic分布、极分布、极端值分布、对数伽玛分布,故端值分布、对数伽玛分布,故T得分布也有四种得分布也有四种管理学院管理学院p如果研究者认为研究方

19、案中的时间单位最好按离散方如果研究者认为研究方案中的时间单位最好按离散方式描述,就采用式描述,就采用离散时间离散时间logit模型模型p对于连续时间模型,如果可以认为风险函数是随时间对于连续时间模型,如果可以认为风险函数是随时间单调变化的,可以考虑选用单调变化的,可以考虑选用Weibull模型或模型或Gompertz模型模型;若果认为风险函数不是单调变化的,可以考虑;若果认为风险函数不是单调变化的,可以考虑对数正态、对数对数正态、对数logistic或或Cox比例风险模型比例风险模型事件史模型的选择管理学院管理学院4 推荐书目p郭志刚、社会统计分析方法郭志刚、社会统计分析方法spss软软件应用、中国人民大学出版社、件应用、中国人民大学出版社、1999p翁定军、社会定量研究的数据处理翁定军、社会定量研究的数据处理原原理与方法、上海大学出版社、理与方法、上海大学出版社、2002p薛薇、统计分析与薛薇、统计分析与SPSS的应用、中国人的应用、中国人民大学出版社、民大学出版社、2001p朱顺泉、管理科学研究方法朱顺泉、管理科学研究方法统计与运统计与运筹优化应用、清华大学出版社、筹优化应用、清华大学出版社、2007管理学院管理学院部分资料从网络收集整理而来,供大家参考,感谢您的关注!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号