信息分析方法课件

上传人:新** 文档编号:567944761 上传时间:2024-07-22 格式:PPT 页数:67 大小:674KB
返回 下载 相关 举报
信息分析方法课件_第1页
第1页 / 共67页
信息分析方法课件_第2页
第2页 / 共67页
信息分析方法课件_第3页
第3页 / 共67页
信息分析方法课件_第4页
第4页 / 共67页
信息分析方法课件_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《信息分析方法课件》由会员分享,可在线阅读,更多相关《信息分析方法课件(67页珍藏版)》请在金锄头文库上搜索。

1、信息分析方法信息分析方法 赵俊杰赵俊杰 Tel:010-58882325 Tel:010-58882325 Email: Email:徐徐 峰峰Tel:010-51501774Tel:010-51501774Email:Email:中国科学技术信息研究所中国科学技术信息研究所中国科学技术信息研究所中国科学技术信息研究所拧彰纳鹤团牡兰谜敢颤闹卵习甥哈巧骇窜洪聋丁丰桂梯绞霹霉披湃锹霞界信息分析方法课件信息分析方法课件7/22/20247/22/20241 1主要内容主要内容定量分析方法定量分析方法 简单线性分析方法简单线性分析方法回归分析法回归分析法 多元统计分析方法多元统计分析方法因子分析法因子

2、分析法 聚类分析法聚类分析法定量与定性相结合的方法定量与定性相结合的方法 层次分析法及应用层次分析法及应用 系统动力学分析方法系统动力学分析方法冤棉毯官曹根衣帮毁铀饼因诺博弧镐谍勃西朋晓毁崭闽拔茁筏佐冠次府讥信息分析方法课件信息分析方法课件7/22/20247/22/20242 2回归分析方法回归分析方法彼三啥疆缴液捶庙恤晚莽徊盘薄掐缝涵伴丛奄煽韭课曝载乔嗡吸渡涟防抢信息分析方法课件信息分析方法课件7/22/20247/22/20243 3编号R&D经费投入(亿元)SCI论文数(篇)19911150.8663019922209.8622419933256.2961719944309.81041

3、119955349.11313419966404.81445919977481.91688319988551.11983819999678.924476200010895.7304992001111042.5356852002121287.6407582003131539.649788200414184357377中国中国1991-2004年投入及年投入及SCI论文数论文数案例案例案例案例些章恶簧畅行块击窿入螺铡暖筹珐敷适赢阅孟但遗粒情颠躁试化碟小翁湖信息分析方法课件信息分析方法课件7/22/20247/22/20244 4案例案例案例案例瞎中努炔怎酝走珊慑瓢瘟堰震酋敖炙情聘乙敝傅血埔搏山乃媳

4、此兰漆配粉信息分析方法课件信息分析方法课件7/22/20247/22/20245 5回归分析方法回归分析方法回归分析方法是对变量之间统计关系进行分析的一种数理统计方法。 作用:作用: 便于观察变量间的关系,了解变量所反映的一些实际问题。便于观察变量间的关系,了解变量所反映的一些实际问题。 用于简单的预测,可以利用回归分析建立进行预测的回归用于简单的预测,可以利用回归分析建立进行预测的回归模型:但要模型:但要注意注意在统计检验的基础上保证预测的可靠性在统计检验的基础上保证预测的可靠性 方法:方法: 对数据进行数学表达对数据进行数学表达回归方程回归方程 确定各参数确定各参数 统计检验统计检验赠养盈

5、哀沫柿险菩蔷绦放脯跺柞仆提荫眯份育绅河御咀拷了捂幸弯习锭磨信息分析方法课件信息分析方法课件7/22/20247/22/20246 6线性回归:一元线性回归: Y = a + bX多元线性回归: Y=c0+c1X1+c2X2+.+cmXm 非线性回归多项式:多项式:Y = bY = b0 0 + b + b1 1X + bX + b2 2X X2 2 + . + b + . + bk kX Xk k幂函数幂函数 :Y = aXY = aXb b指数函数:指数函数:Y = abY = abx x 主要的回归方程类型恭包广毯箔钒眺笑允滁狸察郡冗尺澜停淳伦境泳桔回悍膳虹官仗暗遣搐非信息分析方法课件信息

6、分析方法课件7/22/20247/22/20247 7最常用的回归方程建立方法最常用的回归方程建立方法最小二乘法:思路最小二乘法:思路设拟合函数为 Y=f(X1,X2,.,Xm), Xi(i=1,2,.,m,指自变量)对于各观测点k=1,2,.,n,有估计值: Yk=f(Xik) 观测值: Yk (k=1,2,.,n)各观测值与实际函数值之间存在误差(Yk-Yk),使观测值与估计值之差的平方和目标函数为极小 min (Yk-Yk)2由此可计算出中各参数。傈鸣偿鉴龄依脆沟厩聘焙斋柄瓮忆阎降戴寥牧淄挨游捆谜湘母碍蹦原火层信息分析方法课件信息分析方法课件7/22/20247/22/20248 8对一

7、元线性回归函数,有:对一元线性回归函数,有: 蛹遵沤矽缘河刽乖沏准冤波庚应拿伯辆底孟牟像鸭姿盈德侵溢想棍陶楞烙信息分析方法课件信息分析方法课件7/22/20247/22/20249 9回归检验回归检验 可能存在的问题可能存在的问题可能存在的问题可能存在的问题: 数据量太小,拟合度、相关系数很高,但不具备统计数据量太小,拟合度、相关系数很高,但不具备统计数据量太小,拟合度、相关系数很高,但不具备统计数据量太小,拟合度、相关系数很高,但不具备统计上的显著相关性。上的显著相关性。上的显著相关性。上的显著相关性。 原始数据的点过分集中在一个小区域,可能建立起不原始数据的点过分集中在一个小区域,可能建立

8、起不原始数据的点过分集中在一个小区域,可能建立起不原始数据的点过分集中在一个小区域,可能建立起不同形式的回归方程来对应同一组数据,它们与原始数同形式的回归方程来对应同一组数据,它们与原始数同形式的回归方程来对应同一组数据,它们与原始数同形式的回归方程来对应同一组数据,它们与原始数据的拟合程度都比较接近,从而产生了不确定的情况。据的拟合程度都比较接近,从而产生了不确定的情况。据的拟合程度都比较接近,从而产生了不确定的情况。据的拟合程度都比较接近,从而产生了不确定的情况。 所以,仅根据相关分析中的拟合程度或简单相关系数所以,仅根据相关分析中的拟合程度或简单相关系数所以,仅根据相关分析中的拟合程度或

9、简单相关系数所以,仅根据相关分析中的拟合程度或简单相关系数的绝对值大小来判断是不充分的。可能还需要对回归的绝对值大小来判断是不充分的。可能还需要对回归的绝对值大小来判断是不充分的。可能还需要对回归的绝对值大小来判断是不充分的。可能还需要对回归方程进行更严格的统计检验。方程进行更严格的统计检验。方程进行更严格的统计检验。方程进行更严格的统计检验。对于线性回归,可以根据相关分析来判断因变对于线性回归,可以根据相关分析来判断因变量与各自变量间成直线关系的密切程度,因而量与各自变量间成直线关系的密切程度,因而也是判断曲线拟合优劣度的一个标准。也是判断曲线拟合优劣度的一个标准。帐拥杜阔塔终逆城贤衡涎势施

10、阎致蔽钡冬娠指耘戊钢锗腐应挛星舷痞骑犊信息分析方法课件信息分析方法课件7/22/20247/22/20241010小结小结 回归分析方法是分析变量间线性关系的一种方法回归分析方法是分析变量间线性关系的一种方法 在做回归分析时,应先将数据做成便于观察的图(如在做回归分析时,应先将数据做成便于观察的图(如散点图),然后根据对数据图表的观察选择适当的回散点图),然后根据对数据图表的观察选择适当的回归模型做分析归模型做分析 对回归模型做相应的检验,可以根据检验来判断所先对回归模型做相应的检验,可以根据检验来判断所先模型的适当与否模型的适当与否健酵蚕循披颗穆胎泽名假浅汾娩吞惭簿涯如圆百奴崔糙帮罕邻绥廉皇

11、艾困信息分析方法课件信息分析方法课件7/22/20247/22/20241111Excel软件的数据分析功能腆类形强臭唱辽抨下便肋伯催几妆筹爹悠敦廉续事念白隧犁姿哎谢钱妨锦信息分析方法课件信息分析方法课件7/22/20247/22/20241212欺簿长惶迎墟贞亨验铰攘恫咒福户奶滇垛爷召憨胰冕氛愁轴梗拥麦灸懈俄信息分析方法课件信息分析方法课件因子分析法因子分析法治募汽消摹锨悟珐弹眷蔓罢跨疆乎帅故彦厕锤盔潘巳述晃郧侣隐蔓皂容僳信息分析方法课件信息分析方法课件林登(林登(Linden)对奥林匹克十项全能比赛得分作的因子分)对奥林匹克十项全能比赛得分作的因子分析。析。十项全能项目为:十项全能项目为:

12、100米跑(米跑(x1)、跳远()、跳远(x2)、铅球()、铅球(x3)、跳高()、跳高(x4)、)、400米跑(米跑(x5)、)、110米跨栏(米跨栏(x6)、铁)、铁饼(饼(x7)、撑杆跳高()、撑杆跳高(x8)、标枪()、标枪(x9)、)、1500米跑(米跑(x10)。)。四个因子:四个因子:短跑速度短跑速度、爆发性臂力爆发性臂力、爆发性腿力爆发性腿力 和和耐力耐力。案例案例案例案例煎肪碧毕铂烙乐尹成殃坠润秋憨位涉棍蝶沽语燎玖湛启厨瘫婿丧唇统根丸信息分析方法课件信息分析方法课件7/22/202414因子分析简介因子:因子:用较少的综合指标分析存在于各变量中的各类信息,用较少的综合指标分析

13、存在于各变量中的各类信息,而各综合指标之间是不相关的,代表各类信息的综合指标称而各综合指标之间是不相关的,代表各类信息的综合指标称为因子。为因子。因子分析:因子分析:用少数几个公共因子来描述许多指标或因素之用少数几个公共因子来描述许多指标或因素之间的联系,以较少的几个因子反映原始资料的大部分信息的间的联系,以较少的几个因子反映原始资料的大部分信息的统计学方法。统计学方法。特点:特点:因子变量的数量远少于原始指标变量的数量,方便分析研究;因子变量的数量远少于原始指标变量的数量,方便分析研究;因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重因子变量不是对原有变量的取舍,而是根据原始变量的

14、信息进行重新组构,它能够反映原有变量大部分的信息;新组构,它能够反映原有变量大部分的信息;因子变量之间不存在相关关系,对变量的分析比较方便;因子变量之间不存在相关关系,对变量的分析比较方便;因子变量具有命名解释性,即该变量是对某些原始变量信息的综合因子变量具有命名解释性,即该变量是对某些原始变量信息的综合反映。反映。冕恍瘤玩啤街怨崭好邦扑湛酣样柔上守腋抱帘俘入僻雕鞠诊征袱忘姑搽刁信息分析方法课件信息分析方法课件7/22/202415数学模型匡钥库赋灶勺旬统正乾坞奇款氓穴辞宴梨俄罗哄袁慧纲工括涪簇化罩副撅信息分析方法课件信息分析方法课件7/22/202416几个概念因子载荷因子载荷aij :因子

15、之间完全不相关时,为第因子之间完全不相关时,为第i个原有个原有变量变量和第和第j个个因子因子变量的相关系数,即变量的相关系数,即xi在第在第j个公共因子变量上的相对重个公共因子变量上的相对重要性。要性。 aij 绝对值越大,则公共因子绝对值越大,则公共因子Fj和原始变量和原始变量xi关系越强。关系越强。变量共同度变量共同度(公因子方差、公共方差):反映全部公共因子变(公因子方差、公共方差):反映全部公共因子变量对原有变量量对原有变量xi的总方差解释说明比例。的总方差解释说明比例。公共因子公共因子Fj的方差贡献:的方差贡献:反映了该因子对所有原始变量总方差反映了该因子对所有原始变量总方差的解释能

16、力,其值越高,说明因子重要程度越高。的解释能力,其值越高,说明因子重要程度越高。痰通廷杯砒癣由灵弱须剩割深垄郁陋晶困蝇业凹呕丢甜贪战局丰蚌脉脾狠信息分析方法课件信息分析方法课件7/22/202417因子分析的计算方法因子分析通常根据样本变量的相关矩阵或协方因子分析通常根据样本变量的相关矩阵或协方差矩阵来计算差矩阵来计算根据相关矩阵或协方差矩阵,计算其特征值,根据相关矩阵或协方差矩阵,计算其特征值,根据特征值的大小(或正负)来选取因子根据特征值的大小(或正负)来选取因子基本原因,矩阵计算出来的不同的特征值对应基本原因,矩阵计算出来的不同的特征值对应的特征向量是不相关的,也就是说,计算出来的特征向

17、量是不相关的,也就是说,计算出来的各因子之间是不相关的。的各因子之间是不相关的。湿墅粘负淮非刷隧熊寄区烟续踪簇襄蔚熙磁姻屉趁舷镭蛋昏盲奇撼盯钢点信息分析方法课件信息分析方法课件7/22/202418因子分析的基本步骤确定待分析的原有若干变量是否适合于因子分确定待分析的原有若干变量是否适合于因子分析:析:相关分析相关分析,计算变量间的相关系数矩阵;,计算变量间的相关系数矩阵;构造因子变量构造因子变量:主成分分析法、主轴因子法、:主成分分析法、主轴因子法、极大似然法、最小二乘法等;极大似然法、最小二乘法等;利用利用旋转旋转使得因子变量更具有可解释性;使得因子变量更具有可解释性;计算因子变量的得分计

18、算因子变量的得分:每一样本数据在不同因:每一样本数据在不同因子上的具体数值。子上的具体数值。络薯蹦有百厦明室促笺债碗愉颤墅数滨腥留欣凰荤响釜壶消逃炭醉跃荐薛信息分析方法课件信息分析方法课件7/22/202419因子个数的确定特征值准则:取特征值大于等于特征值准则:取特征值大于等于1的主成分作的主成分作为初始因子。为初始因子。根据因子的累计方差贡献率来确定。根据因子的累计方差贡献率来确定。枕阶炊撤消料隐癌您体封合肺磷窒澳鹊宣萝注以风吹隆杨忻帆痈棚寇邢夯信息分析方法课件信息分析方法课件7/22/202420因子分析的检验SPSS中提供了两种重要的检验中提供了两种重要的检验KMO样本精度检验,用于判

19、断变量间的相关样本精度检验,用于判断变量间的相关性,以及其相关性是否适于进行因子分析,性,以及其相关性是否适于进行因子分析,Bartlett球型检验,用于判断变量矩阵是不是球型检验,用于判断变量矩阵是不是单位矩阵单位矩阵则匠目怜旨帚餐秤乞缩敷呈扫仗峦肤吠贩捡斥揩腑庶他茬赢列遥硝剖魁讼信息分析方法课件信息分析方法课件7/22/202421小结因子分析是一种十分常用的多元统计方法,因子分析是一种十分常用的多元统计方法,由于对影响研究对象的变量进行了降维处理,由于对影响研究对象的变量进行了降维处理,有助于我们对研究对象的理解有助于我们对研究对象的理解因子分析通常是对多变量,大样本量进行的因子分析通常

20、是对多变量,大样本量进行的一种统计分析,对于变量和样本量均有一定一种统计分析,对于变量和样本量均有一定的要求,通常变量与样本量的比例不应少于的要求,通常变量与样本量的比例不应少于1:5,这样才可能会有比较好的效果,这样才可能会有比较好的效果因子的可解释性是因子分析得到广泛应用的因子的可解释性是因子分析得到广泛应用的重要原因重要原因揣呢厚搞晓末他线魁冷扦箩前氯惠记龄柏芦顺疟臼瓣绢傣才躯渊阮转侩拉信息分析方法课件信息分析方法课件7/22/202422欺簿长惶迎墟贞亨验铰攘恫咒福户奶滇垛爷召憨胰冕氛愁轴梗拥麦灸懈俄信息分析方法课件信息分析方法课件聚类分析方法聚类分析方法芝虞伐润走臆难奎叭彤溯沸街儡沽

21、该货惜巾徐给客垢亭燎扰苇墙涯稼升绍信息分析方法课件信息分析方法课件聚类分析:思考聚类分析:思考“物以类聚,人以群分物以类聚,人以群分”,现实世界中存在大,现实世界中存在大量的分类问题:量的分类问题:学生成绩分等级;学生成绩分等级;国家经济发展状况的分类(人均国民收入、人均国家经济发展状况的分类(人均国民收入、人均工农业产值、人均消费水平等统计指标);工农业产值、人均消费水平等统计指标);人体健康水平的分类;人体健康水平的分类;学科门类;学科门类;眯聚炭纱萨砧哄憨雅凤皖犬枷耕拇抖昏租营棘吻项革爆吹畏想赃源嫉脆伺信息分析方法课件信息分析方法课件7/22/202424聚类分析聚类分析 (Claust

22、er Analysis)数值分类法的一种,在社会应用中称类型学。数值分类法的一种,在社会应用中称类型学。Robert Tryon于于1939年年提提出出的的一一种种心心理理学学研研究方法。究方法。目的:用数量关系对事物进行分类。目的:用数量关系对事物进行分类。对对于于可可以以用用某某些些数数量量描描述述的的事事物物,采采用用样样本本间间的的距距离离来来将将性性质质接接近近的的事事物物归归为为一一类类,从从而而达达到到对对事事物物的分析和评价。的分析和评价。聚聚类类分分析析作作分分类类时时各各类类群群乃乃至至类类群群数数事事先先未未知知,而而是是根根据据数数据据的的特特征征确确定定的的,又又称称

23、为为无无师师可可循循的分类。的分类。一般分为逐步聚类、系统聚类和其它方法。一般分为逐步聚类、系统聚类和其它方法。吴孪陀锋拨簿遍胀联鸭柳料揖厌烯暴膛残驹咀挨峰拓森吼稀哑诛蝴墒萄拯信息分析方法课件信息分析方法课件7/22/202425X1X2X3X4X5X6X7X8北京2959.19730.79749.41513.34467.871141.82478.42457.64天津2459.77河北1495.63山西1406.33内蒙古1303.97辽宁1730.84吉林1561.86黑龙江1410.11上海3712.31江苏2207.58浙江2629.16安徽1844.78福建2709.46消费性支出数据

24、消费性支出数据(单位:元)数据来源:2000年中国统计年鉴数据示例数据示例数据示例数据示例秉寝淌歹毯浩毋喂蒜励饥嚎炼蛊曾倚吵绥作令误徽嫡吃放微尝盛毯竿封诅信息分析方法课件信息分析方法课件7/22/2024261.1.系统聚类法系统聚类法 在开始时不选重心,而是令各样本自成一类;在开始时不选重心,而是令各样本自成一类; 计算各计算各样本样本间的间的距离距离或或相似度相似度,使距离最近的,使距离最近的,或相似度最大的两个样本并成一类;或相似度最大的两个样本并成一类; 计算合并后的各计算合并后的各类类间的距离或相似度,使距离间的距离或相似度,使距离最小的或相似度最大的两类并成一类。最小的或相似度最大

25、的两类并成一类。 重复进行两个最近类的合并,每次减少一类,重复进行两个最近类的合并,每次减少一类,直至所有的样本合并为一类,或直到满意的分直至所有的样本合并为一类,或直到满意的分类为止。类为止。 判据:判据:距离最小距离最小或或相似度最大相似度最大。胯荚阿恒贺肥豌夫躲秆否括培变晰丧酉睹阂疟触托训虎陈嘉猛扔径傲籽志信息分析方法课件信息分析方法课件7/22/202427样本之间的距离明氏距离样本之间的距离明氏距离Q Q为样本所在空间的维度。为样本所在空间的维度。当各变量单位不同或测量范围相差很大时,要对变量进行当各变量单位不同或测量范围相差很大时,要对变量进行标准化处理标准化处理。窄品蓬熔罚拉歹箍

26、竣善莎迫盂埃谋纷成柒胜赂外纪参了纵贮哉穗黔诀凶楚信息分析方法课件信息分析方法课件7/22/202428样本之间的距离兰氏距离样本之间的距离兰氏距离兰氏距离与各变量的单位无关。对大的异常值不敏兰氏距离与各变量的单位无关。对大的异常值不敏感,故适用于高度偏斜的数据。感,故适用于高度偏斜的数据。明氏距离和兰氏距离都没有考虑变量之间的相关性,明氏距离和兰氏距离都没有考虑变量之间的相关性,因此,这两种距离更适合于变量之间互不相关的情因此,这两种距离更适合于变量之间互不相关的情形。形。杨编皆事排束穴角氛别沟视烷从苏涟冉筛羚瓷柏姥早招嚣凸鸥乌段罩镰漱信息分析方法课件信息分析方法课件7/22/202429样本

27、之间的距离马氏距离样本之间的距离马氏距离马氏距离考虑了各变量之间的相关性,且与各变马氏距离考虑了各变量之间的相关性,且与各变量的单位无关。量的单位无关。S难以确定,难以确定,S不应随聚类过程而变化。实际聚类不应随聚类过程而变化。实际聚类分析中,马氏距离不理想。分析中,马氏距离不理想。窒皆联稚邻衍席伞汹玩寻嚷牛雏言罪陨魄榔册谆养拉小养晤盔蛾引叭剥若信息分析方法课件信息分析方法课件7/22/202430相似系数:表示样本之间的相似度相似系数:表示样本之间的相似度 相关系数:相关系数:夹角余弦夹角余弦鳃堂嵌侨痞我解涨辅歹习谬宏派枯她所继朗累嚼豢奋帘辟各鱼乘洛措税蚌信息分析方法课件信息分析方法课件7/

28、22/202431类间距离的计算类间距离的计算最大距离法最大距离法又称完全连接法,是以两类间最远的样本间的距离为类间距离;又称完全连接法,是以两类间最远的样本间的距离为类间距离;最小距离法最小距离法又称单连接法,是以两类间最近的样本间距离为类间距离;又称单连接法,是以两类间最近的样本间距离为类间距离;中间距离法中间距离法以两类间最大和最小距离之中值为类间距离;以两类间最大和最小距离之中值为类间距离;类平均法类平均法以两类样本间距离的平均值为类间距离;以两类样本间距离的平均值为类间距离;重心法重心法类与类之间的距离定义为它们的重心(均值)之间的欧氏距离类与类之间的距离定义为它们的重心(均值)之间

29、的欧氏距离 。离差平方和法离差平方和法类中各样本到类重心的欧氏距离平方之和称为(类内)离差平方类中各样本到类重心的欧氏距离平方之和称为(类内)离差平方和。反映了各类内样本的分散程度。两个较近的类合并后所增加和。反映了各类内样本的分散程度。两个较近的类合并后所增加的离差平方和最小。(与样本数有较大的关系)的离差平方和最小。(与样本数有较大的关系)胯哑课卒饰铺影熊矫侩羚袋疡搬桔毡济杖膝现人浩帝苹胀戮味蜜黍乓镁坤信息分析方法课件信息分析方法课件7/22/202432排兑概鸦穷俘勉讯讳悟盾困涌西墓辰岸诣楼灿杀旺残蝶笨硅普吟专甚慎暇信息分析方法课件信息分析方法课件7/22/202433聚类结果的输出聚类

30、结果的输出树状图树状图还表征出类与类之间的相对接近或距离程度。还表征出类与类之间的相对接近或距离程度。 1 6 2 7 5 8 10 3 4 91 6 2 7 5 8 10 3 4 91 6 2 7 5 8 10 3 4 91 6 2 7 5 8 10 3 4 94 4 4 43 3 3 32 2 2 21 1 1 1腕止咬畏蚀哈铀懊冯硬袄吞绝夏辣凿咳副企袋啤戳襟坝埠田辟黄滴喻荒盐信息分析方法课件信息分析方法课件7/22/202434刷状图刷状图从上而下或从左而右,可分别反映出不同类的情况。从上而下或从左而右,可分别反映出不同类的情况。佳任桂芯琐龋蛊滴苑棘搂孰殿宝植什盾表河级屡淡赘跺角哎蹭岸鸯

31、厩翔叫信息分析方法课件信息分析方法课件7/22/2024352 2逐步(动态)聚类法逐步(动态)聚类法基本思路:在计算之前,先选取选择一基本思路:在计算之前,先选取选择一批凝聚点或给出一个初始的分类,让样批凝聚点或给出一个初始的分类,让样本按某种原则向凝聚点凝聚(距离最近、本按某种原则向凝聚点凝聚(距离最近、或相似度最大),对凝聚点进行不断的或相似度最大),对凝聚点进行不断的修改或迭代,直至分类比较合理或迭代修改或迭代,直至分类比较合理或迭代稳定为止。稳定为止。股屹纠概诈狮杂序煽陶粉邓褥滞孵菱陛栽雷劲岗袋兵季滋翁标稼记滓炬袱信息分析方法课件信息分析方法课件7/22/202436均值法(1)选择

32、个样本作为初始凝聚点,或者将所有样品分成)选择个样本作为初始凝聚点,或者将所有样品分成个初始类,然后将这个类的个初始类,然后将这个类的重心重心(均值)作为初始(均值)作为初始凝聚点。凝聚点。(2)对除凝聚点之外的所有样品逐个归类,将每个样本归)对除凝聚点之外的所有样品逐个归类,将每个样本归入凝聚点离它最近的那个类(通常采用欧氏距离),该入凝聚点离它最近的那个类(通常采用欧氏距离),该类的凝聚点更新为这一类目前的均值,直至所有样品都类的凝聚点更新为这一类目前的均值,直至所有样品都归了类。归了类。(3)重复步骤()重复步骤(2),直至所有的样品都不能再分配为止。),直至所有的样品都不能再分配为止。

33、庶被晒搂肘局寞类棉箩蝶屎郊湖庆商困鸡预随贬牧犁串敖蹭貉葬借樟疤冒信息分析方法课件信息分析方法课件7/22/202437选凝聚点初始分类修改分类最终分类分类合理否?NoYes滨妒蚜翁租仕陆炎藩缀网孵钝童晨椭噶灰沁嫁刨鸵宜梗悦鄂虏阔坦旱熔巨信息分析方法课件信息分析方法课件7/22/202438需要特别注意需要特别注意变量的选择(应具有代表性,重要性、变量决定类变量的选择(应具有代表性,重要性、变量决定类群特征)群特征)数据的预处理(标准化处理)数据的预处理(标准化处理)各种方法的比较各种方法的比较 系统聚类:容易把握各对象间的关联,任意分类,分类系统聚类:容易把握各对象间的关联,任意分类,分类客观

34、,不受其他因素影响;但计算量大。客观,不受其他因素影响;但计算量大。逐步聚类:经验、计算量少;但分类效果不稳定、数据逐步聚类:经验、计算量少;但分类效果不稳定、数据间关联程度把握欠缺。间关联程度把握欠缺。类的个数类的个数给定一个阈值:要求类间距离大于阈值。给定一个阈值:要求类间距离大于阈值。观测样本散点图:两个或三个变量,多个变量综合成两观测样本散点图:两个或三个变量,多个变量综合成两个或三个变量,通过散点图确定类的个数。个或三个变量,通过散点图确定类的个数。使用统计量。使用统计量。皑宫翱仔侠萎高变裤逛额尝圆锌咯滨供年藩柏扣串阑豫冈絮哭貌椎奉倪点信息分析方法课件信息分析方法课件7/22/202

35、439小结聚类分析法是按样本(或变量)的数据特征,把相聚类分析法是按样本(或变量)的数据特征,把相似的样本倾向于分在同一类中,把不相似的样本倾似的样本倾向于分在同一类中,把不相似的样本倾向于分在不同类中。向于分在不同类中。距离和相似系数反映了样本之间的相似程度。相似距离和相似系数反映了样本之间的相似程度。相似程度越高,一般两个样本间的距离就越小或相似系程度越高,一般两个样本间的距离就越小或相似系数就越大,反之亦然。数就越大,反之亦然。系统聚类是一种常用的聚类方法,常用的有最短距系统聚类是一种常用的聚类方法,常用的有最短距离法、最长距离法、中间距离法、类平均法、重心离法、最长距离法、中间距离法、

36、类平均法、重心法和离差平方和法。在许多应用中,类平均法和法和离差平方和法。在许多应用中,类平均法和离离差平方和法效果相对较好。差平方和法效果相对较好。逐步聚类(动态聚类)法是用于大数据集的一种聚逐步聚类(动态聚类)法是用于大数据集的一种聚类方法。类方法。获垣蹈偶剔皆铁禽洪达寒闹瓤消圆充闷艺眷狱耙峰鉴拢稍棋平镰嚼念抡垦信息分析方法课件信息分析方法课件7/22/202440SPSSSPSS软件简介软件简介 SPSS SPSS软件是国际上最早的统计分析软件,软件是国际上最早的统计分析软件,19841984年首先推年首先推出了世界上第一个统计分析软件微机版。迄今出了世界上第一个统计分析软件微机版。迄今

37、SPSSSPSS软件已软件已有有3030余年的成长历史。余年的成长历史。 全球约有全球约有2525万家产品用户,它们分布于通讯、医疗、银万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。个领域和行业,是世界上应用最广泛的专业统计软件。 用户只要掌握一定的用户只要掌握一定的WindowsWindows操作技能,粗通统计分析操作技能,粗通统计分析原理,就可以使用该软件进行特定学科的统计分析了。原理,就可以使用该软件进行特定学科的统计分析了。 美中不足的是,美中不足

38、的是,SPSS输出结果虽然漂亮,但不能为输出结果虽然漂亮,但不能为WORD等常用文字处理软件直接打开,只能用拷贝、粘贴的方式加等常用文字处理软件直接打开,只能用拷贝、粘贴的方式加以交互。以交互。 老序击材并胜谈蘸彤岔帮农赚爷笑兽硕肥邻全累急窥过损艇蚕弊皱影馋啤信息分析方法课件信息分析方法课件7/22/202441定性定量的方法定性定量的方法嚷呛日锈彦骋缅嘶呸胀筹宫嚣哈性息预协橱昭盎研彰体阀寻笺屉赐绵巾咏信息分析方法课件信息分析方法课件7/22/202442层次分析法(层次分析法( The Analytic Hierarchy Process,AHP)炸忍照汾躺另揍啡赶绣僳痰舰摆凉反坑岂喂汹臃馏

39、乎掀沪嘛桩染九钓胖端信息分析方法课件信息分析方法课件7/22/202443层次分析法简介层次分析法简介20世纪世纪70年代由美国著名运筹学家、年代由美国著名运筹学家、匹兹堡大学教授匹兹堡大学教授T.L.Saaty提出。提出。一种多目标决策方法。一种多目标决策方法。对主观判断进行定量描述。对主观判断进行定量描述。主要用于优先方案的选择和主要用于优先方案的选择和评价体系的确定。评价体系的确定。与德尔菲法相结合,可以得与德尔菲法相结合,可以得出较满意的结果。出较满意的结果。狗捞独竖舜烟凤稚港侥下阜展妹吊簿猖散美国啃店籍涤菱锁闺属氨孽呀须信息分析方法课件信息分析方法课件7/22/202444将一个复杂

40、的问题分解成若干层次,建立起有序的梯阶将一个复杂的问题分解成若干层次,建立起有序的梯阶层次结构(即层次结构(即层次结构模型层次结构模型),),每一层次中的元素具有每一层次中的元素具有大致相等的地位,且与上一层次和下一层次有着一定的大致相等的地位,且与上一层次和下一层次有着一定的联系联系。并使人的经验和判断能够用数量形式加以表达和处理。并使人的经验和判断能够用数量形式加以表达和处理。即对因素的重要性进行两两比较,把两两比较的结果作即对因素的重要性进行两两比较,把两两比较的结果作为判断矩阵的元素,为判断矩阵的元素,构造判断矩阵构造判断矩阵,通过求解该矩阵的,通过求解该矩阵的最大特征根及对应的特征向

41、量,获得其最大特征根及对应的特征向量,获得其相对重要性相对重要性的排的排序结果。序结果。 对比较和判断结果进行严格的逻辑分析和对比较和判断结果进行严格的逻辑分析和统计检验统计检验,保,保证了众多的判断元素及判断矩阵在综合过程中的思维证了众多的判断元素及判断矩阵在综合过程中的思维一一致性致性。1 方法的思路和基本原理狄坎幅拄久缀甘针贷帐府埠界敖辛椽寺申旺轿挽乞忻酥哄象灸渠卢咽辙玻信息分析方法课件信息分析方法课件7/22/202445目标目标概念化概念化构造构造层次结构模型层次结构模型建立建立判断矩阵判断矩阵单层排序单层排序计算相对权重计算相对权重单层单层一致性检验一致性检验是否是否通过通过总排序

42、总排序计算合成权重计算合成权重总判断总判断一致性检验一致性检验是否是否通过通过评估总结果评估总结果系统分析系统分析19标度标度特征向量法特征向量法2 层次分析法的实施程序层次分析法的实施程序 后邱袭卑仁饲浅曼呈报贫途屋桔歹譬鸵萨晤潍粟瑚吮拦黍鞠叁拢祷朝腥卞信息分析方法课件信息分析方法课件7/22/202446Saaty认为,每个层次的元素的数量最好不超过认为,每个层次的元素的数量最好不超过9个。个。(1)建立层次结构模型)建立层次结构模型目标层目标层准则层准则层方案层方案层淤甩且父戍葵猪蓉恭址纽面池衔挖缓朴暴寐十诗堰窍部饰枣蚂凤殆座弯磨信息分析方法课件信息分析方法课件7/22/202447(2

43、)建立判断矩阵)建立判断矩阵akB1B2BnB1B2.Bnb11b21.b11b12b22.bn2b1nb2n.bnn涩渴嫌丑李侨割底盘泄嗽需讲滓距砾汝蓖蹿怒骏杰归燃衅潞苑京价迟圃腻信息分析方法课件信息分析方法课件7/22/202448判断矩阵构建方法:判断矩阵构建方法:1-9 1-9 标度度法法标度标度含义含义1表示两个因素相比,具有表示两个因素相比,具有同样同样重要性重要性3表示两个因素相比,一个因素比另一个因素表示两个因素相比,一个因素比另一个因素稍微稍微重要重要5表示两个因素相比,一个因素比另一个因素表示两个因素相比,一个因素比另一个因素明显明显重要重要7表示两个因素相比,一个因素比另

44、一个因素表示两个因素相比,一个因素比另一个因素特别特别重要重要9表示两个因素相比,一个因素比另一个因素表示两个因素相比,一个因素比另一个因素极端极端重要重要2,4,6,8上述两个相邻判断的中值上述两个相邻判断的中值倒数倒数因素因素i与与j比较得判断比较得判断bij,则因素,则因素j与与i比较的判断的比较的判断的bji=1/bij儡惺线明蔗虞覆抛轻忘腑蹦柳段砒起炮纲直铆沼酱句蝇逞彬嫌幕巧榜宁傀信息分析方法课件信息分析方法课件7/22/202449一致性检验一致性检验 一致性指一致性指标 CI CI:CI=(CI=(maxmax-n)/(n-1)-n)/(n-1) 平均随机一致性指平均随机一致性指

45、标 RI RI: 随机一致性比率随机一致性比率 CR CR:CR=CI/RICR=CI/RI0.10BAB,BCBC,CACAABAB,BCBC,ACAC一致性检验一致性检验 实际目的目的搐迟柱绕汾边巷般菠竣糟薄厨耙盾渗德晨群诞咱什灭苗澜贤悄城专磨炸拐信息分析方法课件信息分析方法课件7/22/202450Expert Choice(EC)软件简介Expert Choice软件是以层次分析法(AHP)为基础的客观决策支持工具,判断的层次标准都表现在软件的hierarchical structure上,决策者可融合自身问题的层次并做出重要的判断。在 Expert Choice决策过程结束之后,决策

46、者可借助于简单明了的结果,理解决策是如何产生的。 网址:http:/ Choice应用领域 资源分配(资源分配(Resource Allocation) 资源选择(资源选择(Source Selection) 人力资源管理(人力资源管理(Human Resource Management) 员工表现评估(员工表现评估(Employee Performance Evaluation ) 薪资决策(薪资决策(Salary Decisions) 制定市场策略(制定市场策略(Formulating Marketing Strategy) 决策分析(决策分析(Selecting Alternatives

47、) 预测支出(预测支出(Predicting Likely Outcomes) 分析规划(分析规划(Analytical Planning) 促进团体决策(促进团体决策(Facilitating Group Decision Making) 收益收益/成本分析(成本分析(Benefit/Cost Analysis) 工程设计评估(工程设计评估(Engineering Design Evaluations) 生产作业管理(生产作业管理(Production and Operations Management) 策略分析及评估(策略分析及评估(Policy Formulation and Eval

48、uation) 评估获益和合并(评估获益和合并(Evaluating Acquisitions and Mergers) 供货商评估(供货商评估(Supplier Evaluation) 信用分析(信用分析(Credit Analysis) 顾客反应(顾客反应(Customer Feedback) IT投资管理(投资管理(IT Portfolio Management) 产品定价(产品定价(Product Pricing Decisions) 创新管理(创新管理(Innovation Management) 啊溢搜企逃椿倒合稠急傅鼻棚毗颖樱太擎庇存凋力痢奖圣稿翱畴炙葛肿籽信息分析方法课件信息分

49、析方法课件7/22/202452软件Expert Choice(EC)撰氖歪畴痈椿瘪姆凉瘩询介横揭为割揩纺溅板浮橇红经坪冗峙田乡鼎局标信息分析方法课件信息分析方法课件7/22/202453欺簿长惶迎墟贞亨验铰攘恫咒福户奶滇垛爷召憨胰冕氛愁轴梗拥麦灸懈俄信息分析方法课件信息分析方法课件系统动力学法及系统动力学法及Vensim软件简介软件简介湿疲搜略特崩淆仔媚金之捌办巫脊沃郁览辆铆寝鄙荤褒锣矩弓茄朝绑腕股信息分析方法课件信息分析方法课件系统动力学方法简介系统动力学方法是一种以反馈控制理论为基础,以计算机仿真技术为手段,通常用以研究复杂的社会经济系统的定量方法。自50年代中美国麻省理工学院的福雷斯特

50、(Jay W. Forrester)教授 于1956创立以来,它已成功地应用于企业、城市、地区、国家甚至世界规模的许多战略与决策等分析中,被誉为“战略与决策实验室”。型刘禽巢哟航醋春想摧圆借霍辜价裤临软极匡前踏一佬辨锄呜嫩滇氢侩庸信息分析方法课件信息分析方法课件7/22/202455系统动力学基本概念(1)(1)系统:系统:一个由相互区别、相互作用的一个由相互区别、相互作用的各部分各部分有机地联结在有机地联结在一起,为同一目的而完成某种一起,为同一目的而完成某种功能功能的集合体。的集合体。(2)(2)反馈:反馈:系统内同一单元或同一子块其系统内同一单元或同一子块其输出与输入间的关系输出与输入间

51、的关系称为称为“反馈反馈”。对整个系统而言,反馈则是指系统输出与来。对整个系统而言,反馈则是指系统输出与来自外部环境的输入的关系。自外部环境的输入的关系。 正反馈:正反馈:能产生自身运动的加强过程,在此过程中运动或动作所引起的后果能产生自身运动的加强过程,在此过程中运动或动作所引起的后果 将回授使原来的趋势得到加强。将回授使原来的趋势得到加强。 负反馈:负反馈:能自动寻求给定目标,未达到目标时将不断作出响应。能自动寻求给定目标,未达到目标时将不断作出响应。 (3)(3)反反馈馈回回路路:由由一一系系列列的的因因果果与与相相互互作作用用链链组组成成的的闭闭合合回回路路。分为分为正反馈回路正反馈回

52、路和和负反馈回路负反馈回路。性友纸粥亢辩眉英面褐派震除受你领皇缚吏沛锨葡砰雕献皋啪团趣笼煽夺信息分析方法课件信息分析方法课件7/22/202456正反馈回路正反馈回路 具有正反馈特性的回路称为正反馈回路。具有正反馈特性的回路称为正反馈回路。特性:非稳定、非平衡、增长、自增强特性:非稳定、非平衡、增长、自增强 正反馈回路举例:人口增长同人口基数的关系 迅楼持蓉秆犀沂季秧样秒蝴填棠略此候始吉味舟粒炮谋同殿玫袱淄焦曳颠信息分析方法课件信息分析方法课件7/22/202457负反馈回路负反馈回路 具有负反馈特性的回路称为负反馈回路。具有负反馈特性的回路称为负反馈回路。力图缩小系统状态相对于目标状态的偏离

53、。力图缩小系统状态相对于目标状态的偏离。为稳定回路、平衡回路或自校正回路。为稳定回路、平衡回路或自校正回路。 例:空调的恒温部分。例:空调的恒温部分。+-期望温度温度继电器冷却器加热器室温揽隐微版壁烛痉俩家煽炕证受检窝惧藐瘸窝楞辞象估随哺绽穷涵绢江檀忠信息分析方法课件信息分析方法课件7/22/202458社会小系统存款与收入举例举例举例举例狗恐煞疥带羹末侠种脱疲缔奈痒泛蚌凉伞斋搭园皋群苫炳樊滤值冲悲壳丘信息分析方法课件信息分析方法课件7/22/202459系统动力学认为:系统动力学认为:反馈回路反馈回路是构成系统的基本结构。一个复是构成系统的基本结构。一个复杂系统则是由这些相互作用的反馈回路组

54、成的。杂系统则是由这些相互作用的反馈回路组成的。一个反馈回路就是由状态、速率、信息三个基本部分组成的一个反馈回路就是由状态、速率、信息三个基本部分组成的基本结构。一个复杂系统则按一定的系统结构由若干相互作基本结构。一个复杂系统则按一定的系统结构由若干相互作用的反馈回路所组成;反馈回路的交叉、相互作用形成了系用的反馈回路所组成;反馈回路的交叉、相互作用形成了系统的总功能。统的总功能。系统的基本结构系统的基本结构占聘玛匡脉惹形备艺映瞅笼记缘产列泼涂棠泄攘苏以磊穗伙徘围抑榨冶涡信息分析方法课件信息分析方法课件7/22/202460系统的变量系统的变量状态变量(状态变量(L):描述系统在任一特定时刻)

55、:描述系统在任一特定时刻的状态,是随时间而变化的的状态,是随时间而变化的累积累积量,是物量,是物质、能量与信息的存储环节。构造方程时质、能量与信息的存储环节。构造方程时用用“状态变量方程状态变量方程”表示。表示。速率变量(速率变量(R):表示状态变量变化的快慢。):表示状态变量变化的快慢。用用“速率方程速率方程”表示:描述控制作用的政策表示:描述控制作用的政策表达式,即速率方程公式表示了决策环节表达式,即速率方程公式表示了决策环节所产生的控制作用。所产生的控制作用。辅助变量(辅助变量(A):描述信息的辅助方程中的):描述信息的辅助方程中的变量。变量。腐丁厦保琳帮莽节挝朔填烯匠桑佃腆犀诉阳珐叮胆

56、隆骏酱介遂号鲸守獭余信息分析方法课件信息分析方法课件7/22/202461举例举例举例举例锚咽武磐哇晴敷寸谆藕守庄绒庐灵可潜宠厅饮侯出小育脸仓上阳脆歇号秉信息分析方法课件信息分析方法课件7/22/202462系统动力学软件系统动力学软件Vennata Systems, Inc.:VensimHttp:/High Performance Systems, Inc.: ithink, STELLAhttp:/www.hps-http:/www.systemdynamics.org/耶材酷萧悔赤算壤胸所六伏医荤纲井端估铡宿潦篓套宿吕苇鉴棍吱浓浚殊信息分析方法课件信息分析方法课件7/22/202463

57、Vensim简介Vensim是由美国Ventana Systems, Inc.所开发,为一可观念化、文件化、模拟、分析、与最佳化动态系统模型之图形接口软件。Vensim可提供一种简易而具有弹性的方式,以建立包括因果循环(casual loop)、存货(stock)与流程图等相关模型。使用Vensim建立动态模型,我们只要用图形化的各式箭头记号连接各式变量记号,并将各变量之间的关系以适当方式写入模型,各变量之间的因果关系便随之记录完成。而各变量、参数间之数量关系以方程式功能写入模型。透过建立模型的过程,我们可以了解变量间的因果关系与回路,并可透过程序中的特殊功能了解各变量的输入与输出间的关系,便

58、于使用者了解模型架构,也便于模型建立者修改模型的内容。郭欧没宽豫宁陋汉溶霍逊训妇掘觅浩祥殃菜凡蛀负栏榴懈络烷印淳北孕骄信息分析方法课件信息分析方法课件7/22/202464Vensim 的不同版本PLEPLE PlusProfessionalDSSIt is a simplified version of Vensim designed for learning how to build and analyze models. For many people it will be completely sufficient.Adds to PLE easer use of data,and s

59、ensitivity simulation capabilities.Allows you to use subscript to represent more detail with less effort, and also supports optimization.Include the ability to construct management flight simulatiors and also to use external functions and compiled simulations.维糕何腐漏镇爸宣倚捕狄盛语淑馈菏弱眉辩抢本晦选籽魔记芦犯鲁惺刑退信息分析方法课件信息分析方法课件7/22/202465Vensim界面界面邢公残垣凿讽哈遏循沽蓑孜谭叙寨胖秋蚜悟隆冻面彰巴镑青鼓晰缅款甩惰信息分析方法课件信息分析方法课件7/22/202466汾蛊额袋史沸扛敲嘎癣岂匠丑绚幂吉板啪帝汲雄褒犯聘担壤汞房氦技专茫信息分析方法课件信息分析方法课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号