多元统计分析简介课件

上传人:汽*** 文档编号:567702796 上传时间:2024-07-22 格式:PPT 页数:30 大小:67.50KB
返回 下载 相关 举报
多元统计分析简介课件_第1页
第1页 / 共30页
多元统计分析简介课件_第2页
第2页 / 共30页
多元统计分析简介课件_第3页
第3页 / 共30页
多元统计分析简介课件_第4页
第4页 / 共30页
多元统计分析简介课件_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《多元统计分析简介课件》由会员分享,可在线阅读,更多相关《多元统计分析简介课件(30页珍藏版)》请在金锄头文库上搜索。

1、一 、 判别分析 判别分析是用于判别个体所属群体的一种统计方法,它产生于上世纪30年代。近年来,在自然科学、社会学及经济管理学科中都有广泛的应用。1 判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物的分类的规律性,建立判别公式和判别准则。然后,当遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。2 例如,在评价产品的市场竞争力时,可根据商品的多项指标(诸如其内在质量、外型美观以及包装、价格等)判别消费者对商品喜欢或不喜欢;根据电子元器件不同寿命类别的样本特性检验,可总结出分类规律,对其他同批产品进行寿命预测分类和筛选;3 根据青

2、少年成长的主要环境和心理因素,对其道德行为做出判别和预测;根据病人的诸项检验指标判断他应属于什么病种及采取的医疗措施;4 根据人的形态特征,对远古人类遗骸的性别、年龄、人种、族属等进行判断;以及根据已有的气象资料来判断明日是晴天还是阴天,是有雨还是无雨。可见判别分析是一种应用性很强的统计数据分析方法。5 判别分析法有两总体判别与多总体判别之分。两总体判别是判别一个样本究竟属于已知的 两个总体G1与G2中的哪一个,如消费者对商品是喜欢还是不喜欢。6 而多总体判别问题是指事物本来的分类大于两类,例如,当病人肺部有阴影时,需要判断他是肺结核、肺部良性肿瘤还是肺癌(这时为三个总体的判别问题)。7 如果

3、已知某事物可分为K个总体:G1,G2,Gk,该事物的特性可由p个变量指标描述,并在进行分析之前,已观察到在G1中的n1个样本,在G2中的n2个样本这些数据信息。8 判别分析将根据这些已知的信息,建立事物分类的判别规则,以便今后用于判别一些新的样本点的总体归属 9 距离判别法的思想方法十分简单、直观。假设有两个总体G1 和G2,x Rp ,是一个新样本点,如果能够定义x到 G1 和G2的距离d(x,G1)和d(x,G2),则可用如下规则进行判别 若d(x,G2) d(x,G1) 若d(x,G1)=d(x,G2) 若d(x,G1) d(x,G2) 10 人类认识世界的一种重要方法是将认识对象进行分

4、类,比如有关世界的时间进程的研究,就形成了历史学,而有关世界空间地域的研究,则形成了地理学。 二 聚类分析 11 又比如在生物学中,为了研究生物的演变,需要对生物进行分类,生物学家根据各种生物的特征,将它们归属于不同的界、门、纲、目、科、属、种之中。12 事实上,分门别类地对事物进行研究,要远比在一个混杂多变的集合中更清晰、明了和细致,这是因为同一类事物会具有更多的近似特性。在企业的经营管理中,为了确定其目标市场,首先要进行市场细分。13 因为无论一个企业多么庞大和成功,它也无法满足整个市场的各种需求。而市场细分,可以帮助企业找到适合自己特色,并使企业具有竞争力的分市场,将其作为自己的重点开发

5、目标。14 通常,人们可以凭经验和专业知识来实现分类。而聚类分析作为一种定量方法,将从数据分析的角度,给出一个更准确、细致的分类工具。 15 要用数量化的方法对事物进行分类,就必须用数量化的方法描述事物之间的相似程度。一个事物常常需要用多个变量来刻画。16 如果对于一群有待分类的样本点需要p个变量描述,则每个样本点可以看成是Rp空间中的一个点。因此,很自然地想到可以用距离来测度样本点间的相似程度。 17 主成分分析的工作目标就是要对这种多变量的平面数据表进行最佳综合简化。也就是说,要在力保数据信息丢失最少的原则下,对高维变量空间进行降维处理。 三 主成分分析 18 很显然,识辩系统在一个低维空

6、间要比在一个高维空间容易很多。英国统计学家斯特格(M.Scott)在1961年对157个英国城镇发展水平进行调查时,原始测量的变量有57个。19 而通过主成分分析发现,只需5个新的综合变量(它们是原变量的线性组合),就可以从95的精度表示原数据的变异情况,这样,对问题的研究一下子从57维降到5维。可以想象,在5维空间对系统进行任何分析,都比在57维中更加快捷、有效。 20 另一项十分著名的工作是美国的统计学家斯通(Stone)在1947年关于国民经济的研究。他曾利用美国19291938年各年的数据,得到了17个反映国民收入于支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存

7、、股息、利息和外贸平衡等等。21 在进行主成分分析后,竟以97.4的精度,用三个新变量就取代了原17变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3(是时间t的线性项)。更有意思的是,这三个变量其实都是可以直接测量的。 22 在对变量系统进行简化时,有一个特殊情况尤其引起人们的关注:如果能将一个p维变量系统有效地降至2维,就可以在一个平面图上描绘每一个样本点,以直接观察样本点间的相关关系以及样本群点的分布特点和结构。23 所以,主成分分析使高维数据点的可见性成为可能。在数据信息的分析过程中,对直观图像的观察是一种重要的分析手段,它可以更好

8、地协调系统分析人员的思维与判断,及时发现大规模复杂数据群中的普遍规律与特殊现象,大大提高数据信息的分析效率。 24 在对变量系统进行简化时,有一个特殊情况尤其引起人们的关注:如果能将一个p维变量系统有效地降至2维,就可以在一个平面图上描绘每一个样本点,以直接观察样本点间的相关关系以及样本群点的分布特点和结构。25 所以,主成分分析使高维数据点的可见性成为可能。在数据信息的分析过程中,对直观图像的观察是一种重要的分析手段,它可以更好地协调系统分析人员的思维与判断,及时发现大规模复杂数据群中的普遍规律与特殊现象,大大提高数据信息的分析效率。 26 在当今的决策支持系统理论与方法的研究中,许多著名的专家学者都指出,将抽象空间或高维不可见空间中的信息以及一些更复杂的现象转换成直观的平面图示,这种平面思维的工作方式,能够极大地提高决策人员的洞察能力和增加决策者的知识,是实现决策支持系统高效率的最佳途径之一。 27 主成分分析在对多变量数据系统进行最佳简化的同时,还可以提供许多重要的系统信息,例如,数据群点的重心位置(或称平均水平),数据变异的最大方向,群点的散布范围等。28 一个多变量的高维系统怎么进行降维处理,这可以从最直观的例子来说明主成分分析的工作思路。2930

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号