五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx

上传人:小** 文档编号:79578211 上传时间:2019-02-17 格式:DOCX 页数:14 大小:89.60KB
返回 下载 相关 举报
五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx_第1页
第1页 / 共14页
五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx_第2页
第2页 / 共14页
五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx_第3页
第3页 / 共14页
五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx_第4页
第4页 / 共14页
五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx》由会员分享,可在线阅读,更多相关《五邑大学统计学简介及在实践中的应用:主成分分析法案例运用.docx(14页珍藏版)》请在金锄头文库上搜索。

1、统计学简介及在实践中的应用-以主成分分析法分析影响房价因素为例姓 名: 阳 飞学 号: 2111601015学 院: 经济管理学院指导教师: 吴 东 武时 间:二一七年一月六日1 简介统计语源最早出现于中世界拉丁语的Status,意思指各种现象的状态和状况。后来由这一语根组成意大利语Stato,有表示“国家”的概念,也含有国家结构和国情知识的意思。根据这一语根,最早作为学名使用的“统计”的是在十八世纪德国政治学教授亨瓦尔(G.Achenwall)。他在1749年所著近代欧洲各国国家学纲要一书的绪言中,就把国家学名定义为“Statistika”(统计)这个词。原意是指“国家显著事项的比较和记述”

2、或“国势学”,认为统计是关于国家应注意事项的学问。自此以后,各国就相继沿用“统计”这个词,更把这个词译成各国的文字,其中,法国译为Statistique;意大利译为Statistica;英国译为Statistics;日本最初译为“政表”、“政算”、“国势”、“形势”等,直到1880年在太政官中设立了统计院,这个时候才确定以“统计”二字正名。在我国近代史上首次出现是在1903年(清光绪廿九年)由钮永建、林卓南等翻译了四本由横山雅南所著的统计讲义录一书,这个时候才把“统计”这个词从日本传到我国。1907年(清光绪卅三年),由彭祖植编写的统计学在日本出版,同时在国内发行。这本书是我国最早的一本“统计

3、学”书籍。自此以后“统计”一词就成了记述国家和社会状况的数量关系的总称。关于“统计”这个词,后来又引申到了各种各样的组合,包括:统计工作、统计资料、统计科学。统计工作是指利用科学的方法搜集、整理、分析和提供关于社会经济现象数量资料的工作的总称,它是统计的基础,也称统计实践或统计活动。是在一定统计理论指导下,采用科学的方法,搜集、整理、分析统计资料的一系列活动过程。它是随着人类社会的发展、治国和管理的需要而产生和发展起来的,至今已有四五千年的历史。现实生活中,统计工作已经作为一种认识社会经济现象总体和自然现象总体的实践过程。一般包括统计设计、统计调查、统计整理和统计分析四个环节。统计资料是指通过

4、统计工作而取得的用来反映社会经济现象的数据资料的总称。 由统计工作所取得的各项数字资料及有关文字资料,一般都会反映在统计表、统计图、统计手册、统计年鉴、统计资料汇编和统计分析报告中。也称为统计信息,它是反映一定社会经济现象总体或自然现象总体的特征或规律的数字资料、文字资料、图表资料及其他相关资料的总称。统计资料包括刚刚调查取得的原始资料和经过一定程度整理、加工的次级资料。其所形式的成果较直观地可分为:统计表、统计图、统计年鉴、统计公报、统计报告和其他有关统计信息的载体等等。统计科学也称统计学,它是统计工作经验的总结和理论概括,是经过系统化后的知识体系。统计学是在后来研究如何搜集、整理和分析统计

5、资料的理论与方法,是应用数学的一个分支。主要通过利用概率论和数理统计来建立数学模型,通过模型可以把收集得到的所有数据,进行量化的分析、总结,从而进行推断和预测,以为后期所做的为相关决策提供依据和参考价值。现如今,统计学已经被广泛的应用在各门学科之上,包括从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。统计学主要又分为描述统计学和推断统计学。假设给定一组数据,统计学就可以通过摘要简单地来描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称之为推论统计学。这两种用法都可以被称作为

6、应用统计学。特别强调的是还有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。总体来说,“统计”一词的三方面涵义是紧密联系的,统计资料是统计工作的成果,统计工作与统计科学之间是实践与理论的关系。对于“统计学”,百度百科上是这样解释的:统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。随着社会经济的高速发展,人们已经逐渐进入了各种数据的时代。小到分析生活中的柴米油盐的价格分析,探究究竟怎样才能用有限的物资来满足生活所需,这就需要我们考虑用怎样的方法才能实现最大的目的;大到宇宙中的天体运行,分析各行星是如何运动的,以便于我们探究宇宙

7、的秘密,为航天事业做贡献。这种爆炸似的数据就迫切需要我们去获取、处理、分析、挖掘出其中有价值的信息。统计学就是为解决一系列数据问题而产生的一门学科,这门学科主要就是将生产生活中实际遇到的数据问题上升到理论层次,用用各种理论的方法来解决这些难题,得出一系列的结论;然后再将理论返回用于实际生活中,通过站在各种不同的视角,给出不同的政策建议。统计学最大的优点就是能够将理论与实际相结合,能够真正意义上的在实际中体现统计的价值,是的爆炸式的数据变得清晰客观。2 统计原理及其应用在学习统计学的方法时,主要的方法有聚类分析、主成分分析、因子分析、对应分析、典型相关分析等。2.1相关统计方法及原理2.1.1聚

8、类分析聚类分析是将个体或对象分类,使得同一类别的对象之间的相似性比与其他类的对象的相似性更强。目的是在于使类间对象的同质性最大化和类与类间对象的异质性最大化。这样就能把比较复杂的对象归成类,处理起来就大为方便。具体方法是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品或指标聚合为一类,把另外一些彼此之间相似程度较大的样品或指标又聚合为一类,关系密切的聚合到一个小的类单位,关系疏远的聚合到另外一分类单位,知道把所有的样品或指标都聚合完毕。把不同的类型一一划分出来,形成一个有小到大的分类系统。最后把整个分类系统

9、画成一张分群图(又称谱系图),用它就把所有的样品或指标间的亲疏关系表示出来。2.1.2主成分分析主成分分析(principal components analysis)也称主分量分析,是由Hotelling于1933年首先提出来的。主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而能够抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题

10、得到简化,提高分析效率。这样分析的原因是既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始数据变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。2.1.3因子分析因子分析(factor analysis)模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。相对于主成分分析,因子分子更加倾向于

11、描述原始变量之间的相关关系。因此,因子分析的出发点是原始变量的相关矩阵。因子分析不仅可以用来研究变量之间的相关关系,还可以用来研究样品之间的相关关系,通常把前者称之为R型因子分析,后者称之为Q型因子分析。2.1.4对应分析对应分析是R型因子分析和Q型因子分析的结合,它也是利用降维的思想已达到简化数据结构的目的,不过,与因子分析不同的是,它同时对数据表中的行与列进行处理,寻求以低维图形表示数据表中行与列之间的关系。对应分析的一大特点就是可以在一张二维图上同时表示出两类属性变量的各种状态,以直观地描述原始数据结构。2.1.5典型相关分析典型相关分析是研究两组变量之间相关关系的多元统计方法。他借用主

12、成分分析的降维思想,分别对两组变量提取主成分,且使从两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各个主成分互不相关,用从两组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系。近二十年来,随着计算机的发展以及各种统计软件的开发,作为一门基础学科的统计学在金融、保险、生物、医学、军事、经济、体育、运筹管理和工程技术等领域得到了广泛应用。许多领域因为运用了统计工具及统计思想而得到了延伸。2.2统计学的相关应用2.2.1统计学在经济学中的应用统计学在经济学中的作用主要有两方面,一是在其工具性上,统计学作为经济研究的基础工具,其作用自然不可小觑;二是在其思想性方面,统计学

13、是一门严谨的学问,其严谨的思想在追求精确和理性的经济学中占据重要的地位。经济学是研究在约束的条件下的最优化选择,即在资源稀缺的条件下,如何达到收益的最大化。于是,在研究中就存在成本、收益等等的概念和运算。同时,由于经济活动的多样性,研究中存在许多变化的因素,导致了经济研究的错综复杂,而统计学的用处就是在于为许多复杂的思想和现象提供了简洁而明了的解释,为许多错综的数据提供了计算模型,从而使经济研究简洁条理。如金融顾问们利用各种统计信息来引导投资这件事,拿股票投资来说,顾问们检查包括市盈率和红利在内的一系列金融数据。通过将某只个股的数据与股票市场平均数进行比较,金融顾问们就能够判断该只股票的价值是

14、被高估还是被套。2.2.2统计学在医学上的应用医学科研是一种目的性的研究,属于应用研究,是应用基础理论知识,以某一过程、方法、工艺、技术路线的研究成果上进行的研究。根据研究目的、内容选择好统计分析方法,即对不同性质的研究资料,应用不同的统计方法给予分析比较和评价,是保证科研成果真实性和可靠性的重要手段。常用的医学统计方法根据数据的基本类型而定时。如表:表1 数据类型和相应的统计方法数据类型差异比较的指标显著性比较法计量资料计数资料半定量资料。平均值率(%)等级、记分T检验、U检验、F检验U检验非参数检验(秩和、Ridit)2.2.3 统计学在社会生活中的应用统计全国人口状况、农业收成、经济情况

15、等数据,对一国经济与社会发展做统计性调查与研究。经过多年的发展,统计学在社会生活中的应用被专家学家们系统化专业化,形成了不同流派不同类别的统计学。而现在的人文社会统计分类便是对社会生活中统计学应用的专业化成果。人口普查、经济情况调查等都是统计学在社会生活中的应用。早在17世纪,统计学在社会生活中的应用就被提出了。在约翰格朗特1662年出版了对死亡表的自然观察和政治考察一书中,格朗特通过观察客观现象的数量关系,揭示出一系列统计规律,如男婴出生高于女生,男性死亡高于女性等,同时他还用最新颖的方法编制出了死亡率表。18世纪中末叶到19世纪中末叶期间概率论与统计学成功结合,使得统计学在生活中的应用更加

16、被加以重视。2.2.4 统计学在生命科学及生物制药领域的应用统计知识在生命科学、生物制药领域的应用是十分广泛的。以至于包括分子生物学中的统计方法、生物制药技术中的统计方法、流行病规律研究与探索的统计方法、人类染色体工程研究中的统计方法在内的各统计应用领域在不断发展壮大中。在医药学中,关于吸烟与肺癌发病率联系的分析、关于某种新药效果的研究,都普遍使用统计方法;19世纪中叶基因学说的创立,也是依赖于统计推断技术。2.2.5 统计学在企业生产及社会经济生活中的应用统计学在企业生产、经济生活中的应用很广,其中包括了保险精算、金融业数据库建设与风险管理、宏观经济监测与预测等一系列经济研究应用问题。在金融

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号