运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案

上传人:飞*** 文档编号:42985422 上传时间:2018-06-04 格式:DOC 页数:16 大小:661.50KB
返回 下载 相关 举报
运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案_第1页
第1页 / 共16页
运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案_第2页
第2页 / 共16页
运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案_第3页
第3页 / 共16页
运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案_第4页
第4页 / 共16页
运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案》由会员分享,可在线阅读,更多相关《运用spss软件解决数学建模 楼盘的分类问题 论文 附有答案(16页珍藏版)》请在金锄头文库上搜索。

1、1楼盘的分类问题摘要本文结合统计学和因子分析学,对给出的楼盘指标信息进行系统聚类分析, 利用 spss 、excel 软件求解,得出楼盘分类类别、物业分类因素排名。 问题一:对表 1 的数据进行统计分析,建立了系统聚类分析模型,对楼盘 进行了分类。由于各因素的量纲不同,对其量纲化统一处理。最终得到楼盘的 物业类别,具体结果如下: 类别物业楼盘第 1 类甲级住宅1、7、9、10、12、14、15、16、17、22、25、26、31、 32、34、36、39、44、45、47、48、49、50、51、52、5 7、59、60、65、66、67、69、70、72 第 2 类别墅2、55第 3 类公寓

2、3、4、5、6、8、11、13、18、19、21、24、28、33、35 、37、38、41、42、43、46、53、54、56、63、64、68第 4 类甲级公寓20、27、30、58第 5 类经济适用房23、71第 6 类普通住宅29、40、61、62、73问题二:我们采用了主成分分析法,利用 spss 软件对 6 种物业类别 11 个 指标值进行了比较,根据其特征贡献率的不同,判断其影响程度的大小。贡献 率越高,影响越大。在 11 个指标中,某些指标对物业类别的分类影响甚微,以 至产生干扰,因此我们可以筛选某些变量,先筛选的变量影响最小,然后从小 到大依次排序,得出各种楼盘影响因素的顺序

3、。以普通住宅为例,得到结果如下: 均价、原装修、车位、配套、总套数、绿化率、物业费、户型、位置 、总占地 、物状。 本模型具有较强的适用性和普遍性,可以为决策者提供多种决策方案,具 有较强的实用价值。关键字:系统聚类分析 SPSS 软件 主成分分析法 欧式距离 特征值 累积贡献率 2一、问题的背景21 世纪是世界城市化高度发展的世纪。据联合国人居中心预测,2010年将 达到55% ,2025 年达到65% ,其中发达国家将达到83% 。发展中国家将达到61%。 我国目前的城市化水平约在30% 左右,不仅远落后于发达国家,也落后于发展 中国家的平均水平,滞后于相对社会经济发展,需要迅速加以提高。

4、随着我国 城市化进程的加快,人们在城市购房自然成为人人所关心的头等大事,那么我 们就必要了解房产情况;面对眼花缭乱的楼盘信息,如何根据自己的实际情况, 选择属于自己的物业呢? 针对人们的需求,开发商该如何投资建设,又该考虑建哪些物业及关于楼 盘该如何定价呢?解决这类问题是有很大的现实意义的。二、问题的提出与重述根据商品房个性化,一般可以将商品房自高至低划分为6种物业类别,分别 为:别墅、甲级公寓、公寓、甲级住宅、普通住宅、经济适用房。现得到某城 市一届房交会数据(见附表1),我们就此信息将解决以下问题: (1)给出表 1 各楼盘的物业类别; (2)关于该城市楼盘各物业类别,找出影响各物业类别的

5、主要因素(或因素顺 序);三、基本假设(1) 在人为的推测和软件的基础之上考虑,会出现许多的误差,假设误差极 小。 (2) 在进行定级、评分的时候,各数值不受人为因素的影响,假设没有过大 的差别。 (3) 各个楼盘的各个指标数的波动极微,其改变对结果的影响可以忽略不计;(5) 表 1 中的各个指标值相互独立; (6) 各数值不受人为因素的影响。四、主要变量符号说明:标准化后的数据矩阵(;); ijx73,.,2 , 1i11,.,2 , 1j:原始数据矩阵(;);ijx73,.,2 , 1i11,.,2 , 1j:楼盘 i 与楼盘 j 间的距离;ijd:相关矩阵;R:主成分;U五、问题的分析3

6、问题一: 根据已知的数据对给定的73 个楼盘进行分类,分成别墅、甲级公寓、公寓、 甲级住宅、普通住宅、经济适用房6 种物业类别。相当于将这73个楼盘通过聚 类,分成6 个类别。因此本文从聚类分析的角度对楼盘进行分类。 每种物业类别的的区别是根据不同的户型、物业、配套设施等11项指标信 息来判断。根据房地产方面的专业知识对物业结构进行初步的概念上的区分,以便对此 后的模型的建立有一定的较专业的认识。由于是看不到的房子的质量,楼盘环境, 期房相对现房一般来说是要便宜。 问题二: 在问题一的基础上比较各影响因素程度的大小。考虑到用主成分分析法, 引入了贡献率的概念,是指有效或有用成果数量与资源消耗及

7、占用量之比, 即产出量与投入量之比,或所得量与所费量之比 ,计算式如下: 贡献率(%)=某因素贡献量(增量或增长程度) /总贡献量(总增量 或增长程度) 100%主成分分析法是一种数学变换的方法, 把给定的相关变量通过线性变换成 不相关的变量,这些新的变量按照方差依次递减的顺序排列。变换中保持变量 的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方 差次大,且与第一变量不相关,称为第二主成分。以次类推,I 个变量就有 I 个主成分。 主成分分析实际上是一种降维方法。用较少的变量去解释原来资料中的大 部分差异,将许多相关性高的变量转化成彼此相互独立或不相关的变量。通常 是选出比

8、原始变量个数少,能解释大部分资料中的差异的几个新变量,即所谓 主成分,并用以解释数据的综合性指标。 运用主成分分析法便可以顺利地找出影响各物业类别的主要因素,得出因 素顺序。六、问题 1 的模型建立与求解建立系统聚类模型: 首先,将数据进行标准化,考虑到在实际问题中,不同类型的数据一般有 不同的量纲。为了使含有不同量纲的数据能进行同等比较,通常 需要对数据作以下变换:,jjij ijsxxx其中:, 731731iijjxx 7312 731ijijjxxs)(经上述变换后消除了量纲的影响。4然后,计算73个楼盘之间的距离矩阵。根据标准化指标数据,我们选择计 算楼盘之间的欧氏距离矩阵,公式如下

9、: 1112)(tjtitijxxd其次,进行系统聚类,其步骤如下: (1)初始聚类:将每个楼盘看作一类别,则各类之间的距离即等于各样点之间 的距离。 (2)合并距离最短的两类为一个新的类别。 (3)计算新类别与此时待合并的各类之间的距离。 对于不同的系统聚类方法,其具体计算距离的递推公式不同,下面用的是 离差平方和法。假设类 与类合并成新类 ,则 与任一类的距离递推公式为:pGqGrGrGiG2222 pq iri ip irqi ip irpi irDnnnDnnnnDnnnnD如果分类比较合理,则同类样品之间的离差平方和较小,类与类之间的离 差平方和较大。 事实证明,综合比较各种聚类方法

10、,发现本题运用离差平方法的效果较好。(4)聚类结束。将所有的样点合并为一个大类,否则就回到第3步继续。 聚类结束后,根据并类结构画出聚类分析关系图,建立模型1。5标准化计算距离构成 73 个类合并类类间距离聚类图1: 基于系统聚类分析模型进行物业类别判断的程序框图 通过spss运行将73个房屋进行了划分为六个类别。此外,还要确定各个类别的 物业类型。通过对各个指标值的区别比较,可以很准确的得到结果,因为我们 起初假设均价为最为主要因素,于是我们利用这点进行如下分析: 由于楼盘2、55的均价明显高于其他楼盘,因此可以判定第2类物业是别墅。 楼盘 23、71 的套数明显对于其他楼盘,且均价较低,物

11、业费也不高,故判定 第 5 类。为经济适用房。 楼盘 20、27、30、58 略低于别墅,属于第 4 类。为甲级公寓。 楼盘 3、4、5、6、8、11、13、18、19、21等属于第 3 类公寓,为公寓。 楼盘 1、7、9、10、12、14、15、16、17等属于第 1 类物业,为甲级住宅。 楼盘 29、40、61、62、73 则属于第 6 类物业,为普通住宅。 可以得到以下的结果:类别物业楼盘第 1 类甲级住宅1、7、9、10、12、14、15、16、17、22、2 5、26、31、32、34、36、39、44、45、47 、48、49、50、51、52、57、59、60、65、 66、67

12、、69、70、72 第 2 类别墅2、55第 3 类公寓3、4、5、6、8、11、13、18、19、21、 24、28、33、35、37、38、41、42、43、46 、53、54、56、63、64、686第 4 类甲级公寓20、27、30、58第 5 类经济适用房23、71第 6 类普通住宅29、40、61、62、73七、问题 2 的模型建立与求解在实际研究和应用中,由于指标较多,再加上指标之间有一定的相关性, 容易造成信息重叠,而一旦随意减少变量又会损失很多信息,可能产生错误结 论。而主成分分析法(Principal Component Analysis)可以将多个指标简化成 少数几个不相

13、关的综合指标,达到降低数据空间维度、简化系统结构的目的。 表1为利用SPSS对附录表l中的11个原始评价指标、73个评价对象(楼盘)数据计 算出来的相关系数矩阵的特征值及其贡献率。表1中,Extraction Sum$of Squared I卫adings为因子提取结果,是未经旋转的因子载荷的平方和。它给出 了特征值大于1的前四个因子,可以看出前四个成分所解释的方差占总方差的 67.865,具有较好的代表性,因此我们确定提取前四个主成分,这在一定程 度上减少了原始数据的复杂性。表一楼盘分类指标数据Total Variance ExplainedInitial EigenvaluesExtrac

14、tion Sums of Squared Loadings主成分特征值% 贡献率累计贡献率 %特征值% 贡献率累计贡献率%13.34530.41030.4103.34530.41030.41021.89517.22547.6341.89517.22547.63431.15110.46558.0991.15110.46558.09941.0749.76567.8641.0749.76567.8645.9328.47376.336 6.8017.28283.619 7.7076.42890.046 8.4163.77893.824 9.3903.54797.371 10.2171.96899.33

15、9 11.073.661100.000 Extraction Method: Principal Component Analysis.71110987654321C Co ommp po on ne en nt t N Nu ummb be er r43210E Ei ig ge en nv va al lu ue eS Sc cr re ee e P Pl lo ot t图一特征值碎石图由旋转后的因子得出的碎石图可以看出,因子l与因子2,以及因子2与因子 3之间的特征值之差值比较大,而因子4以后的特征值之间的差值都比较小。因 此可以进一步得出:保留3个因子将能够概括绝大部分信息,因此我们提

16、出3个 因子比较合适。通过对前三个因子的计算,可以得到四个主成分的线性表达式, 如表3。Component Matrix(a)Component1234V1-.214-.042.538-.671V2.521-.533.286.307V3-.548.623.258.297V4-.590.410.248.472V5-.193.438-.567-.085V6.533.169-.174-.194V7.098.685.086-.3498V8.716.358-.221.010V9.588.021-.189.173V10.728.404.313.058V11.812.266.331.134Extraction Method: Principal Component Analysis.a 4 components extracted.Rotated Component Matrix(a)Component1234V1-.095-.041-.045.880V2.196-.251-

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号