数学建模-sample

上传人:tian****1990 文档编号:71784147 上传时间:2019-01-21 格式:DOC 页数:14 大小:439.68KB
返回 下载 相关 举报
数学建模-sample_第1页
第1页 / 共14页
数学建模-sample_第2页
第2页 / 共14页
数学建模-sample_第3页
第3页 / 共14页
数学建模-sample_第4页
第4页 / 共14页
数学建模-sample_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《数学建模-sample》由会员分享,可在线阅读,更多相关《数学建模-sample(14页珍藏版)》请在金锄头文库上搜索。

1、基于特征价格理论的二手房估价模型摘要本文针对由区域因素、个体因素、市场因素等特征因素对上海二手房价产生的影响,根据题目表格所给数据进行处理与统计分析,以住宅特征价格理论、虚拟变量替代多分类变量、多元回归分析、时间序列等方法为基础,(1)建立了二手房价格评估的对数线性形式的特征价格模型(HPM),并依此为基础,(2)估计了“估价”表中案例的合理价格,(3)通过四级检验分析了该模型的评估精度,(4)对模型的局限性作出理性分析。针对问题(1),首先引入虚拟变量代替表格所给数据中的各特征变量(多分类变量),然后通过研究住宅特征价格理论,建立了特征价格模型,在遵循边际效用递减规律的前提下,改进为对数线性

2、形式的特征价格模型,再通过spss的逐步回归分析与matlab线性回归拟合曲线,得到如下对数线性形式特征价格模型对数?的关系式:其中,P表示房价,xi ( i=1,2,19 )为各影响因素对应的虚拟变量。针对问题(2),将“估价”表中的特征变量化为对应虚拟变量,再代入(1)中所得公式,估计出这些案例的合理价格。针对问题(3),根据(1)中求解出的方程、相应的matlab及spss结果,通过经济意义检验、统计检验(R2检验,F检验,t-检验)、模型预测检验,并分析相对误差与方差,得到了该特征价格模型“通过以上四级检验,可用于经济结构分析、经济预测”的结论。针对问题(4),主要考虑政策、季节等时间

3、序列因素对(1)中所得模型的影响有特色,将三年的房价转化为共12个季度的平均价格,再通过各时间序列因子对房价的影响,分析价格波动的原因。关键词 特征价格理论(HPM) 虚拟变量 多元回归分析 时间序列1、 问题重述 根据住房参与流通的时序结构,住房市场可以分为一级市场和二级市场。二手房的价格评估,涉及的不确定因素众多。评估的准确性与评估所采用的方法以及评估人的经验和资料丰富程度密切相关。“估价难”一直是交易过程中存在的一个突出问题,因此确定科学合理的价格评估模式,对二手房的价格进行客观科学准确地综合评估,不仅能提高签约成功率,还有助于减少商业纠纷。影响二手房价格的因素主要有区域因素、个体因素、

4、市场因素以及消费者的心理因素等。其中不仅包括客观因素,如行政区、房型、楼层、朝向、面积、房龄、装修等,还包括与房屋所在小区相关的主观因素。我们随机抽取了上海市20112013年的491个有效二手房交易案例,并聘请了5位经验丰富的专家对房产所在小区进行了评分,计划根据交易系统记录的主要数据、区域评分和实际交易价格来构建一个电子化的二手房价格评估系统。现需研究以下4个问题:(1) 建立评估上海二手房价的数学模型;(2) 利用模型给出附件Excel文件“估价”工作表中的案例的合理价格;(3) 对该模型的评估精度作出分析;(4) 对该模型的局限性作出分析。二、 模型假设2.1、所有家庭的偏好类似,买卖

5、双方的主观偏好不影响房屋价格;2.2、假设20112013年的房价不受通货膨胀和房市变化的影响;与后面不符2.3、假设楼房总楼层对房屋价格无影响与后面矛盾了;2.4、假设经验丰富的专家评分客观公正。3、 符号说明1、客观变量(分类变量) x1, x2, x3:行政区。 内环:x1=x2=x3=0; 中内环: x1=x2=0, x3=1;中外环: x1=x3=0; x2=1; 外环以外: x1=1,x3=x2=0 x4, x5, x6,x7:楼层。低层:x4= x5= x6=x7=0;多层:x4= x5= x6=0,x7=1;中高层:x4= x5= x7=0,x6=1;高层:x4= x6= x7

6、=0,x5=1;超高层:x4= 1,x5=x6= x7=0 x8, x9, x10:装修。 毛坯:x8=x9= x10=0; 普通装修: x8=x9=0, x10=1;精装修: x8=x10=0; x9=1; 豪华装修: x8=1,x9=x10=02、主观变量 x11:出行便利; x12:生活配套; x13:学区评分; x14:升值潜力; x15:医疗评分; x16:环境评分; x17:房龄; x18:面积; x19:朝向; P: 房价。四、数据预处理1、 对于附件Excel文件中数据异常或缺失的数据,编号196、275和448为面积列数据异常,编号219为面积项数列缺失,编号438为装修列数

7、据缺失,由于这5个数据占总体数据的比例很少,可使用个案剔除法进行处理,直接去掉这5个数据。加分2、 根据上海内环中环外环图1,将18个行政区分为4类,行政区4-虹口、5-黄浦、8-静安、9-卢湾为内环,行政区2-长宁、13-普陀、16-徐汇、17-杨浦、18-闸北为中内环间,行政区1-宝山、10-闵行、11-南汇、12-浦东为中外环间,行政区3-奉贤、6-嘉定、7-金山、14-青浦、15-松江为外环以外,分别赋值为1、2、3、4。3、 根据民用建筑设计通则2,楼层分为5等级,低层为13层,多层为46层,中高层为79层,高层为1029层,超高层为30层及以上,分别赋值为1、2、3、4、5。4、

8、由于朝向为南北和朝南的房子采光、通风俱佳,所以将通风采光性能好的朝向6-南北、7-南的分为一类。而附件Excel文件中数据朝向为15类的数据较少(仅为15例),无需再分类,故将其余通风采光性能差的5类朝向1-北、2-东北、3-东、4-西南、5-东南分为另一类,分别赋值1、0。5、 对于一般情况下,处理如面积、房龄、专家评分等量纲不同的变量时,需要现将其标准化,消除量纲,再进行分析。但从后文分析可以看出对面积、房龄、专家评分进行标准化对matlab检验数R2的影响不大,故对其不进行标准化。5、 模型建立与求解(1) 评估上海二手房价的数学模型1.1、问题分析本题所要求解的是评估上海二手房价的数学

9、模型,通过分析附件Excel文件“数据”工作表数据,可以得出其中自变量很多,所以首先对行政区、楼层、朝向、装修进行分类处理,分类标准可以参见表1.1,附录中表1.2为分类处理后的数据。表1.1 变量选取及其量化用表格很清楚序号变量变量的量化量化方式1行政区分为4等级,行政区4-虹口、5-黄浦、8-静安、9-卢湾为内环,行政区2-长宁、13-普陀、16-徐汇、17-杨浦、18-闸北为中内环间,行政区1-宝山、10-闵行、11-南汇、12-浦东为中外环间,行政区3-奉贤、6-嘉定、7-金山、14-青浦、15-松江为外环以外,分别赋值1、2、3、4分等级赋值2楼层分为5等级,低层为13层,多层为46

10、层,中高层为79层,高层为1029层,超高层为30层及以上,分别赋值为1、2、3、4、5。分等级赋值3朝向6-南北、7-南为1,1-北、2-东北、3-东、4-西南、5-东南为0虚拟量化4装修分为4档:毛坯、普通装修、精装修、豪华装修,分别赋值1、2、3、4分等级赋值1.2、模型建立1.2.1、住宅特征模型的函数形式3参考文献标注规范在竞争性市场的均衡条件下,住宅购买者所支付的价格应当补偿其各种属性所能带来的舒适度。已假设所有家庭的偏好和收入水平类似,那么这个市场所有住宅的价格就应当是这些属性的一个函数,这就是住宅的特征价格模型(hedonic price model,简称HPM)。我们采用对数

11、线性形式(log-linear) (1-1) 式中,P为研究对象的价格;a0表示除特征变量所引起价格变化外,所有其他影响价格的常量之和;ai为住宅特征变量;bi表示特征变量的特征价格似乎有误;表示误差项。自变量采用线性形式,因变量采用对数形式,则回归系数对应着特征价格与产品总价格之比。1.2.2、多元线性回归模型4一般的,影响实验指标的因素有多个,假设它们之间有如下线性关系式:y= b1x1+ b2x2+ bpxp+ (1-2)其中N(0,2).令=(b1,b2,bp)T ,x=(x0,x1,xp),表示为 y=x+.现获得y和x0,x1,xp的n组观测值,要求的估计值。设Y和X分别为相应n组

12、观测值的n1和nk矩阵,即Y=(yi)n1,X=(xij)np (1-3)则的估计值为 (1-4)1.2.3虚拟变量模型5虚拟的通常使用方法是,对一些通常表明“品质”或“属性”是否存在的属性变量,将其量化,给其赋值为“1”或“0”来表示虚拟变量出现某种属性和未出现某种属性。为了区分两个类别,只引入一个虚拟变量Di。一般规则是:如果一个定性变量有m个属性值,则仅引入m-1个虚拟变量。设某个回归模型含有p个数量变量和一个品质变量,该品质变量可以有k+1个(k1)水平,据此,可建立以下回归模型: (1-5)其中xi,p+1 ,xi,p+k为k个引入的虚拟变量,并且需要拟合的回归方程为 (1-6)通常

13、情况下,该方程能较好地通过线性性检验,弥补仅用数量变量拟合的不足。1.2.4、模型求解由于数据中定性自变量可以取多类值,我们初步设想引入多个0-1自变量,使用虚拟变量(0-1变量)代替分类变量好的,对于一般情况,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量。数据预处理的行政区、楼层、装修用虚拟变量(0-1变量)来代替,变量及其虚拟变量可见表1.3,附录中表1.4为虚拟变量处理后的数据。表1.3 变量及其虚拟变量序号变量虚拟变量虚拟变量间相互关系1行政区x1, x2, x3内环:x1=x2=x3=0; 中内环: x1=x2=0, x3=1;中外环: x1=x3=0; x2=1;

14、 外环以外:x1=1,x3=x2=02楼层x4, x5, x6,x7低层:x4=x5=x6=x7=0;多层:x4= x5= x6=0,x7=1;中高层:x4= x5= x7=0,x6=1;高层:x4= x6= x7=0,x5=1;超高层:x4= 1,x5=x6= x7=03装修x8, x9, x10毛坯:x8=x9= x10=0; 普通装修: x8=x9=0, x10=1;精装修: x8=x10=0; x9=1; 豪华装修: x8=1,x9=x10=0使用matlab运用逐步回归判断模型中众多变量哪些对整体影响不显著,但由于有19个变量因素,使用matlab做逐步回归时所得结果表太长,不利于分析,所以改用spss做逐步回归,根据运行结果,由表1.5可以看出变量x4, x6, x7,x10,x13对整体影响不显著,故在模型中忽略这5个变量缺少解释。表1.5 已排除变量模型Beta IntSig偏相关共线性统计量容差x4.004n.259.796.012.865x6.012n.802.423.037.865x7-.006n-.398.691-.018.798x10.024n1.030.304.047.385x13.020n.911

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号