银行贷款发放问题

上传人:shaoy****1971 文档编号:108683768 上传时间:2019-10-25 格式:DOC 页数:24 大小:886.50KB
返回 下载 相关 举报
银行贷款发放问题_第1页
第1页 / 共24页
银行贷款发放问题_第2页
第2页 / 共24页
银行贷款发放问题_第3页
第3页 / 共24页
银行贷款发放问题_第4页
第4页 / 共24页
银行贷款发放问题_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《银行贷款发放问题》由会员分享,可在线阅读,更多相关《银行贷款发放问题(24页珍藏版)》请在金锄头文库上搜索。

1、A银行贷款发放问题1.摘要 商业银行需要根据申请贷款的企业所提供的经营状况的相关资料对其打分以决定是否对其贷款,而本文旨在为银行的评判贷款系统建立一种判别准则,并向银行高层管理者阐述所建准则的正确性及合理性。 对于问题一,针对如何建立判别准则,我们以题目中已知的600个申请贷款企业的背景资料及打分情况为基础,建立BP神经网络模型,取样本中的前500项作为学习样本,将后100项作为检验样本,利用改进的BP神经网络算法分别得出先验概率(学习样本的正确率)和后验概率(检验样本的正确率),并利用贝叶斯估计中共轭分布的原理,以先验概率和后验概率尽量接近为目标,通过不断修正BP算法中隐层节点数、训练步数以

2、及不同的学习函数等重要因素,在减少学习时间,加快收敛速度的同时也提高了准确度,最终得到了一个比较成熟的网络作为信用评判准则。与之同时,对这600个企业重新打分,具体打分情况详见附录中表3,表4,最终得到先验概率为97%,后验概率为82%,加权得到与原始打分情况的接近率为 94.5% 。 对于问题二,利用问题一中所建立的判别准则,直接输入预处理后的数据,最后得到这53个企业的打分表,具体打分情况详见附录中表5。对于问题三,针对数据缺失的问题,我们着眼于如何将缺失数据补全,利用数据挖掘技术,在排除使用多元线性回归来对空缺数据进行补全的方法后,最终采用了热卡填充法、平均值填充法以及条件平均值填充法相

3、结合的方法对缺失数据进行补全。使用三种插补方法相结合不但减少了主观因素对数据填充的的消极影响而且很好地综合了三种方法各自的优势。然后利用问题一的判别标准对补全后的数据进行打分,具体打分情况见附录中表 7。对于问题四,我们为银行高层管理者写了一份报告,其中用通俗的语言,深入浅出的阐述了我们所构建的判别准则的正确性及合理性。关键词:改进的BP神经网络 先验概率 后验概率 贝叶斯共轭分布 数据挖掘技术 1. 问题重述本题是有关商业银行发放贷款的问题。为了有效地减少金融风险,商业银行需要根据申请贷款的企业所提供的其经营状况的相关资料进行打分,若打分为“+”, 表明该企业信用不好,则不向其发放贷款;打分

4、为“”,则表明可以向该企业提供贷款。 通过根据题目中已给出的600个申请贷款的企业经营状况的相关资料建立数学模型确定出银行对企业是否贷款的判别准则,并依据该准则重新对已知的那600个企业进行打分,观察依据该准则得到的判别结果与原始结果的接近程度,并利用该准则分别对另外打分情况未知的90个申请企业进行打分以确定是否对其贷款。其中,在这90个企业中,前53个企业的背景资料中的属性值完全给出,而后37个企业的背景资料的部分属性由于种种原因没有给出。最后,为银行高层管理者拟定一份报告,深入浅出地说明所制定的判别方法的正确性及和合理性。2. 模型的基本假设1. 题目已知中所给的600个申请贷款企业的背景

5、资料及打分情况均是正确合理的。2.题目中给出的资料不全的企业,不考虑因其漏填或有意不填相关属性值对其信用评价的影响。3.题目所给的600个申请企业相关资料的排列顺序是随机放置的。3.符号说明 第K次训练的权值与阈值矩阵 第K次训练后的误差函数梯度 学习速率 第i个输入节点 第j个隐层节点 第l个输出节点 第i个输入节点与第j个隐层节点的权值 第l个隐层节点的阈值 第j个隐层节点与第l个输出节点的权值 第l个期望输出 误差函数 权值和阈值修改方向 先验概率后验概率 网络对学习样本的拟合正确个数 网络对检验样本的拟合正确个数4.问题分析及模型的建立4.1 问题一的数据处理与模型建立4.1.1 问题

6、一的分析因为考虑到问题中所涉及的每个对象(企业)具有多达15个的资料属性值,而问题最终目的只是想要获取每个对象(企业)的打分情况这样一个单一目标,联想到神经网络模型可以实现多个输入单一输出的目标,所以我们想到构建BP神经网络模型来处理该问题。我们所构建的BP网络结构图大致如图1所示:。 图1观察、考虑如图1所示的三层BP网络,将15个资料属性作为BP神经元的输入,每个输入都通过一个适当的权值W和下一层相连,再将评判结果作为目标输出。考虑到BP网络自身的局限性,需要对网络进行一定程度的训练,最终得到能够比较准确地预测结果的成熟网络。4.1.2 模型一的构建步骤1,考虑权值修正方向。BP网络的学习

7、函数对网络权值和阈值的修正是沿着表现函数下降最快的方向-负梯度方向 (1)其中,是当前权值和阈值矩阵,是当前误差函数的梯度,是学习速率。步骤2 确定误差函数。隐层节点的输出为:其中 (2)相关变量解释如下: 为第j个隐层节点 为第i个输入节点与第j个隐层节点的权值, 为第i个输入节点。输出节点的计算输出 (3)其中相关变量解释如下: 第l个输出节点, 第j个隐层节点与第l个输出节点的权值,第j个隐层节点。输出节点的误差函数E的表示式为: (4)因为在我们的模型中输出层为1,所以误差函数即为步骤3 判断误差函数值是否小于目标误差,若小于,则进入第5步,否则进入第4步。步骤4 确定误差修正函数。通

8、过误差函数对输出节点和隐层节点求导,再认为权值的修正值,正比于误差函数沿梯度下降,分别得到相应的修正函数。由此得到新的权值和阈值。返回第二步,用修正后的权值来替代原权值来进行计算。步骤5 输出网络。4.1.3 模型一的改进4.1.3.1 由于在在实际计算中,BP算法的表现不尽如人意,在误差函数与目标误差指标还有较大距离时就出现了平滑区(即计算步数增加,而误差函数值几乎没有变化)。所以我们考虑改进后的BP算法。为了弥补模型一算法收敛性差的问题,我们采用Fletcher-Reeves共轭梯度法,对权值和阈值修正方向进行更改。该方法的主要思想是用与负梯度方向和上一次搜索方向共轭的方向作为新的权值和阈

9、值修正方向,从而加快收敛速度即利用公式5所示: ,其中修正系数 (5)为权值和阈值修正方向。其中, 表示权值和阈值修正方向, 为第K次训练的权值与阈值矩阵, 表示第K次训练后的误差函数梯度方向, 为学习速率共轭梯度法占用较少空间,所以在此题有大量输入数据的情况下,利用该种算法依然能够得到令人满意结果。4.1.3.2处理过拟合现象:在BP网络算法中,由于无法确定其最适合的训练步数,因而可能会产生过拟合(过拟合主要指训练后的网络对训练样本具有极高的拟合精度,但是对检验样本的预测误差却非常大)的情况。为了解决以上问题,我们将已知的600组数据作分类,不失一般性,将前500个样本数据作为训练样本,后1

10、00个样本数据作为检验样本,得到先验概率(训练后网络对训练样本拟合的精确度)和后验概率(训练后网络对检验样本拟合的精确度),具体数学表示如公式(6)所示: (6) 先验概率,后验概率, 网络对学习样本的拟合正确个数, 网络对检验样本的拟合正确个数。根据贝叶斯估计中的关于参数分布选取的共轭分布原理,当参数的先验分布与其后验分布相同时(即达到共轭时)说明先验分布的选取是合理的【1】。结合本题中我们考虑的算法,容易知道,我们所定义的先验概率和后验概率间的关系正如同贝叶斯估计中参数的先验分布与后验分布的关系,因而,为达到合理性,我们将先验概率与后验概率最为接近作为网络优化的目标。通过对网络学习函数,输

11、入层与隐层的的传递函数,隐层与输出层的传递函数,训练步数,学习率,以及动量因子的修改,得到最终的网络。4.1.3.3 隐层节点数的优化:在BP网络中,隐层节点数的优化,具有很大的实际意义。隐节点数的多少对网络性能的影响较大。若隐节点数太多时会导致网络学习时间过长,甚至不能收敛;而当隐节点数过少时,网络的容错能力差。经过查找资料,我们参考最佳隐节点数公式【2】如公式(7)所示:, (7) 其中,表示隐节点数目,表示输入节点数,表示输出节点数,为介于110的一个常数。对于本问题,在实际操作中,我们又经过多次调试发现在,当隐层节点数取12,即取8时,得到的训练网络的效果最佳。4.2问题二的分析 问题

12、二的实质即为简单的数据输入与输出的过程。问题(二)要求我们为打分情况未知而属性资料完整的53个企业进行打分,我们只需利用问题一种已经建立好的准则(优化后的BP网络模型),将这53个企业的背景资料依次输入,记录输出结果即可明确打分情况。4.3 问题三模型的建立4.3.1 问题三的分析问题三要求我们为37个背景资料不完整(部分属性值未填)的企业进行打分。针对于如何解决这一问题,我们着眼于将数据补充完整。如果我们可以实现将这37个企业的确实属性值填充完整,这样问题三就转化成了问题二。此时我们只需将完整数据依次输入到优化后的BP神经网络(所构建的判别准则),根据输出结果将对企业的打分情况明确化,从而判

13、定出是否对其贷款。4.3.2模型的建立对于如何将数据补充完整,我们考虑利用数据挖掘技术来实现【3】。回归替代法是比较好的缺失数据插补方法,但使用该方法必须以缺失值所在的变量(属性)与其他变量(属性)存在线性关系为前提条件。因而,我们首先考虑利用前600组数据来做已知属性值对未知属性值的回归分析,即将缺失属性值看作已知属性值的线性组合:利用SPSS软件对前15属性作相关性分析,得到其相关系数矩阵如表1所示:Correlation Matrix(a,b) V1V2V3V4V5V6V7V8V9V10V11V12V13V14V15CorrelationV11.000.012-.052.041.041-

14、.132-.142.075.005.047-.020-.032.079.067.012 V2.0121.000.221-.115-.115.111.247.405-.236-.114.214-.039-.021-.094.028 V3-.052.2211.000-.075-.075.105.094.295-.243-.168.273.001-.104-.208.129 V4.041-.115-.0751.0001.000.024.117-.068.143.165-.101-.006.004.041.086 V5.041-.115-.0751.0001.000.024.117-.068.143.165-.101-.006.004.041.086 V6-.132.111.105

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号