数据挖掘在银行业中的应用(终极版)

上传人:cn****1 文档编号:490340914 上传时间:2024-01-08 格式:DOCX 页数:17 大小:24.60KB
返回 下载 相关 举报
数据挖掘在银行业中的应用(终极版)_第1页
第1页 / 共17页
数据挖掘在银行业中的应用(终极版)_第2页
第2页 / 共17页
数据挖掘在银行业中的应用(终极版)_第3页
第3页 / 共17页
数据挖掘在银行业中的应用(终极版)_第4页
第4页 / 共17页
数据挖掘在银行业中的应用(终极版)_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《数据挖掘在银行业中的应用(终极版)》由会员分享,可在线阅读,更多相关《数据挖掘在银行业中的应用(终极版)(17页珍藏版)》请在金锄头文库上搜索。

1、数据挖掘在银行业中的应用摘要银行为人们提供了越来越多的人性化服务,因而银行的数据也在迅速膨胀, 这些数据背后隐藏了大量有价值的信息,银行要在金融领域里的竞争中处于不败之 地必须利用这些信息。数据挖掘正是从海量数据中提取有用信息的一种有效工具, 数据挖掘在银行业中扮演着无可替代的作用。关键词:数据挖掘银行业AbstractThe bank provides people with the humanized service more and more, so the bank data also in rapid expansion, these data are hidden behind a

2、 lot of valuable information, banks in the financial field competition in an invincible position must use these information. Data mining is an effective tool to extract useful information from the huge data,data mining plays an irreplaceable role in the banking industry.Keywords: data mining, bankin

3、g1. 引言1.1. 性说明本文所涉及到的研究领域银行信息化的迅速发展,产生了大量的业务数据。从海量数据中提取出有价值 的信息,为银行的商业决策服务,是数据挖掘的重要应用领域。汇丰、花旗和瑞士银 行是数据挖掘技术应用的先行者。如今,数据挖掘已在银行业有了广泛深入的应 用。本文主要研究的领域是数据仓库,数据挖掘,联机分析处理技术,以及贝式网 络。1.数据仓库:数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集 合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。为企业提供需 要业务智能来指导业务流程

4、改进和监视时间、成本、质量和控制。1 2.数据仓库 是决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、 集成性、稳定性和时变性。数据仓库,由数据仓库之父比尔恩门于1990年提出, 主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资 料,透过数据仓库理论所特有的资料储存架构,作一有系统的分析整理,以利各种分 析方法如联机分析处理(OLAP)、数据挖掘(Data Mining)之进行,并进而支持如决策 支持系统(DSS)、主管资讯系统(EIS)之创建,帮助决策者能快速有效的自大量资料 中,分析出有

5、价值的资讯,以利决策拟定及快速回应外在环境变动,帮助建构商业智 能(BI)。3.OLAP联机分析处理:简写为OLAP,随着数据库技术的发展和应用,数据库存储的数据量从20世纪80年代的兆(M)字节及千兆(G)字节过渡到现在的兆兆 (T)字节和千兆兆(P)字节,同时,用户的查询需求也越来越复杂,涉及的已不仅是查 询或操纵一张关系表中的一条或几条记录,而且要对多张表中千万条记录的数据进 行数据分析和信息综合,关系数据库系统已不能全部满足这一要求。在国外,不少软 件厂商采取了发展其前端产品来弥补关系数据库管理系统支持的不足,力图统一分 散的公共应用逻辑,在短时间内响应非数据处理专业人员的复杂查询要求

6、。联机分 析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操 作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵 活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供 给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确 的方案。4. 数据挖掘:数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一 个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。 数据挖掘

7、通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学 习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。5. 贝叶斯网络:贝叶斯网络是一种概率网络,它是基于概率推理的图形化网络,而贝叶斯公式则是这个概率网络的基础。贝叶斯网络是基于概率推理的数学 模型,所谓概率推理就是通过一些变量的信息来获取其他的概率信息的过程,基于概 率推理的贝叶斯网络(Bayesian network)是为了解决不定性和不完整性问题而提出 的,它对于解决复杂设备不确定性和关联性引起的故障有很大的优势,在多个领域中 获得广泛应用。1.2. 设计工作的背景:大数据时代,对于商业银行而言,在不断完

8、善计算机应用系统底层数据库群、 操作数据存储、主数据存储、企业级数据仓库、数据集市等建设的基础上,网络爬 虫、Hadoop、MapReduce、NoSQL、Lucene等技术拓宽了银行的数据掌控能力。当 前,银行无论面对内部数据还是外部数据、结构性数据亦或非结构性数据,数据的产 生、捕获、整合、存储、访问等技术均已日渐成熟。与此同时,数据的价值也随着 数据生命周期的不断延伸而大幅提升。为实现数据价值的最大化,银行还需要对所 积累的各类数据展开全面分析,深入挖掘和钻取数据,从中提炼出埋藏于数据深处的 规律和趋势,全面运用于银行战略决策与业务发展。目前,商业银行已将数据挖掘定 位于发展大数据战略的

9、核心驱动力,是大数据信息化建设的重中之重。随着大数据时代的到来,数据的价值得到进一步提升,银行决策管理人员将不 再满足于采用数据对经验决策进行验证的简单模式,基于数据的决策行为将从“被 动”转向“主动”,主要体现于两方面:一是数据在业务分析上的作用从“数据验 证”向“数据启发”提升;二是数据在业务应用上的作用从“事后快速响应”向 “事前精准预测”提升。银行对自身数据分析能力提出了更高要求。为实现业务上的“精耕细作”,银行首先应对客户市场进行科学细分,推进建 立以客户价值评估为基础的客户分类体系,并辅以客户行业归属、区域归属、产品 偏好、渠道偏好、风险偏好、价格偏好等分析内容,面向不同主题,充分

10、实现客户层 面的“人以群分”。银行要深入分析客户信息,重点关注客户价值的形成原因和驱 动因素,准确识别未来存在价值提升可能性的客户,并同时对存在流失风险的客户进 行预警。通过客户产品关联销售、产品响应预测、渠道响应预测等分析应用,为银 行开展客户名单制营销、实行差异化服务提供依据。面向客户违约风险,银行同样 要从客户信息入手,构建客户信用评分模型,尽早对存在违约风险的客户进行预警, 为银行资产保全提供“第一手”信息。通过科学的客户分类支持银行形成差异化的 定价模型和成本管理策略,充分考量客户满意度、提升客户忠诚度,与客户携手实现 共赢。在银行精细化管理架构下,业务发展的“规划先行”是要考虑如何

11、把握合适的 时机、选择合适的客户、推介合适的产品、采用合适的渠道、委派合适的人员,为客户提供最优质、贴心的金融(与非金融)服务;要考虑如何在有效把控风险 的同时,以最低的成本、以银行与客户均感到满意的价格实现双方价值的最大化;要 实现银行资源的差异化配置以及客户的个性化服务。本文将对数据挖掘在银行业应用中的一个题进行解决。预测贷款逾期者(风险管理):某银行希望根据客户过去的贷款数据,利用数据 挖掘来预测新的贷款者,核贷后会逾期的机率,以作为是否核贷的依据,或提供给客 户其他类型的贷款产品。Predicting Loan Defaulters: Suppose a bank is concern

12、ed about the potential for loans not to be repaid. If previous loan default data can be used to predict which potential customers are liable to have problems repaying loans, these “bad risk” customers can either be declined a loan or offered alternative products.1.3设计工作的目的和意义本文主要阐述了数据挖掘在银行业的一个应用即某银行

13、希望根据客户过去的 贷款数据,利用数据挖掘来预测新的贷款者,核贷后会逾期的机率。研究此信息的目 的是,以此作为是否核贷的依据,或提供给客户其他类型的贷款产品。这样是银行信 息化发展的一个具体的反映,银行的信息化建设一直处于业内领先水平,不仅具有国 际领先的金融信息技术平台,建成了由自助银行、电话银行、手机银行和网上银行 构成的电子银行立体服务体系,而且以信息化的大手笔一一数据集中工程在业内独 领风骚。另外,商业银行面临的风险问题,可分成三个最基本的方面。他们有信贷方 面的风险,比如说潜在的坏账;他们还要面临流动性的风险,这会涉及到资产和债务 的不匹配;另外他们还要应对操作的风险,如虚假个人消费

14、贷款、关联企业骗贷、票 据诈骗等等。此系统工作的目的正是加强了银行的风险管理能力,使信贷方面的风 险大大降低。银行信贷风险是指由于各种不确定性因素的影响,在银行的经营与管 理过程中,实际收益结果与预期收益目标发生背离,有遭受资产损失的可能性。信贷 风险是指借款企业因各种原因不能按时归还信贷本息而使银行资金遭受损失的可能 性。银行信贷业务中占比重大的是信贷业务,信贷具有风险较高、收益突出的特点, 对整个银行的经营举足轻重。2. 问题定义与分析2.1报告所研究的具体问题的定义本文所研究的主要问题是,银行用户数据仓库的建立,并利用联机分析处理技 术对其数据进行分析处理操作,利用数据挖掘技术基于以往用

15、户的信贷数据来预测 新的贷款者,核贷后会逾期的机率。以此作为是否核贷的依据,或提供给客户其他类 型的贷款产品。2.2问题的内涵与边界本文所研究问题的边界主要包括:银行用户信贷数据数据仓库的建立,基于联 机分析处理技术,数据挖掘技术,以及贝叶斯网络。2.3问题的特征与属性商业银行信贷管理,从广义上理解包括:制定和实施信贷政策,建立和健全内部 授权授信制度,制定、贯彻和执行信贷操作程序,以及建立信贷风险监测和控制机制 等诸多相互协调、制约的制度系统及其对制度执行效果的监督系统。狭义上的商业银行信贷管理仅指贷款发放前的调查工作、贷款存续期间的管 理工作以及贷款出现风险后的监督、控制和处理工作。本文采

16、纳狭义的商业银行信 贷管理概念,在分析当前商业银行信贷管理中存在的问题的基础上,试图提出解决这 一问题的基本思路和实际操作对策。通过数据库的建立、管理和维护可以提高银行应对风险的能力。建立一个好 的数据库对业务发展的良好推动作用和在操作风险防范中能起到的指导作用。个人 信息的数据库,它还应当包括提前还款、违约风险、操作风险等多方面的数据信 息。没有这些全面的数据信息,就无法通过数学模型对个人,住房信贷面临的风险进 行全面的分析和了解,也无法制订出最终行之有效的政策。前危害很大的假按揭一 个好的操作风险防范手段,是建立防范假按揭发生的数据库,收集大量的案例进行统 计分析,提取出高度相关的因素,方便在具体操作中对假按揭进行防范。2.4解决问题的重点和难点本文主要针对已收集到的海量信贷数据建立数据仓库进行存储管理维护,并利 用数据挖掘,把海量的数据经过处理变为清晰、的有用信息。利用贝叶斯算法对已 经得到的信息进行推理计算概率

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号