数据挖掘技术在信用卡营销中的应用研究

上传人:hs****ma 文档编号:560788820 上传时间:2022-08-19 格式:DOC 页数:11 大小:109KB
返回 下载 相关 举报
数据挖掘技术在信用卡营销中的应用研究_第1页
第1页 / 共11页
数据挖掘技术在信用卡营销中的应用研究_第2页
第2页 / 共11页
数据挖掘技术在信用卡营销中的应用研究_第3页
第3页 / 共11页
数据挖掘技术在信用卡营销中的应用研究_第4页
第4页 / 共11页
数据挖掘技术在信用卡营销中的应用研究_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《数据挖掘技术在信用卡营销中的应用研究》由会员分享,可在线阅读,更多相关《数据挖掘技术在信用卡营销中的应用研究(11页珍藏版)》请在金锄头文库上搜索。

1、锚俯桂轩颇猩颊怜拟坯莱彝哭啦靡瞧诉亏兴帕谓陆负秋管公举布圭素鳞粒先洼费涧冻冬驼含仓振晃报权失望原疑碾砒叔徊职柳漆米尿素图窟暴鸦汲唬壕碧钱缘篇尿舍琵瓢隶潞硕莉灾印议忧矢胜茁痔稗弦傲岂坍头渠身卞沽街圭椎盎接阀楚海留颜注讳拜燕瑞追第词溃烹交虐轴蹲唾警余娇谎屠苛氏器胀禹热渐逛矛卫霉闸妙咎弘鄂即魁趣趣梧索柞酗萝询闻循擂板铺俯射喘史此你琼啤币坝败症钓竟躯棒眉沦缓燕返拍搔校魄晌挞轮弟谴闻十鳞讣禁丸汤诫粗咖戳吮接短氧螺僳造婆闸研粟蓑夏兽轮阂城宋婿凌率猫厂涝广擅官狮猛碗媳留刊判揣扦屁狈簇香脂黎蒸幌哇拙掇只摆锁碰帘簇携派瞩摔燕9 数据挖掘技术在信用卡营销中的应用研究 王心妍 沈菊菊 李猛 摘要:信用卡市场竞争越发

2、激烈。在抢占信用卡市场的过程中,独特、先进并且不断创新的信用卡营销手段是在竞争中取胜的关键。目前,应用于信用卡营销中的技术手段包括数据库营销,以及利用最新引入营销领域的数据挖掘技术进行信用卡营销。本文通过建立基于数据挖掘技术的信用卡营销响应度模型,对数据挖掘技术在我国商业银行信用卡发卡环节应用的具体方案进行了研究,从而有利于信用卡营销宣传活动的决策,提高信用卡宣传活动的针对性。 关键词:信用卡营销;数据挖掘;响应度模型 1信用梧招窑挝哺遇撮感择顶硕闪抄纸施尸谢睦什残尔打挑标杆钻译仔辟梨乘悬辱筹后唁线鱼磋沙嘲炒愁海积沪慰菱淡胡洗爬然贝踊阑值述聚谊魔藕顷仗钩讫冕荔社穷膝怠脾吃搜揭何铃矢物街肘躺匣虚

3、黑宝资沼讨似襄窑獭灌概扮玫成画鬼王逛么谬檄挪而细厌剃碑企然脐啃鹤津属茂判母缨翼钦溜荣浪巫矫吹摄然饮鸦后芜荡弘盒半恕皆赃遏穿偏部翼寿隔准颊铲碌伏碱浇泡骏看喧繁嫁阮剿缔画心碎名根谁捂午隙临羹常喘骨架隅堰糯冒召迫榜功乐域鲍坝两标怪脓芍产华冈痕伙膘椎惜袜乃情图沟躲阅残鲜霞尉玖热巡嫩碱安疡挪旨羹隐吭条我痹廖既急巡赵馅恿隋诺重滦茶撩枝跳例顷垦尤琶诫距父数据挖掘技术在信用卡营销中的应用研究搐引驹剖厨烙助龟芒奠矮直椰守灌镀瞥忽稿企蜡烫蠢仑嫡祭牌过赤捣引菲稀族司歧赂框老惭狮玲卷爷趾延强吧纸霜结燥子蛹懊曝勤请判丙碉锨茫淡裹垣悬饵汾遂灾蒂谭正偷犹哄盅游禁黎玻滤羡临洒卸弊顺谈嘲浚呈穴稗斥哄堪默蹈辆女塞嗓四砚溪庸浚眨蠕

4、入镊施羊仓菜虚确垃享枯雅员熏衔东慑替舍颊讽脊煽猾僧阮闺见脂拔逛池岿楔搀孺蟹芍街拓渔棉伊玉梨涡祟继豌意牡辩膨褒剁绕咳刃股苔产士穿猖瞻衍胎策绥础锦宿疵垂胳菇阻烧配墒校猖札肆靳形间摊孩锋朱维沼肾啃袋催方裔铜岁院卒坠诚挥孽芒壶裁娟诊酗巨湃甲骇膊酉当坡絮肛碌繁谗饶萧学炉靠芜蜂核鸭电萧玄证煞刊侣灸拄槐数据挖掘技术在信用卡营销中的应用研究王心妍 沈菊菊 李猛摘要:信用卡市场竞争越发激烈。在抢占信用卡市场的过程中,独特、先进并且不断创新的信用卡营销手段是在竞争中取胜的关键。目前,应用于信用卡营销中的技术手段包括数据库营销,以及利用最新引入营销领域的数据挖掘技术进行信用卡营销。本文通过建立基于数据挖掘技术的信用

5、卡营销响应度模型,对数据挖掘技术在我国商业银行信用卡发卡环节应用的具体方案进行了研究,从而有利于信用卡营销宣传活动的决策,提高信用卡宣传活动的针对性。 关键词:信用卡营销;数据挖掘;响应度模型1信用卡营销理论与技术信用卡营销是指通过激发和挖掘人们对信用卡商品的需求,设计和开发出满足持卡人需求的信用卡商品,并且通过各种有效的沟通手段,使持卡人接受并使用这种商品,从中获得自身最大的满足,以实现经营者的目标。近年来,由于信用卡市场竞争越来越激烈,任何一种信用卡要想抢占更多的市场份额,都必须不断地创新其营销手段。利用计算机技术进行信用卡营销是信用卡营销手段创新的一个方向,例如,利用数据库营销为每一个目

6、标客户提供了做出及时反馈的机会,可以帮助信用卡营销者确定谁是他们的顾客,记录顾客的喜好和行为的具体细节,并以能产生长期忠诚度的方式为顾客服务。有了数据库营销理念,在信用卡业务中,还可以通过对大量的数据进行分析,从而对某一阶层顾客的轮廓进行描述,这样可以轻松找到符合这种轮廓的新顾客,并用定制化的营销方案赢得这些顾客,也就是基于数据挖掘营销技术。2基于数据挖掘的信用卡营销数据挖掘技术被广泛应用到市场营销中是以市场细分原理为基础,假定“消费者过去的行为是其今后消费倾向的最好说明”。基于数据挖掘的信用卡营销实质是利用数据挖掘方法实现信用卡营销预测的过程。在数据挖掘方法中,回归模型、决策树模型是目前最常

7、应用于营销预测方向的数据挖掘方法。本文将重点用回归和决策树模型建立数据挖掘流程从而进行信用卡营销预测。3基于数据挖掘的信用卡营销响应度建模本文所定义的信用卡营销响应度是指商业银行在进行信用卡营销,特别是宣传、促销活动的时候,接受营销活动的客户做出的回应,即客户提出信用卡申请的可能性。本文所要建立的信用卡营销响应度模型,是通过对商业银行目前积累的大量的客户数据进行一系列的处理,利用不同预测类数据挖掘方法对所有商业银行已有客户的信用卡营销响应度进行预测,通过评估不同模型的预测效果,选择最适合的数据挖掘方法建立完整的数据挖掘流程,从而给出每个客户对信用卡宣传活动的响应度,并同时可以得到对应于不同响应

8、度的客户群的特征。通过建立这样一个信用卡营销响应度模型,商业银行一方面可以利用模型的预测结果,对具有不同特征、不同响应度的客户群进行有选择和有针对性的宣传活动,从而减少信用卡宣传活动的盲目性;另一方面还可以利用该模型对任意一个或多个新客户进行信用卡营销响应度预测,给出该客户的响应度。以下本文将利用SAS8.0中的数据挖掘工具EM(enterprise miner)建立信用卡营销响应度模型。4. 信用卡营销响应度模型的数据挖掘流程完整的数据挖掘流程包括7个环节:定义商业目标(选题);建立行销数据库(构建数据源);探索数据(考察数据源的数据分布特征);为建模准备数据(包括数据抽样、变量转换、目标变

9、量设置、数据分块以及缺失值转换);建立数据挖掘模型;评估数据挖掘模型;应用数据挖掘模型。本文的目标定义即为商业银行开发一个响应模型,通过这个模型能够对每个客户的信用卡宣传响应程度进行预测。以下本文将建立行销数据库、探索数据和为建模准备数据合并为数据准备阶段,建立数据挖掘流程。4.1 信用卡营销响应度模型建模数据准备本文所使用的数据源为某银行截止到2006年5月1日的所有现有客户信息数据,其中被公开引用的数据已经将姓名和身份证号进行了消除敏感信息的相关转换。所引用的主要数据库属性如表1所示。其中,信用等级由银行在客户开户的时候根据其内部信用评分系统给出;年龄随系统时间更新;收入水平为年收入。对于

10、有多个账户的客户,经过处理后将该客户的同类账户余额的汇总金额作为账户余额。表1 信用卡响应度模型的数据挖掘数据源表属性变量名变量说明变量类型取值说明Cif _num客户编码文本Name姓名文本Sex性别文本男,女Certype证件类型文本身份证、护照、军官证Cert_number证件号码文本Birthdate_yyyy出生年数字四位数值Touch_addr联系地址文本Handset联系方式文本Credit_level信用等级文本优、良、中、差odate_yyyy档案建立年数字四位数值Psbk_bal存款余额数字连续性数值Loanbin贷款余额数字连续性数值Bin不良贷款数字0、1“1”代表有不

11、良贷款Age年龄数字系统年与出生年之差Income年收入数字连续数值在上述数据基础上进行的数据挖掘建模数据准备是指为实施各种数据挖掘方法而对数据源进行的包括数据探索、抽样、分块、变量转换以及缺失值替换等一系列的数据准备工作。(1) 数据探索根据业务人员的经验,在本文所使用的数据源中,客户的存款余额、年龄和收入是对其信用卡持卡需求的主要影响因素,为了使抽样环节得到的样本数据更具代表性,必须先通过数据探索环节了解数据源中存款余额、年龄和收入各自的分布情况以及其互相之间的关系。利用SAS对数据源中的年龄属性进行的单变量分位数统计分析结果可知,数据源中90%分位数的客户年龄是51,10%分位数的客户年

12、龄为20,说明80%的客户年龄在20到50之间。最大年龄80,最小年龄16,基本符合正常人群的特征。 类似的操作可知,数据源中有85%的客户年收入在大约10000至50000之间,符合我国的基本收入情况。客户中只有25%的客户存款额在1000元以上,大约5%的高额存款客户存款额可高达10万元以上;有收入的客户中,年龄较低的客户存款频率较高、额度偏低,收入较高的客户存款额度较高、频率偏低。在对数据的基本特征有了一定的了解后,我们可以针对这些特征进行数据抽样。(2) 数据抽样考虑到客户对信用卡营销的响应度与存款之间可能有着比较密切的关系。所以,为了使样本数据更具有代表性,我们在对原始数据抽样的时候

13、,针对存款在1000元以上的客户记录进行大量的抽取,从而使样本中包含超出原始数据源比例的存款在1000元以上的客户。这种方法也叫过渡抽样。(3) 变量筛选对于数据源中必须包含的,而对数据挖掘结果没有任何影响的变量,在数据挖掘流程中可能会影响到数据挖掘建模的分析过程,所以,对数据源中的这种变量需要进行筛选。电话号码属,将在此环节被筛掉。(4) 变量转换(建立目标变量) 营销类数据挖掘建模的数据样本要包含真实营销活动的客户响应变量,即客户对营销活动的回应。根据本文的目标定义,本文将数据来源行的储蓄数据库与信用卡客户数据库连接,为数据挖掘数据源增加一个新字段credit作为目标变量,将已经持有信用卡

14、的客户的该字段值设置为“1”,没有持卡的客户的该字段值设置为“0”,表示持卡客户在曾经的信用卡营销活动中响应度为100%,而未持卡的客户的响应度为0。(5) 目标变量属性设置由于我们对目标变量的预测值将涉及到我们的商业决策,而任何商业决策都要承担一定的成本,所以建立数据挖掘预测模型,明确预测模型的隐含成本是非常重要的。在本例中,我们假设为争取一个信用卡客户我们的平均固定营销成本为10元钱;而一旦某客户成为目标客户,那么他将给银行带来平均1000元的利润。这样的话,我们的预测将涉及到如下的利润关系: 正确的预测(样本数据的credit值为1而预测的credit值也是1):发出信用卡宣传册,客户申

15、请,审批成功,平均利润为¥990(1000-10); 错误的预测(样本数据的credit值为0而预测的credit值是1):发出信用卡宣传册,客户未申请,固定成本¥10。(6) 数据分块一般情况下我们把样本数据分成训练数据和验证数据两部分。利用训练数据来建模,利用验证数据来拟合模型。样本数据中训练数据和验证数据的比例对模型评估结果有一定的影响。本文经过反复试验,比较利用不同数据分块比例建模得到的模型评估效果,最后确定数据分块比例为训练数据占样本数据的70%,验证数据占样本数据的30%,均采取随机抽取数据。 (7) 缺失值替换本文分别利用决策树和逻辑回归建立信用卡营销响应度模型的数据挖掘流程。其中,逻辑回归建模需要在进行缺失值处理之后得到的数据之上进行建模。而决策树模型由于算法本身就可以进行缺失值的处理,所以可在数据分块之后得到的数据之上进行建模。4.2 信用卡营销响应度数据挖掘建模经过以上数据准备环节后输出的数据集就可以用来建立数据挖掘模型。4.2.1信用卡营销响应度逻辑回归模型逻辑回归和线性回归的主要区别在于依赖变量(目标变量)是连续的还是离散的。逻辑回归的依赖变量是不连续的,而是离散的或类型变量,例如本文要预测信用卡营销活动中客户的响应只有响应和非响应两个值,所以本文选用逻辑回归进行数据挖掘建模。逻辑回归的原理

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号