聚类技术及其在银行客户细分中的应用研究.pdf

上传人:tang****xu1 文档编号:69956802 上传时间:2019-01-15 格式:PDF 页数:72 大小:4.06MB
返回 下载 相关 举报
聚类技术及其在银行客户细分中的应用研究.pdf_第1页
第1页 / 共72页
聚类技术及其在银行客户细分中的应用研究.pdf_第2页
第2页 / 共72页
聚类技术及其在银行客户细分中的应用研究.pdf_第3页
第3页 / 共72页
聚类技术及其在银行客户细分中的应用研究.pdf_第4页
第4页 / 共72页
聚类技术及其在银行客户细分中的应用研究.pdf_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《聚类技术及其在银行客户细分中的应用研究.pdf》由会员分享,可在线阅读,更多相关《聚类技术及其在银行客户细分中的应用研究.pdf(72页珍藏版)》请在金锄头文库上搜索。

1、武汉工程大学 硕士学位论文 聚类技术及其在银行客户细分中的应用研究 姓名:唐佳妮 申请学位级别:硕士 专业:计算机应用技术 指导教师:蔡琼 20090501 摘要 摘要 聚类作为数据挖掘的一个重要领域,近年来倍受人们的关注。它能 够作为一个独立的分析工具获得数据的分布情况,观察每一类数据的特 征,集中对特定的聚类集合作进一步地分析。聚类技术还可以作为其它 算法( 如分类和定性归纳算法) 的预处理步骤。因此研究如何提高聚类 算法的牲能具有重要的意义。K 均值聚类算法是目前用来解决聚类问题 的非监督学习算法之一。相比其它的聚类算法,它的主要优点是计算速 度快,并且可以得到较紧密的簇,尤其是对于球状

2、簇。但是该算法也存 在如下缺点:难以比较聚类结果的优劣;固定的簇数使得很难事先对K 值做出预测,只能保证目标函数收敛到局部最优,许多研究工作者都在 努力对它进行改善。 本文采用理论与实践相结合的研究方式,在学习了聚类技术基本理 论的基础上,针对K 一均值算法迭代选取聚类中心的问题,对经典算法进 行了改进。并选取了U C I 数据库中专用的聚类测试数据集作为测试对象, 进行实验分析和对比,验证改进后的算法提高了聚类分析的效率和结果 的正确性。 最后,本文以某商业银行客户信息数据为研究对象,利用改进后的 K 均值算法,展开对银行客户细分问题的应用研究。通过分析银行的业 务特点和客户的行为特征,选出

3、能达到业务目标的细分变量。从提供的 客户信息数据中抽取5 5 0 0 个样本记录作为数据源,导入原始数据后进行 预处理,对它们进行数据清理和集成。使用统计分析软件S P S S1 3 O 进行 聚类分析,并采用判别分析方法对聚类结果进行验证和评估,从而得出 最优的聚类结果。最后对结果进行解释,根据不同客户群的行为特征提 出相应的营销策略作为参考。 关键字:聚类分析;K 均值算法;U C I 数据库;客户细分 A b s t r a c t A b s t r a c t A sa ni m p o r t a n tf i e l do fr e s e a r c hi nD a t am

4、i n i n ga n ds t a t i s t i c a la n a l y s i s , C l u s t e r i n gh a sd r a w ng r e a t e ra t t e n t i o ni nr e c e n ty e a r s I tc a nb eu s e da sa n i n d e p e n d e n tt o o lf o rt h ed i s t r i b u t i o no fd a t at oo b s e r v et h ec h a r a c t e r i s t i c so f e a c ht y

5、 p eo fd a t aa n da n a l y z ef u r t h e ro nas p e c i f i cs e to fc l u s t e r C l u s t e r i n g t e c h n o l o g ya l s oc a nb eu s e da so t h e ra l g o r i t h m s ( s u c ha st h ea l g o r i t h mf o r c l a s s if i c a t i o na n dq u a l i t a t i v ei n d u c t i o n ) o ft h ep

6、 r e p r o c e s s i n gs t e p s S oi ti s i m p o r t a n tt os t u d yh o w t oi m p r o v et h ep e r f o r m a n c eo fc l u s t e r i n ga l g o r i t h m K - m e a n sc l u s t e r i n ga l g o r i t h mi so n eo f t h es o l u t i o n st ot h ec l u s t e r i n gp r o b l e m o fn o n - s u

7、p e r v i s e d l e a r n i n ga l g o r i t h m C o m p a r e dw i t h o t h e r c l u s t e r i n g a l g o r i t h m s ,i t sm a i na d v a n t a g ei st h ec a l c u l a t i o ns p e e da n di t c a ng e tt h e c l u s t e rm o r ec l o s e l y ,e s p e c i a l l yf o rg l o b u l a rc l u s t e

8、 r s H o w e v e r ,t h e r ea r ea l s o d i s a d v a n t a g e sa sf o l l o w s :i ti sD i f f i c u l tt om e a s u r et h ec l u s t e r i n gr e s u l t s ;t h e f i x e dN u m b e ro fc l u s t e r sm a k e si td i f f i c u l tt op r e d i c tt h ev a l u eo fKi n a d v a n c e ,t h eo b j

9、e c t i v ef u n c t i o nc a no n l yg u a r a n t e ec o n v e r g e n c et ol o c a l o p t i m u m M a n yr e s e a r c h e r sh a v ef o c u s e do nt h i sf i e l d T h i sp a p e ru s e dar e s e a r c hc o m b i n a t i o no ft h e o r ya n dp r a c t i c e ,a n d i m p r o v e d t h ec l a

10、s s i c a lK - m e a n s a l g o r i t h mf o r c l u s t e rc e n t e r ss e l e c t e d i t e r a t i v e l yb a s e do nl e a r n i n gt h eb a s i ct h e o r yo ft h ec l u s t e r i n gt e c h n o l o g y I t s e l e c t e dt h ee x c l u s i v ec l u s t e r i n gt e s td a t as e t so fU C Id

11、 a t a b a s ea st e s to b j e c t s , a n a l y s ta n dc o m p a r e dt h r o u g he x p e r i m e n tt ov e r i f yt h ei m p r o v e da l g o r i t h mo f c l u s t e ra n a l y s i sf o ri m p r o v i n gt h ee f f i c i e n c ya n da c c u r a c yo fr e s u l t s F i n a l l y ,t h i sp a p e

12、 ru s e dc u s t o m e ri n f o r m a t i o no fac o m m e r c i a lb a n kd a t a f o r t h e s t u d y ,a n d S P S Ss o f t w a r e a n a l y s i s t o o l sf o rb a n kc u s t o m e r s e g m e n t a t i o np r o b l e mt o c o n d u c ta p p l i c a t i o nr e s e a r c hw i t ht h ei m p r o v

13、 e d K m e a n sa l g o r i t h m I ta n a l y s tc h a r a c t e r i s t i c so fb a n k i n ga n dc u s t o m e r I I I 武汉工程人学硕士学位论文 b e h a v i o rt os e l e c ts e v e r a lv a r i a b l e sf o rb u s i n e s so b j e c t i v e s I tt o o kt h e5 5 0 0 r e c o r d sf r o mt h ec u s t o m e ri n

14、 f o r m a t i o nd a t as a m p l e sp r o v i d e da sad a t as o u r c e a n di m p o r t e dt h er a wd a t af o rp r e p r o c e s s i n g :d a t ac l e a n i n ga n di n t e g r a t i o n I t u s e dS P S S13 0s t a t i s t i c a la n a l y s i ss o t t w a r ef o rc l u s t e ra n a l y s i s

15、 ,t h e nu s e d d i s c r i m i n a t ea n a l y s i sm e t h o d st ov e r if ya n de v a l u a t et h er e s u l t sS Oa st og e ta t t h eo p t i m a lr e s u l t so fc l u s t e r i n g A tl a s t ,i te x p l a i n e dt h er e s u l ta n dp r o v i d e d t h e c o r r e s p o n d i n gm a r k e

16、 t i n gs t r a t e g y a sar e f e r e n c e a c c o r d i n gt o t h e b e h a v i o r a lc h a r a c t e r i s t i c so fd i f f e r e n tc u s t o m e rc l a s s e s K e y w o r d s :C l u s t e ra n a l y s i s ;K m e a n sa l g o r i t h m ;U C Id a t a b a s e ;C u s t o m e r s e g m e n t a t i o n 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外, 本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对 本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本 人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:锄巳蚰

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号