浅析朴素贝叶斯分类算法在客户关系管理中的简单应用

上传人:tang****xu1 文档编号:149814772 上传时间:2020-10-30 格式:DOCX 页数:8 大小:29.86KB
返回 下载 相关 举报
浅析朴素贝叶斯分类算法在客户关系管理中的简单应用_第1页
第1页 / 共8页
浅析朴素贝叶斯分类算法在客户关系管理中的简单应用_第2页
第2页 / 共8页
浅析朴素贝叶斯分类算法在客户关系管理中的简单应用_第3页
第3页 / 共8页
浅析朴素贝叶斯分类算法在客户关系管理中的简单应用_第4页
第4页 / 共8页
浅析朴素贝叶斯分类算法在客户关系管理中的简单应用_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《浅析朴素贝叶斯分类算法在客户关系管理中的简单应用》由会员分享,可在线阅读,更多相关《浅析朴素贝叶斯分类算法在客户关系管理中的简单应用(8页珍藏版)》请在金锄头文库上搜索。

1、浅析朴素贝叶斯分类算法在客户关系管理中的简单应用摘要:朴素贝叶斯算法主要是运用了概率中的大事件概率作为数学背景,因此在商业领 域的数据挖掘中,通过使用贝叶斯算法,可以从顾客的历史消费记录中对未来一段时间内, 该类的顾客的消费中做出一个合理的估计,并针对该顾客的消费习惯,合理使用促销手段, 从而使得在有效的降低企业成本的同时,获得最大的收益。关键词:朴素贝叶斯分类算法0.前言在国内商业上对数据挖掘的运用,更倾向于使用数学模型建立不同商品属性之间的相关联系,即通过顾客的历史消费记录,对不同种类的顾客的消费品做出一个大概的估计,并根据不同的消费品为未来一段时间内企业的促销提供支持,其目的是一方面降低

2、企业的促销成本,另一方面是为了是使促销方式能直接的针对潜在客户,即实现“利润最大化”。从实践的角度上也证明了关联分组挖掘法在商业上的成功应用,但是在现在越来越多的商业问题中,关联分组法的使用不能在最大程度上满足企业的实际需求,因此,在结合相关的概率理论方法上,融入到实际的商业模型中, 我们提出朴素贝叶斯分类算法在实际商业过程 中的使用。1. 数据挖掘在市场营销中的作用数据挖掘在市场营销中的应用,就是把数据挖掘理论和技术同实际的商业问题相结合,并应用到实际的企业问题中去,创建描述和预测模型,并通过一系列的方式和方法不断的优化 该商业过程,从而形成有效的营销管理。 在结合以往的研究的基础上,可以总

3、结出数据挖掘主要是应用到以下几个方面:(1.1) 寻找潜在的客户。在该方面,数据挖掘能在寻找客户方面起到多方面的作用,在此,我们可以认为具体的作用主要有: 识别优等的潜在客户;为满足潜在客户要求制定不同 的个性化的沟通渠道; 针对不同的潜在客户群选择合适的信息, 其中这些信息就包括了沟通 信息,促销信息,反馈信息,服务信息等等。(1.2) 对广告等宣传方式进行数据挖掘,从而制定适合企业自生的宣传方式。从历史和经验角度上,我们知道寻找潜在客户的一种方法是寻找与现有客户类似的人。该过程主要是同历史数据有着很大的关系, 因此,在对历史数据进行挖掘前, 我们首先就要建立“简档”, 即能充分反应这类历史

4、数据的数据文档,从而为能更进一步的数据挖掘提供支持。 精品文档(1.3) 通过数据挖掘不断的改善营销活动。在利用各种手段建立数据简档后,剩下的主要工作就是建立有效客户响应模型等数据模型,其目的是优化营销活动收益,为定向营销提供决策支持。(1.4) 利用现在已有的客户了解潜在的未知的客户。很多成功的数据挖掘模型都得出一个共同的认识,即发现好的潜在的客户的一个最为有效的方法是察看目前最佳的客户来自 那里。只有充分的了解已有客户以及和他们的特征的相关记录,才能最为准确的了解潜在客户,并为挖掘潜在客户提供帮助。从以上几点我们不难看出, 数据挖掘在市场营销的作用不仅仅是减少客户的流失,降低企业的运作成本

5、,更为重要的是能通过现有客户,以及他们的行为特征,挖掘出潜在的客户, 给企业带来更大的利润。2. 数据挖掘的前期工作总和前人的实践和研究,我们可以把数据挖掘可以分为三个阶段,第一阶段是数据收集,整理阶段,从各种数据表明,该阶段大概占到整个数据挖掘过程的60%的工作量,数据处理的好坏直接影响到后面两个阶段工作的进程,和挖掘的有效性。第二阶段,就是我们通常所提到的建模阶段。针对不同的行业,不同要求,可以建立客户响应模型,客户流失模型,客户保持模型,风险模型等等,而此阶段主要应用到了回归分析法,因子分析法,关联分析法等等高等数学方法。第三阶段的主要工作是对前期建立的模型,以及实施效果进行评估,反馈和

6、修正。数据挖掘模型的实施一般不会立刻收到成效,更多的是有一个时间缓冲期,因此,对于数据挖掘模型的好坏,要通过未来一段时间, 在实施了模型方法后收集到的记录上得以评价,按照质量管理的观点上来看,该过程是一个不断重复的,修正的过程,其目的是从一个粗的,概要营销逐渐向细的,精细营销转变。3. 朴素贝叶斯分类算法简介贝叶斯分类算法主要是建立在统计学分类方法的基础上的,该方法在商业上主要用作预测属性成员关系的可能性。贝叶斯分类算法的核心思想就是我们经常说的贝叶斯定理,我们可以用下面的数学式子加以表示:p )= P(X|H)P(H)P(X)其中P(H |X)为后验概率,或者是我们经常说的在X的条件下,取

7、H的后验概率。在 精品文档精品文档就在这里各类专业好文档,值得你下载,教育,管理,论文,制度,方案手册,应有尽有 -实际的商业领域中,我们可以用下面的示例描述为,假设数据元组可以分为sale和income两个属性来描述顾客购买行为,假设用 H来表示顾客购买电脑,那么, 我们用P(H |X)来 表示该顾客在sale和income已定的条件下购买电脑的概率。P(H)是我们通常说的先验概率,接着我们上面说的例子,这也就是说任意给定的顾客将购买计算机的概率,而在此时我们并不再去考虑这类顾客的年龄和收入特征。P(X | H )是指在购买了电脑 H的条件下,顾客 X的概率。在实际的商业数据挖掘过程中,我们

8、通常采用一下步骤对商业数据进行深入的挖掘:(1) 设现有训练集 X ,并且该训练集可用如下属性集加以表示,即X = x1,x2.xn。(2) 设有属性Hj ,并且我们的目标是求出一个关于购买Hj的最大概率,由贝叶斯定理,我们此时就可以求出在满足属性X的前提下,满足属性 Hi的大概率。在计算的过程中,我们要注意的是,因为我们现在运用的贝叶斯定理是有假设前提的, 即训练集的各个属性Xi,X2.为,是相对独立的,因此我们在前期的数据收集,整理的 时候,就要特别注意这个问题, 如果一些属性并不是相对独立,而是存在相对影响的,此时我们就不能用朴素贝叶斯分类对预测进行估计了,而是要用到贝叶斯网的相关概念。

9、(3.1)朴素贝叶斯分类的示例研究数据挖掘的运用主要是在实际的过程中,因此,我们在结合朴素贝叶斯分类法的基础上,以下面实际的商业数据为基础,通过建立相关的数学模型,对实际的商业数据进行挖掘,找出隐藏在海量数据中的,对商业决策有价值的信息。表(3.1)是某商业银行在信用卡销售中所截取的一部分数据(表 3.1)收入范围报纸促销邮寄促销保险促销其他信用卡性别年龄30 40KYESNOYESNOMALE4530 40KYESYESYESNOFEMALE4740 50KNOYESNONOFEMALE4330 40KYESNOYESYESMALE3850- 60KNONOYESYESMALE4020 30

10、KNOYESYESYESMALE4130 40KNOYESNOYESFEMALE5540 50KYESYESNOYESMALE4830 40KYESYESYESNOFEMALE2830 40KYESNOYESNOFEMALE4740 50KYESYESNOYESMALE4220 30KYESYESNOYESFEMALE2950- 60KNOYESNOYESMALE5040 50KYESNOYESYESFEMALE4820 30KYESYESNOYESMALE32通过该数据,我们现在的目的是对 SEX作为要预测值的输出属性。在进行预测分类之前,我们首先要对该表属性 SEX的简单统计,统计结果如下

11、表(3.2)所示。(表 3.2)报纸促销邮寄促销保险促销其他信用卡SEXMaleFemaleMaleFemaleMaleFemaleMaleFemaleYES55554473NO32324314Ratio:yes/total5/85/75/85/74/84/77/83/7Ratio:no/total3/82/73/82/74/83/71/84/7我们现在要使用表(2.2)的相关数据,和贝叶斯分类器执行新的分类。我们现在考虑新 的实例:报纸促销=YES,邮寄促销=YES,保险促销=NO,其他信用卡=YES我们现在的要求是预测的 SEX是男性,还是女性。即现在我们要求出的是在报纸促销,邮寄促销,其

12、他信用卡都是YES,保险促销是 NO的情况下,是男性概率大还是女性的概率大。在此,我用E表示报纸促销=YES,邮寄促销=YES,保险促销=NO,其他信用卡=YES。首先我们假设SEX=MALE ,那么根据贝叶斯分类,我们有以下式子成立:P(E| sex = male) P(sex = male) P(sex = male|E):P(E)由表(2.2),我们首先要求的是在sex=male的条件下,P(E)的概率,在之前,我们由朴素贝叶斯的假设可知,E中的属性是相互独立的,即此时P(E)=P (报纸促销=YES)P(邮寄促销=YES)P(保险促销=NO)P(其他信用卡=YES)由此,我们可以分别对

13、属性的概率进行计算,计算结果如下:P(报纸促销=YES| sex= male) =5/8P(邮寄促销=YES|sex= male) =5/8P(保险促销=NO | sex = male) =4/8P(其他信用卡=YEsex= male) =7/8及此,我们可以得出在sex=male的前提下,满足 E的条件的概率是P(E | sex = male) = (5/8) (5/8) (4/8) (7/8) = 0.170233而此时,P(sex = male)的先验概率是0.533333。由此,我们可以得出计算结果:P(sex = male |E)= (0.170233) (0.533333) / P

14、(E) =0.090790/ P(E)按照以上的计算思路,我们可以计算出对比式子的概率是:P(sex = female |E)= (0.093710) (0.466666) 1 P(E) =0.043731/ P(E)对比两组数据,我们不难看出在满足条件E的情况下,sex为male的概率大于sex为female的概率。再次,我们可以预测,在对报纸,邮寄,信用卡的促销有所响应,以及不响应保险 促销的前提下,男性的反应程度要大于女性的反应程度。(3.2)数据挖掘结论讨论经过上面的数据挖掘,我们得出的结论是不同的促销手段的对性别的影响是有所差异的,在男性没有其他信用卡的时,对报纸促销,邮寄促销的响应度是大于在相同条件下的女性的,因此我们在未来营销策划中,如果是要对使用以上几种促销方法时,更多的是倾向于男性,但是如果单单使用该类方法,即使男性的响应很强烈,但是并没有达到我们要去的目标,在通过其他数据库的分析过程中,我们对男性进行特别的分析,可以得出一些结论,男性在贷款,还款上的响应也是很强烈的,因此才进一步的促销过程中,我们要更多的利用这个挖掘

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号