电子商务环境下的数据挖掘

上传人:飞*** 文档编号:40573037 上传时间:2018-05-26 格式:DOCX 页数:6 大小:27.17KB
返回 下载 相关 举报
电子商务环境下的数据挖掘_第1页
第1页 / 共6页
电子商务环境下的数据挖掘_第2页
第2页 / 共6页
电子商务环境下的数据挖掘_第3页
第3页 / 共6页
电子商务环境下的数据挖掘_第4页
第4页 / 共6页
电子商务环境下的数据挖掘_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《电子商务环境下的数据挖掘》由会员分享,可在线阅读,更多相关《电子商务环境下的数据挖掘(6页珍藏版)》请在金锄头文库上搜索。

1、数据挖掘在电子商务中的应用研究数据挖掘在电子商务中的应用研究王丹 王立军(华北电力大学 经济管理系,河北 保定 07100)摘要摘要:电子商务已经成为了当今最热门的话题,而电子商务的广泛应用,使企业有越来越 多的信息数据。而按照企业的目标业务对数据进行挖掘分析,可以给企业的实现目标提供 更便捷的方法,使企业事半功倍。文章介绍了数据挖掘技术的特点,以及在电子商务中的 应用,分析了电子商务中如何应用数据挖掘技术。 关键词关键词:数据挖掘;电子商务;关联;聚类A Study on Data Mining and Application in Electronic CommerceWangdan wa

2、nglijun(University of north China electric power economic management department, heibei baoding 07100 )AbstractAbstract:E-commerce has become the most popular topic, and the wide application of electronic commerce, make enterprise have more and more information and data. And according to enterprise

3、target business for data mining analysis, to realize the target of the enterprise can offer more convenient method, make enterprise easier. This paper introduces the characteristics of the data mining technology, and its application in electronic commerce, analyzes how to use the electronic commerce

4、 data mining technology. KeyKey wordswords:Data mining; The electronic commerce; Relationships; Clustering引言:引言: 在现今的社会,随着电子商务的发展,越来越多的商业走上电子商务的发 展道路,电子商务网站的竞争因此日趋激烈。面对大量的信息,找出企业用户 感兴趣的信息加以组织利用,提高客户满意度,从而改进电子商务站点的设计、 改善企业与客户的关系成为电子商务发展必须要解决的问题。 数据挖掘是一种 从海量数据中提取有价值信息的工具。对于企业而言,数据挖掘有助于发现业 务发展的趋势。帮助企业做

5、出正确的决策,使企业处于更有利的竞争位置。一 个完善的电子商务系统不应当只满足于支持在线交易,而且应该能够通过商业 智能分析等技术为企业的客户关系管理、市场营销等提供全面的辅助支持,尤 其在这样一个信息爆炸的时代,企业已经累积的大量信息数据,其迫切希望能 够从中获取有用的模式和规律用以指导经营实践、改善客户关系。这种需求推 动了用于电子商务的数据挖掘技术研究的深入。1 1 电子商务和数据挖掘的特点电子商务和数据挖掘的特点(1)电子商务是指个人或企业通过 Internet 网络,采用数字化电子方式进行 商务数据交换和开展商务业务活动。目前国内已有网上商情广告、电子票据交 换、网上订购、网上银行、

6、网上支付结算等多种类型的电子商务形式。电子商 务正以其成本低廉、方便、快捷、安全、可靠、不受时间和空间的限制等突出 优点而逐步在全球流行。服务范围可归类为:商业一商业(B2B),商业一消 费者(B2C),商业一政府(B2G)。 (2)数据挖掘是通过挖掘数据仓库中存储的大量数据,从中发现有意义的新的 关联模式和趋势的过程。从商业的角度定义,数据挖掘是一种新的商业信息处 理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析 和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘最吸引人 的地方是它能建立预测模型而不是回顾型的模型。利用功能强大的数据挖掘技 术,可以使企业把数据

7、转化为有用的信息帮助决策,从而在市场竞争中获得优 势地位。数据挖掘与传统的数据分析的不同是在没有明确假设的前提下去挖掘 信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和可实用 3 个 特征。2 2 数据挖掘过程数据挖掘过程电子商务中的数据挖掘的过程一般由 3 个主要的阶段组成:数据准备、数 据挖掘、结果解释和评价。2.12.1 数据准备数据准备数据准备又可分为数据选取、数据预处理。数据选取的目的是确定发现任 务的操作对象。即目标数据,是根据用户的需要从原始数据库中抽取的一组数 据。数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成 数据类型转换 f 如把连续型数据转换为

8、离散型数据,以便于符号归纳;或是把 离散性数据转换为连续型数据,以便于神经网络计算)以及对数据降维 f 即从初 始特征中找出真正有用的特征以减少数据挖掘要考虑的变量个数)。2.22.2数据挖掘数据挖掘数据挖掘阶段首先要确定数据挖掘的目标和挖掘的知识类型。确定挖掘任 务后,根据挖掘的知识类型选择合适的挖掘算法;最后实施数据挖掘操作,运 用选定的挖掘算法从数据库中抽取所需的知识。2.32.3评价评价结果的解释和评价数据挖掘阶段发现的知识,经过评估,可能存在冗余或 无关的知识,这时需要将其剔除:也有可能知识不满足用户的要求,需要重复 上述挖掘过程重新进行挖掘。另外,由于数据挖掘最终要面临用户因此。还

9、 需要对所挖掘的知识进行解释,以一种用户易于理解的方式(如可视化方式)供 用户所用。 可以看出,以上整个数据挖掘过程是不断地循环和反复的,因而可以对所 挖掘出来的知识不断求精和深化。最终达到用户所满意的结果。3 3 电子商务中数据挖掘的特点电子商务中数据挖掘的特点电子商务具有一些独特的特点面向电子商务的数据挖掘与普通商业领域 中的数据挖掘相比有如下几个特点: (1)面向电子商务挖掘的任务更多表现在客户关系管理方面。由于电子商务借 助 Internet 的力量让企业和客户之问的交流变得十分方便因此更多的需求 是如何让企业利用这些频繁的交流,敏捷地把握客户的动态、改进企业与客户 交流的方式或提出新

10、的交流内容等; (2)电子商务自身是一个信息化十分完全的系统,它们累积的数据一般就存储 在电子商务数据库内用户能十分方便地获取这些数据因此对于电子商务的 数据挖掘的数据准备阶段的工作相对容易; (3)电子商务领域的数据挖掘的目的通常是对电子商务系统的改进。比如给客 户推出个性化页面、吧用户最感兴趣的信息放在首页或挖掘出哪些产品比较受 欢迎等。4 4 电子商务中几种常用的数据挖掘方法电子商务中几种常用的数据挖掘方法4 41 1 关联规则关联规则关联规则是数据挖掘研究的主要模式之一,侧重于确定数据中不同领域之 间的关系,找出满足给定条件下的多个域间的依赖关系。关联分析的目的是挖 掘出隐藏在数据间的

11、相互关系。关联规则用于寻找在同一个事件中出现的不同 项的相关性,比如在一次购买活动中所买不同商品的相关性。 关联分析的典型例子是购物篮分析,描述顾客的购买行为,可以帮助零售 商决定商品的摆放和捆绑销售策略。如著名的(面包+黄油-牛奶)例子就属于关 联分析:在超市中,90的顾客在购买面包和黄油的同时,也会购买牛奶。直 观的意义是:顾客在购买某种商品时有多大的倾向会购买另外一些商品。找出 所有类似的关联规则,对于企业确定生产销售、产品分类设计、市场分析等多 方面是有价值的。 在电子商务中,关联规则挖掘应用十分广泛。例如:在一些购物网站中, 浏览一种商品时往往会有很多相关搭配的商品出现在同一个页面中

12、,比如裙子 和腰带、化妆品和化妆工具等。4 42 2 聚类分析方法聚类分析方法聚类分析就是直接比较样本中各事物之间的性质,将性质相近的归为一类, 而将性质差别较大的分在不同的类。对变量聚类计算变量之间的距离,对样本 聚类则计算样本之间的距离。它的目的是使得属于同一类别的个体之间的距离 尽可能小,而不同类别上的个体问的距离尽可能大。 聚类分析用于把有相似特性的客户、数据项集合到一起。在电子商务中, 聚类分析常用于市场细分。根据已有客户的数据,利用聚类技术将市场按客户 消费模式的相似性分为若干细分市场,以进行有针对性的市场营销,提供更适 合、更满意的服务。如自动给一个特定的客户聚类发送销售邮件,为

13、一个客户 聚类动态地改变一个特殊的站点等。通过对聚类的客户特征的提取,电子商务 网站还可以为客户提供个性化的服务。4 43 3 分类分析分类分析分类系统是基于遗传算法的机器学习中的一类,它包括一个简单的基于串 规则的并行生成子系统、规则评价子系统和遗传算法子系统。分类系统正在被 人们越来越多地应用于科学、工程和经济领域中,是目前遗传算法研究领域中 一个非常活跃的领域。 分类分析是数据挖掘中应用最多的方法。分类要解决的问题是为一个事件 或对象归类,既可以用于分析已有的数据,也可以用来预测未来的数据。分类 通过分析已知分类信息的历史数据,总结出一个预测模型,预测哪些人可能会 对邮寄广告、产品目录等

14、有反应,可以针对这一类客户的特点展开商务活动, 提供个性化的信息服务。 在图书的电子商务中,网站管理者对客户进行分类分析,将图书按照不同 客户需求进行分类,例如按照阅读兴趣不同,分为男生、女生阅读入口。4 44 4 序列模式序列模式序列模式挖掘就是要挖掘出交易集之间有时间序列关系的模式。它挖掘的 侧重点在于分析数据问的前后或因果关系,找到那些“一些项跟随另一些项” , 以预测未来的访问模式。序列模式分析和关联分析类似,其目的也是为了挖掘 数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序列关系。 序列模式便于进行电子商务的组织,预测客户的访问模式,对客户开展有针对 性的广告服务或者主

15、动推荐客户感兴趣的页面,以满足访问者的特定要求。 序列分析在电子商务中的应用典型实例是内容推荐,发现序列模式能够便 于电子商务的组织者预测客户的访问模式, 对客户提供个性化服务, 网站的管 理员可将访问者按浏览模式分类, 在页面上只展示该浏览模式的访问者经常访 问的链接, 而用“更多内容”指向其它未展示的内容。5 5 数据挖掘在电子商务中的应用数据挖掘在电子商务中的应用5 51 1 优化企业资源优化企业资源节约成本是企业盈利的关键。基于数据挖掘技术,实时、全面、准确地掌 握企业资源信息,通过分析历史的财务数据、库存数据和交易数据,可以发现 企业资源消耗的关键点和主要活动的投入产出比例,从而为企

16、业资源优化配置 提供决策依据。通过对 Web 数据挖掘,快速提取商业信息,使企业准确地把握 市场动态,极大地提高企业对市场变化的响应能力和创新能力,使企业最大限 度地利用人力资源、物质资源和信息资源,合理协调企业内外部资源的关系, 产生最佳的经济效益。5.25.2 管理客户数据管理客户数据随着“以客户为中心”的经营理念的不断深入人心,分析客户、了解客户 并引导客户的需求已成为企业经营的重要课题。基于数据挖掘技术,企业将最 大限度地利用客户资源,开展客户行为的分析与预测,对客户进行分类,有助 于客户盈利能力分析,寻找潜在的有价值的客户,开展个性化服务,提高客户 的满意度和忠诚度。通过 Web 资源的挖掘,了解客户的购买习惯和兴趣,从而 改善网站结构设计,推出满足不同客户的个性化网页。 利用数据挖掘可以有效地获得客户。比如通过数据挖掘可以发现购买某种 商品的消费者是男性还是女性,学历、收入如何等等。甚至可以发现不同的人 在购买该种商品的相关商品后多长时间有可能购买该种商品,以及什么样的人 会购买什么型

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号