电商系统中的数据分析方法研究

上传人:飞*** 文档编号:35333060 上传时间:2018-03-14 格式:PDF 页数:4 大小:12.53KB
返回 下载 相关 举报
电商系统中的数据分析方法研究_第1页
第1页 / 共4页
电商系统中的数据分析方法研究_第2页
第2页 / 共4页
电商系统中的数据分析方法研究_第3页
第3页 / 共4页
电商系统中的数据分析方法研究_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《电商系统中的数据分析方法研究》由会员分享,可在线阅读,更多相关《电商系统中的数据分析方法研究(4页珍藏版)》请在金锄头文库上搜索。

1、电商系统中的数据分析方法研究- 课题研究意义随着Internet 技术的不断发展与成熟,电子商务这一现代商业模式以其高效率、低成本和不受时空限制的特点成为企业商务活动发展的大势所趋。电子商务的迅速发展导致诸多问题也随之出现。 如今所有企业面临的一个共同问题就是尽管电子商务系统收集了相当大量的数据, 然而能够得到的、真正有价值的信息却非常少。如何对这些信息进行有效的组织与利用,从海量的数据中获得有利于商业运作、提高竞争力的信息是企业亟待解决的焦点问题。本文旨在通过对电子商务中数据挖掘技术的研究,针对不同的挖掘目的,发现并选择适当的数据挖掘算法或模型。将研究数据挖掘技术在电子商务各个方面的应用,其

2、数据挖掘技术是分别针对不同的挖掘任务设计的,需要根据具体的应用选择适当的挖掘技术,以使面向电子商务的数据挖掘研究更加具体。多种挖掘技术与电子商务系统有机的融合,可以为电子商务活动争取最大的收益提供源源不断的动力。- 国内外研究现状评述(恰当地标明参考文献) 数据挖掘是用于大规模数据处理的一种思维方法和技术手段,是在各种数据成指数级增长和以数据库技术为核心的信息技术逐渐成熟的背景下产生的。随着数据挖掘在各领域的广泛应用, 数据挖掘技术所要解决的问题主要包括算法效率亟待提高;适应多数据类型、容噪的挖掘技术; 动态数据和知识的挖掘技术,以解决大量的、 异质数据集的以及网络与分布式环境下的数据挖掘问题

3、等。数据挖掘是面向应用的,也只有将数据挖掘技术应用到大量的、复杂的数据中去,对数据挖掘技术研究的价值才能得到最佳体现。电子商务的发展使得越来越多的企业开始网上交易,电子商务网站的服务器日志、后台数据库中客户相关的数据以及大量的交易记录等数据资源中所蕴涵的大量的有益信息有待于充分地挖掘和利用。无疑电子商务是数据挖掘应用的最佳对象,面向电子商务的数据挖掘是 Web 挖掘的典型应用。与国外相比,国内对数据挖掘技术应用的研究稍晚,从事研究工作的人员主要集中在大学或研究所,研究领域一般集中于算法以及有关数据挖掘理论方面的研究。目前,数据挖掘技术在电子商务网站设计中的应用研究集中在优化网站链接结构、页面实

4、时推荐以及个性化站点设计等方面。由于用户在网站上的访问行为被Web 服务器以日志形式保存, 对 Web 日志进行挖掘以发现用户访问模式来优化网站设计自然成了这一领域的主流。 Mobasher 等人提出基于关联规则和聚类分析的页面推荐算法(参考文献: (Mobasher B, Dai H, Luo T, et al. Effective personalization based on association rule discovery from web usage dataA. Mobasher Bed. 3rd Int Workshop on Web Information and Dat

5、a Management (WIDM 2001)C. New York: ACM Press, 2001. 9-15)和( Mobsher B. WebPersonalizer: a server2side recommender system based on web usage mining EB/OL. http: www. cs. depaul. edu/ research/ technical. asp, 2001),可用于建立个性化推荐网站。Bose 等人在文献 (ose P, Kranakis E, Krizanc D, et al Strategies for Hotlink

6、As signmentsC. In: Proc 11 th Symp. on algorithms and computation (ISAAC 2000), 2000: 23-34)中首先提出通过增加hotlink 优化站点结构的方法。在此基础上, Fuhrmann 等人在文献 (Fuhrmann S, Krumke S O, Wirth H C. Multiple Hotlink AssignmentC. In: Proceedings of the Twenty-Seventh International Workshop on Graph-Theoretic Concepts in C

7、omputer Science, Rostock, Germany, 2001)中使用该方法优化站点链接结构,即通过有限的hotlink 的增加最小化权重较高的节点与根节点之间的路径距离。文献 (Cooley R, Tan P N, Srivastava J. Discovery of Interesting Usage Patterns from Web DataC. In: Web Usage Analysis and User Profiling Workshop (WEBKDD.99), Berlin: Springer, Verlag, 2000:163-182.) 中 Cooley

8、 等人基于用户访问频繁路径定义频繁项集的兴趣度,将有较高兴趣度的路径作为改进站点结构的参考。文献(Wu E H C, NgM K, Huang Z X. On Improving Website Connectivity by Using Web-Log Data StreamsC. The 9th International Conference on Database Systems for Advanced Applications (DAS-FAA), Jeju, Korea, 2004.)中Edmond 等人则将兴趣度指标引入基于会话的序列模式中,但并非用来修改网站结构,而是以此提出

9、能够降低搜索这些指标的超链接的算法。国内许多学者也提出了在Web 日志挖掘中引入聚类分析、关联规则、 序列模式等挖掘算法对Web 站点进行改进的优化方法,如文献(井福荣 ,谢辅雯 .关联规则在网站结构优化中的改进算法 J.计算机系统应用,2007(1): 44-46, 50.)探讨了关联规则的改进算法在网站结构优化中的引用,文献(程舒通 ,徐从富 ,但红卫 .基于频繁序列模式压缩技术的网站结构优化J.计算机工程与应用,2007. 43(30): 133-135.)应用的是基于频繁序列模式压缩技术的网站结构优化方法, 而文献 (夏敏捷 ,张锦歌 .在 Web 日志挖掘中应用聚类改进网站结构的研究

10、J.中原工学院学报 ,2005,16(6):39-41) 中则是基于Web 日志挖掘的聚类分析算法在改进网站结构的分析研究。还有一些学者提出了应用Web 日志挖掘的其它方法。文献(邵峰晶 ,于忠清 .数据挖掘原理与算法M. 北京 :中国水利水电出版社,2003)也提出了利用Web 日志挖掘发现不符合用户期望位置的页面的算法,并应用该方法对站点链接结构进行调整。文献(郭新涛 ,梁敏 ,阮备军 .挖掘Web 日志降低信息搜寻的时间费用J.计算机研究与发展, 2004 (10):1737-1747)则提出了一种通过查找用户历史路径,统计找到目标页面的时间,从而寻找一组最优路径使搜寻目标页面时间最短的

11、方法,同样也是通过挖掘Web 日志增加必要的超链接。文献(Zhu J H, Hong J, Hughes J G . PageCluster: Mining Conceptual Link Hierarchies from Web Log Files for Adaptive Web Site NavigationJ. ACM Transactions on Internet Technology, 2004, 4(2):185-208) 还提出了一种基于Web 日志挖掘的自适应站点导航方法,其目的也是为了缩短用户搜索资源的时间。CRM 经历若干年的发展,在电子商务兴起之后,两者便结合在了一起

12、。近几年来专门的 CRM 系统在欧美国家的很多企业都已经得到使用,国内许多企业也开始重视现代的营销理念和商业运作方式走向了CRM 的使用,也使得国内外对于数据挖掘在的CRM 中的研究具有非常广泛的价值,对于CRM 的客户识别、客户细分及客户保持等几个主要方面应用数据挖掘算法及模型的研究极大地推动了该数据挖掘在领域应用的进展。在国际学术界的学者们主要利用数据挖掘技术的相关算法建立基于市场的客户细分模型。当然对其他方法在网络营销数据应用的研究文献也有很多,如对关联分析、 序列模式分析、分类分析和聚类分析及其相关算法的应用,但多与客户关系管理中对客户的群体聚类、客户细分以及客户的保持策略相结合。结合

13、对客户相关数据分析,有效地识别客户偏好及购买模式, 形成对客户以往行为的认知和未来行为的预测,有的放矢的实施营销策略或对营销策略进行组合,将是数据挖掘技术在客户关系管理和网络营销领域有待进一步探索的方向。电子商务中的客户关系管理和营销管理涉及大量且复杂的客户信息以及与交易相关的各种数据信息, 直接应用挖掘技术不仅难以对数据进行有效地处理,其结果也将难以理解甚至造成不堪的后果。数据仓库解决方案以及与OLAP 技术的结合也是目前数据挖掘领域的研究热点,经过提取、转换、清洗等处理后的数据能被数据挖掘算法更好的识别,而OLAP 能够针对数据仓库中的某个主题进行联机数据访问、处理和分析, 从多个角度对信

14、息进行快速、一致交互的存取、 满足决策者在多维环境下特定的查询和报表需求(参考文献: 王丽珍 ,周丽华 ,陈红梅 .数据仓库与数据挖掘原理及应用M. 北京 :科学出版社 , 2005:64-68)。随着数据挖掘在电子商务中重要作用的凸现,该领域的研究前景依然非常广阔。但电子商务中的数据挖掘存在的诸多问题依然会随着信息技术的不断出现而涌现,例如对多媒体数据的挖掘, 目前依然是数据挖掘领域的难点之一。如何将服务器数据的日志数据转换成一定的数据格式以适合数据挖掘,如何解决对分布性、异构性数据源的挖掘以及控制整个Web 上知识的发现过程等等都将伴随着电子商务应用需要进一步研究。- 采用的主要研究方法、

15、模型、技术.1 关联规则中的标准Apriori 算法关联规则采用支持度和置信度来评价事务项之间的关系。文献(余波 ,朱东华 ,刘卓君 ,加权关联规则挖掘算法在电子商务中的应用J.计算机工程与应用,2008.44(17):128-130) 提出了一种新的加权关联挖掘算法应用于电子商务中证明了其有效性。.2 CRM CRM 经历若干年的发展,在电子商务兴起之后,两者便结合在了一起。近几年来专门 的 CRM 系统在欧美国家的很多企业都已经得到使用,国内许多企业也开始重视现代的营销理念和商业运作方式走向了CRM 的使用,也使得国内外对于数据挖掘在的CRM 中的研究具有非常广泛的价值,对于CRM 的客户

16、识别、客户细分及客户保持等几个主要方面应用数据挖掘算法及模型的研究极大地推动了该数据挖掘在领域应用的进展。在国际学术界的学者们主要利用数据挖掘技术的相关算法建立基于市场的客户细分模型。如Morwitz 在文献 (费贤举 ,王文琴 ,庄燕滨 .基于关联规则的数据挖掘技术在CRM 中的应用研究J.常州工学院院报 ,2005.18(4):1-6) 中研究使用CART 算法、 K 均值聚类方法以及判别分析方法进行客户市场的细分,分析比较了三种算法的效率及有效性。Jaesoo Kim 等人在文献 (Jaesoo Kim et al, Segmenting the market of West Australian senior tour fists basing an artificial neural network, Tourism Management, 2003, 24(1):25-34) 中研究了神经网络算法在旅游业客户细分 中的应用,探讨了神经网络应用在客户细分中的优势。如文献(Guo Yunhua, Zu Qiao

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号