商品关键属性抽取系统的设计与实现

上传人:w****i 文档编号:110423301 上传时间:2019-10-30 格式:PDF 页数:46 大小:2.25MB
返回 下载 相关 举报
商品关键属性抽取系统的设计与实现_第1页
第1页 / 共46页
商品关键属性抽取系统的设计与实现_第2页
第2页 / 共46页
商品关键属性抽取系统的设计与实现_第3页
第3页 / 共46页
商品关键属性抽取系统的设计与实现_第4页
第4页 / 共46页
商品关键属性抽取系统的设计与实现_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《商品关键属性抽取系统的设计与实现》由会员分享,可在线阅读,更多相关《商品关键属性抽取系统的设计与实现(46页珍藏版)》请在金锄头文库上搜索。

1、华中科技大学 硕士学位论文 商品关键属性抽取系统的设计与实现 姓名:王崤 申请学位级别:硕士 专业:软件工程 指导教师:刘小峰 2011-05-11 I 华 中 科 技 大 学 硕 士 学 位 论 文 华 中 科 技 大 学 硕 士 学 位 论 文 摘摘 要要 随着信息技术与网络技术的不断发展,互联网与商业活动的结合创造了新的网 络经济,使企业的经营活动由传统经营模式转向将产品发布、网络营销、交易管理 而实现电子化,迎来了崭新的电子商务时代。 在电子商务时代,商家为了追寻潜在的用户,使用了越来越多的数据挖掘技术, 让广告和商品引导信息,可以直接进入到用户的视野, 从而进行用户引导,达到广 告的

2、目的。例如,淘宝,在淘宝网页中有很多商品的链接,为了吸引用户去发现自 己所需要的商品。而在淘宝上的卖家,也会加入很多对自己的商品的描述,其中必 然会有很多促销的信息,而使商品本身的用户关心的属性,迷失在其中。 那么作为淘宝这样的 C2C 电子商务模式,希望可以在检索商品时,可以检索到 更中性的,客观的商品描述。在对数据进行观察之后,发现了数据的规律,于是引 出了如何提取商品中用户关心的属性以及关键字的问题。 根据商品属性的进行权重的计算,再加上学习系统的修正,提取出商品中用户 关心的属性和关键字,这样一方面可以使检索更加有针对性,另一方面可以排除掉, 商铺中对商品添加的额外促销信息。本文提出了

3、三种权重计算的方式,让检索中的 排名更加客观准确。 关键词:关键词:电子商务 用户引导 用户关心 商品属性 II 华 中 科 技 大 学 硕 士 学 位 论 文 华 中 科 技 大 学 硕 士 学 位 论 文 Abstract With the information technology and network technology unceasing development, the combination of the Internet and commercial activity created new network economy, make enterprise busines

4、s activity by the traditional management mode shifted product release, network marketing and transaction management and realize electronic and ushered in the new e-commerce era. In the era of e-commerce, the businessman in order to follow the potential user, use more and more data mining technology,

5、 let advertising and commodity guide information can be directly into the users vision, thus user guide, achieve the purpose of advertising. For example, in Taobao, there are a lot of goods and Taobao web links, in order to attract users to find themselves needed goods. And in Taobao, the seller wil

6、l join many of their commodity description, which will have a lot of promotional information, and make the products themselves users care properties, lost in it. Then as Taobao such C2C e-commerce mode, the hope can in searching, can retrieve the goods more neutral, objective commodity description.

7、Hence raises how to extract users concern commodity attribute and keyword problem. Extract users concern commodity attribute and keyword, on the one hand, can make the retrieval more targeted, on the other hand may exclude, businesses of commodities added extra promotion information. Key words:E-com

8、merce user-guide users-care attribute keywords 独创性声明独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及 取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含 任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献 的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律 结果由本人承担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和

9、电子版,允许论文被查阅和借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密, 在 年解密后适用本授权书。 不保密。 (请在以上方框内打“” ) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 本论文属于 1 华 中 科 技 大 学 硕 士 学 位 论 文 华 中 科 技 大 学 硕 士 学 位 论 文 1 绪论绪论 本章首先简要介绍研究电子商务中的潜在用户挖掘的国内外发展现状,然后对 该论文系统的研究背景作一个基础介绍,最后阐述本论文的预计完成目标。 1.1 论文研究背

10、景论文研究背景 电子商务 ,通常被称为商业电子商务,电子商务或电子 ,包括购买和销售产 品或服务,通过电子系统,如互联网和其他计算机网络 。 这不仅仅是产品的在线 购买和销售。 它还包括开发,市场营销,销售,配送,服务和产品和服务的整个在 线支付过程。 进行的电子交易量增长非常具有广泛的使用互联网1。 一个电子商务的相当大比例是完全电子化的进行虚拟物品,如内容网站上获得 的保费2。 网上零售商有时被称为电子零售商和在线零售,几乎所有的大型零售商已 经存在对电子商网站3。 电子商务是企业之间进行的是被称为企业对企业或 B2B。 B2B 的可开放给所有 感兴趣的各方(如商品交易 ) ,或仅限于特定

11、的,通过资格预审的参与者( 私营电 子市场 ) 。电子商务是企业与消费者之间进行的桥梁,另一方面,被称为企业对消 费者或 B2C4。这样的电子商务类型公司有 A 。网上购物是一种商业形 式的用户直接在网上寻找卖家的过程,没有任何中介服7务。 出售和购买交易完成 后的实时交互, 如果有中介存在,那么买卖交易被称为电子商务等,如 eB 。 电子商务被普遍认为是销售方面的电子商务 。它还包括数据交换,以方便商业 交易的融资和支付问题5。 最初,电子商务被确定为促进电子商业交易,并以此作为技术,用于电子数据 交换(EDI)和电子资金转帐(EFT)6,7。这些都是在 70 年代末引入,使企业发送 采购订

12、单或发票, 如电子商业单据。 在 20 世纪 80 年代的增长和信用卡, 自动 (ATM) 的取款机和电话银行也接受电子商务的形式。另一种电子商务形式是航空公司的预 订系统为代表的佩剑在美国和 Travicom 在英国8。 2 华 中 科 技 大 学 硕 士 学 位 论 文 华 中 科 技 大 学 硕 士 学 位 论 文 随着用户规模的扩大,越来越多的信息,电子商务企业为了更好的检索出用户 喜爱的商品,企业也进行了探索,数据挖掘也在这些探索中也越来越被重视9。 1.2 国内外研究概况国内外研究概况 从 20 世纪 90 年代起,电子商业中又出现了新型技术,如另外包括企业资源规 划系统(ERP)

13、 , 数据挖掘和数据仓库 ,商业智能的理念也被提了出来10。 用户在上网寻找自己喜欢的商品时,往往都以一定的关键词去选取,人们去分 析这些关键词11,运用数据挖掘技术,寻找用户点击访问的,规律,在这样商品中 寻找用户喜爱的商品,这样的工作在国内外的电子商务或者互联网公司中早已成为 其核心技术12。 在国内阿里巴巴在这方面走得比较靠前, 但是传统的按照标题来检索仍然在被使 用,因为传统的技术的革新,还未到达一定的程度,阿里巴巴还没有对此有很好的 解决方法13。但是在数据挖掘领域,阿里巴巴越来越重视其发展。数据挖掘技术与 普通的数据分析有质的不同,数据挖掘技术以高度精确和高度可靠的手段从海量数 据

14、中挖掘和产生新的知识,成为有力的科学决策依据。企业利用数据挖掘,可以充 分了解客户的信息,预测未来,防范风险,为企业决策提供最有力的依据。在美国 和其他发达国家,数据挖掘与知识管理正在迅速和广泛地推动着社会数据化和信息 化的发展。目前,数据挖掘技术在各种类型的风险分析、资信评估、医疗诊断决策 和市场开发等诸多领域得到了应用。以数据挖掘技术为基础的信用卡分析市场规模 已超过 2000 亿美元14。 数据挖掘的前景被人们普遍看好。来自 Infoconomy 报道显示,2010 年底与数据技 术有关的分析性客户关系管理市场已达到 90 亿美元,远远超过预测值。国际知名调 查机构也将其和人工智能列为“

15、未来 3 到 5 年内将对工业产生深远影响的五大关键技 术”之首,还将并行处理体系和数据挖掘列为未来 5 年内投资焦点的十大新兴技术前 两位15。 3 华 中 科 技 大 学 硕 士 学 位 论 文 华 中 科 技 大 学 硕 士 学 位 论 文 1.3 论文主要工作论文主要工作 本论文针对商品信息检索领域的现有问题,深入研究了 Web 信息抽取技术。在 研究的基础上,本论文提出了多种商品属性权重计算的方法,并且结合机器学习, 以及商品归类的方法,完成了对属性的准确定位。用简单实用的方法,解决了在电 子商城中,商品检索不准确的问题,系统设计简单,运行快速。 1.4 系统实际应用意义系统实际应用

16、意义 目前, 电子商务的迅速发展, 过去检索方式的简单性, 让现在检索的准确性不足, 商品检索作为电子商务的重要组成部分,提供了高效精确的商品搜索功能,成为人 们获取卖家的重要工具。因此,商品检索系统需要更高质的检索技术,更高效的检 索性能和更全面的系统功能16。 在现在电子商城中,包含了各种商品的信息,而这些也是电子商务网站用来检索 的关键内容,但是鉴于检索的复杂度问题,现在电子商城一般采用检索标题的方法, 于是商户在下列信息中添加了很多关于本商品的信息,甚至是促销的信息,这些信 息有些有利于商户的商品被检索出来,但是如果一些商户在标题上添加了虚假的信 息,我们的检索系统也会把它检索出来。或者也会有一些不相关的信息商品也被检 索出来。 于是我们想到了以商品属性信息作为检索的想法, 我们预先对商品的属性进行统 计,分析出商品属性的关心程度,对其排行,分析出一类商品的关心的属性排行, 这样对每一类商品的检索属性就不一样,减少了在不相关商品中检索的可能性。而 对

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号