基于agent的个性化推荐系统研究与设计

上传人:E**** 文档编号:113831270 上传时间:2019-11-09 格式:PDF 页数:76 大小:4.30MB
返回 下载 相关 举报
基于agent的个性化推荐系统研究与设计_第1页
第1页 / 共76页
基于agent的个性化推荐系统研究与设计_第2页
第2页 / 共76页
基于agent的个性化推荐系统研究与设计_第3页
第3页 / 共76页
基于agent的个性化推荐系统研究与设计_第4页
第4页 / 共76页
基于agent的个性化推荐系统研究与设计_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《基于agent的个性化推荐系统研究与设计》由会员分享,可在线阅读,更多相关《基于agent的个性化推荐系统研究与设计(76页珍藏版)》请在金锄头文库上搜索。

1、南昌大学 硕士学位论文 基于Agent的个性化推荐系统研究与设计 姓名:曾光 申请学位级别:硕士 专业:计算机应用技术 指导教师:白小明 20081201 摘要 摘要 面对复杂而庞大的I n t e r n e t ,多数用户往往觉得力不从心,当用户在网络上 搜索信息时,往往就会因为信息量过大且无目的性发生“迷航“ 、“认知过载“ 等现象。基于此种情况,面对用户的网络个性化推荐系统应运而生而且发展迅 速。 个性化推荐系统在用户当前会话的基础上,根据以往访问用户习惯,立即 判断当前用户类别并预测其下一步可能感兴趣的页面并推送至当前用户。这种 的做法很大程度上减轻了用户的寻找难度,使得信息获取在某

2、种程度上更加高 效。 本文在深入理解W e b 日志挖掘一般过程,研究W 曲日志挖掘的技术的基础 上,结合实际情况,重点深入研究了W e b 日志挖掘的核心算法,在大量研究前 人已有算法的基础上,提出了基于兴趣度的矩阵处理算法,此种算法较之以前 单纯1 ,0 填值的方式,改进并采用了兴趣度填值,其中兴趣度模型的建立结合 了最能代表用户偏好的浏览时间和浏览次数比两个参数,最后得出的结果在保 留高效快捷的基础上,更加比普通矩阵算法更加贴近用户习惯,推荐结果更加 准确。在得出了核心算法之后,本文进一步研究了页面推荐算法,并给出了一 系列定义帮助理解。 同时本文也着重分析研究了A g e n t 的概

3、念、技术框架,多A g e n t 之间的通信, J A D E 开发平台以及代码编写,并在此基础上,利用其交互性、自主性、协作性 等众多特性搭建了完整的基于A g e n t 技术的W E B 日志挖掘系统框架,并详细阐 述了系统中每个A g e n t 的功能和流转方式,针对在M A S 系统中遇到的通信问题 给出了基于X M L 的K Q M L 的通信言语解决办法,阐明了在实际开发过程中, 独立A g e n t 的代码组成部分及编写方法,并在最后给出了系统实现界面和相应的 用户聚类、页面聚类结果图。 关键字:W e b 日志挖掘;矩阵算法;兴趣度;A g e n t 技术 A B S

4、 l l R A C T A B S T R A C T W h e nf a c e dt h ec o m p l e xa n dh u g ei n t e r n e t ,m o s tu s e r sf e e lh a r dt os e a r c h i n f o r m a t i o nt h e yw a n t ,a n da l w a y sl o s tt h e i rw a y sb e c a u s eo ft h eo v e r w h e l m e d i n f o r m a t i o na n dl a c ko fp u r p

5、o s e s B a s eo nt h i ss i t u a t i o n ,t h eP e r s o n a l i z e d R e c o m m e n d a t i o nS y s t e me m e r g ea st h et i m e sr e q u i r ea n dd e v e l o p sq u i c k l y T h eP e r s o n a l i z e dR e c o m m e n d a t i o nS y s t e m ,b a s eo nt h ec u r r e n tu s e r S a c c e

6、s s i n gp a g ea n dt h ea c c e s sh a b i t so fo t h e ru s e r s ,d e c i d ew h i c hg r o u pt h ec u r r e n t u s e rb e l o n gt O ,t h e np r e d i c tt h en e x tp a g e st h a tu s e r sm a yb ei n t e r e s t e di na n ds e n dt o t h eu s e r B a s eo naf u r t h e rs t u d yo fg e n

7、e r a lp r o c e s sa n dt e c h n o l o g yo fW E BL O G m i n i n g ,t h i sp a p e rf o c u s e do nt h er e s e a r c ho f W E B L O GM i n i n gA l g o r i t h m A n da t l a s tt h i sp a p e rp r o p o s eam a t r i xa l g o r i t h mb a s e do ni n t e r e s tm e a s u r ew h i c hi m p r o

8、v e a n du s et h ei n t e r e s tm e a s u r et of i l lt h em a t r i xi n s t e a do ft h ec u s t o m1 , 0a l g o r i t h m T h ei n t e r e s tm e a s u r ec o m b i n e dr e a d i n gt i m ew i t hr e a d i n gt i m e sw h i c hc a nm o s ts t a n d t h eu s e r Si n t e r e s t T h er e s u l

9、 t si sn o to n l ye f f i c i e n ta st h e1 , 0a l g o r i t h mb u ta l s o m o r es i m i l a rt ot h er e a lu s e rv i s i tm o d e l A tt h em e a n t i m e ,t h i sp a p e rd e e p l yr e s e a r c h e do nt h eA g e n tc o n c e p t ,t e c h n o l o g y f r a m e ,t h ec o m m u n i c a t i

10、 o nb e t w e e nA g e n t s ,J A D Ew o r k s h o pa n dt h ep r o g r a m m i n g o fA g e n t A n db e c a u s eo ft h ec o m m u n i c a t i o np r o p e r t y ,a u t o n o m y ,c o o p e r a t i o n p r o p e r t y ,t h em i n i n gs y s t e ma r c h i t e c t u r eb a s eo nA g e n ti sp r o p

11、 o s e d T h ef u n c t i o n s a n dt h ew a yo ft r a n s f e ro fA g e n t sa r eg i v e ni nd e t a i l ,t h es o l u t i o no fc o m m u n i c a t i o n p r o b l e mi nM A Ss y s t e mi s d i s c u s s e db a s eo nX M La n dK Q M Lc o m m u n i c a t i o n l a n g u a g e ,t h ei n d e p e n

12、d e n tA g e n tp r o g r a m m i n gi nt h er e a ld e v e l o p m e n tp r o c e s si s d e s c r i b e d ,a n da tl a s tb o t ht h ei m p l e m e n t a t i o ni n t e r f a c ea n dt h er e s u l t so fu s e rc l u s t e r a n dp a g ec l u s t e ra r es h o w n K e y w o r d s :W E BL O GM i n

13、i n g ;i n t e r e s tm e a s u r e ;m a t r i xa l g o r i t h m ; A g e n tt e c h n o l o g y 学位论文独创性声明 学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得南昌太堂或其他教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意。 学位论文作者签名( 手写) :孺丸 签字日期:

14、狲学年I 乞月印日 学位论文版权使用授权书 本学位论文作者完全了解南昌盔堂有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权直昌太堂可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编本学位论文。同时授权中国科学技术信息研究 所将本学位论文收录到中国学位论文全文数据库,并通过网络向 社会公众提供信息服务。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:寓乞导师签名:西硌嘲 签字日期:砂越年Iz 月冲日 签字日期:抛年J t 月叩日 第一章绪论 第一章绪论 1 1

15、研究的目的与意义 L 1 1 研究的目的 近年来,随着I n t e r n e t 在流量、规模和复杂度等方面的飞速增长,W w w 已 成为一个巨大的、分布广泛的、全球性的信息服务中心,它涉及到新闻、广告、 金融管理、教育、电子政务、电子商务等各方面的信息服务。W e b 中包含了W e b 页面的内容信息、丰富的超链接信息,以及用户访问的日志信息,为数据挖掘 提供了丰富的资源。然而,面对复杂而庞大的I n t e m e t ,多数用户往往觉得力不 从心,当用户在网络上搜索信息时,往往就会因为信息量过大且无目的性发生 “迷航”、“认知过载“ I I 】等现象。W E B 为人们提供越来越

16、多信息的同时,其结 构也变得越来越复杂,那些W e b 经验不足的用户经常会“迷失“ 在网络空间中, 面对庞大的网络空间不知何去何从。因此,在I n t e m e t 给人们带来极大便利和丰 富的信息资源的同时,也产生了如下有待解决的问题。 ( 1 ) 难以准确获得所需要的信息 虽然I n t e r n e t 上存储了海量的数据,但由于W e b 是无结构的、动态的并且 W e b 页面的复杂程度远远超过了文本文档,给人们准确查找和定位所需要的信 息带来了极大的困难,即所谓的“信息爆炸,但知识贫乏”。 ( 2 ) 难以获得信息之间潜在的知识 多样的、海量的W e b 数据中蕴含着许多有用的、潜在的,但不容易被发现 的知识和模式,人们迫切需要发现这些知识和模式的方法和工具。 ( 3 ) 个性化的信息服务 不同层次、不同爱好和使用目的的浏览者需要个性化的信息服务。但是, 这个问题涉及到W e b 门户站点的管理、组织和经营。W e b 站点的经营和管理者 为提高网站的声誉和效益,需要了解其用户究竟需要什么,其中包括根据大多 数用户的共同兴

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号