基于agent个性化智能信息检索系统

上传人:wt****50 文档编号:35388731 上传时间:2018-03-15 格式:DOC 页数:5 大小:62.50KB
返回 下载 相关 举报
基于agent个性化智能信息检索系统_第1页
第1页 / 共5页
基于agent个性化智能信息检索系统_第2页
第2页 / 共5页
基于agent个性化智能信息检索系统_第3页
第3页 / 共5页
基于agent个性化智能信息检索系统_第4页
第4页 / 共5页
基于agent个性化智能信息检索系统_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于agent个性化智能信息检索系统》由会员分享,可在线阅读,更多相关《基于agent个性化智能信息检索系统(5页珍藏版)》请在金锄头文库上搜索。

1、目前智能信息检索领域的重要课题目前智能信息检索领域的重要课题“基于基于 Agent 个性化智能信个性化智能信息检索系统息检索系统”的研究内容的研究内容Abstract Along with the quick development of WWW and other form information services,people can more easy and more direct get the informa-tion of various forms than former,but the information resource of Internet information

2、space is different structure,itwill spend plenty of time and ener-gy that people want to discover,collect and defend the information of self needs from Internet information space.Though the present Internet havemany search engines,Yahoo,Sohu etc,they still have many defect,as meet user interest and

3、interactive mode.People need a kind of tool urgentlywitheffective use the various information resources in Internet information space.Keywords Intelligent information retrieval Personalized PHP Internet Intelligent software Agent摘 要 Internet 空间中的信息资源是异构的,人们要想从 Internet 中发现、收集和维护自己需要的信息则要花费大量的时间和精力。虽

4、然目前 Internet 上有很多的搜索引擎,如 Yahoo、搜狐等,但这些引擎还硕士论文代写存在着不少缺陷,如在适应用户兴趣、交互方式等方面均存在着不足。人们迫切需要一种工具以有效地利用 Internet 信息空间中的各种信息资源。本文是针对当前 Internet 检索系统中存在的不足,开发设计了一个“基于 Agent 个性化智能信息检索系统” 。该系统的研究内容属目前智能信息检索领域的重要课题。关键词 智能信息检索 个性化 PHP Internet 智能体 Agent1 系统开发背景11 信息检索系统概述近年来,智能信息检索作为人工智能(AI)的一个独立分支得到迅速发展。在 Interne

5、t 技术迅速普及的今天,面向 Internet 的信息获取与精化技术已成为当代计算机科学与技术领域中迫切需要研究的课题,将人工智能技术应用于这一领域是人工智能走向应用的一种新的契机与突破口。WWW 和其它形式信息服务的迅速发展,使人们比以往能够更容易、更直接地获取各种形式的信息。但由于 Internet 信息空间中的信息资源是异构的,而且信息是动态变化的,人们要想从 Internet 信息空间中发现、收集和维护自己需要的信息需要花费大量的时间和精力。http:/虽然目前Internet 上有很多搜索引擎,如 Yahoo,WebCrawler 等用于帮助人们发现和收集 Internet 上的各种

6、信息,但它们还存在着一些缺陷,如信息引导能力差,即不能帮助用户确定所需信息所在的领域,导致大量无关信息的涌现;使用简单的关键字匹配查询,信息检索的精确度不高;一般不具备学习功能,不能主动地从 Internet 信息空间发现和收集用户需要的信息。人们迫切需要一种工具以有限地利用 Internet 信息空间中的各种信息资源。信息检索系统(搜索引擎)是指 Internet 上专门提供查询服务的一类系统,这些系统通过网络搜索软件(又称为网络搜索机器人)或网站登录等方式,将 Internet 上大量网站的页面收集到本地,经过加工处理再存储,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。早期的

7、搜索引擎是把 Internet 中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要得到的信息可按它们的分类分层进入,就能到达最后的目的地,找到自己想要的信息。这是最原始的方式,只适用于 Internet 上信息并不多的时候。随着 Internet 信息按几何级数地增长,出现了真正意义上的搜索引擎3,这些搜索引擎知道网站上每一页的开始,随后搜索 Internet上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。12 信息检索系统的现状为了实现信息检索的智能化,人们将人工智能技术引入到信息检索中,已经研究出

8、了各种智能信息检索方法,提出了许多智能型检索系统模型,主要分为两大类:一类是基于机器学习的大范围信息检索系统1,另一类就是智能化的用户个性化信息检索系统2。目前 Internet 上的搜索引擎明显地可分为两大类,一类是自由词或关键词检索搜索引擎,另一类是分类搜索引擎,当然这两类搜索引擎的功能是互相借鉴和渗透的4。按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为以下几类:1)目录式搜索引擎 它的代表是:Yahoo、LookSmart、OpenDirectory、Go Guide 等。2) http:/机器人搜索引擎 它的代表是:AltaVista、Northern Light、Exci

9、te、Infoseek、Inktomi、FAST、Lycos、Google;国内为:“天网” 、悠游、OpenFind 等。3)元搜索引擎 它的代表是:WebCrawler、InfoMarket 等。13 现有信息检索系统存在的缺陷1)个性化服务存在着不足 现有大部分信息检索系统采用关键词输入方式进行检索,很容易让用户感到迷茫,使得用户无法正确地表达自己的兴趣,尽管有些系统为此进行了改进,确实改善了检索效率,由于没有不同个性化之间的信息共享机制,因而不能很好地适应用户兴趣变化。2)没有利用个性化检索和集中浏览的优点 现有信息检索系统不是注重发展大范围信息检索系统,就是注重解决特定需求信息检索问

10、题,没有综合考虑这两种检索方式的优点。3)用户与检索系统的交互方式比较单调 现有系统普遍采用相关反馈技术作为用户和系统进行交互的主要手段,针对不同需求的用户,提供不同的输入方式是目前现有系统所缺少的。4)缺少分布式智能信息检索和适应信息源信息变化的能力 由于没有有效地适应信息源信息变化的机制,不能及时为用户提供新的信息,因而无法为用户快速定位感兴趣的主题。目前,国内广泛开展了基于 Agent 技术的研究和应用系统开发,并取得了较大的成果。研究者由自己的理解和应用出发,对于 Agent 给出的定义也有所差异。P.Maes 认为:“Agent 是复杂动态环境中能自治地感知环境并能自治地通过动作作用

11、于环境,从而实现其被赋予的任务或目标的计算机系统。 ” http:/在这个定义中,“自治”的含义是指 Agent 的行为由其自身的经验决定的。Agent 根据控制机制,可以分为以下几种类型:基于规则的 Agent、基于规划器的 Agent、基于神经网络的Agent、基于机器学习的 Agent。近年来,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展。在 Internet 技术迅速普及的今天,面向 Inter-net 的信息获取与精化技术已成为当代计算机科学与技术领域中迫切需要研究的课题,而将人工智能技术应用于这一领域是人工智能走向应用的一种新的契机与突破口。由于 Agent 技术及其应

12、用程序的许多良好特性,如主动性、智能性、协作性、移动性等,导致了 Agent 技术被提出用于解决 Internet 应用中的问题。从当前和将来发展的观点看,分布式软件智能体 Agent 方法是实现人机交互学习,代替人们从事繁杂信息收集、过滤、聚类以及信息融合的更好方法,尤其是应用在用户个性化商品信息采集方面。我们提出了一个面向 Internet 的个性化商品信息采集系统,适用于电子商务中的分布在 Internet 上的商品信息采集。本系统能够学习用户的兴趣、爱好和特性,“主动”帮助用户完成信息服务任务,既方便了用户,又节约了用户的时间和精力,是“主动服务”的电子商务,具有灵活性和适应性。反映了

13、当前及今后信息检索领域发展的趋势,是电子商务在全球范围取得成功的必要因素,具有很强的理论价值和应用价值。2 系统介绍本文中,介绍了一个基于 Internet 的商品信息采集 Agent 系统。该系统是一个面向 Internet 的具有智能化的商品信息采集系统。http:/系统采用分布式智能体 Agent 技术,适用于 Internet 上文档的并行查询与检索,能满足用户货比三家的需求,采用相关反馈学习算法、用户与用户 Agent 以及用户Agent 与信息 Agent 的交互机制等技术,使得用户能够获得同一商品的不同价格信息。该系统具有以下的特点:实现浏览式检索与用户个性化检索的有机结合;快速

14、自适应用户兴趣的变化和环境的变化;智能化检索用户感兴趣的 Web 文档;自动过滤不相关文档,提高检索精度和效率。21 系统功能说明数据流程 用户向 WEB Server 发出查询请求,经过 PHP 嵌入式程序的运行,调用相关的函数功能后,通过WEB Server 从 Internet 搜索引擎得到相关信息,经处理反馈给用户。本系统的功能有以下四种:211 站内食品检索 它可分为以下两种:1)模糊搜索 用户可通过在食品信息搜索栏框中输入要搜索食品的大致类别或商品品牌,即可查询到所有有关的食品列表。2)高级搜索 用户可通过选择要搜索食品的类别以及输入食品的具体名称,价格范围来进行查询。212 食品

15、浏览 它分成三级:第一级是显示食品大类;第二级显示该大类中的所有食品列表;第三级显示用户所选择的食品的图片和名称、规格、价格。213 个人兴趣资料 它是本系统中最能突出个性化检索的功能。http:/用户可将自己感兴趣的食品记录加入个人兴趣库中。当用户下次搜索时,可从个人兴趣资料中直接得到,无需再去寻找。214 站外食品检索 用户登录后,可通过 Internet 上的搜索引擎查询到有关信息,并将其截取、重新过滤,以列表形式显示。同时系统将当前界面的记录插入站内信息总库中。22 网络信息流程图23 数据库及表单设计数据库主要分成以下五部分:231 本地数据库 它分成 3 级,共有 35 张表单。其

16、中总表为各个食品分类,如:粮油制品、休闲食品、保健食品、糕点饼干等。按照小类的划分,把各种食品归入各自的小类,食品信息分为商品编号、品牌编号、商品名称、价格(元)、规格、购物网址、URL 等 7 种信息。232 站外查询信息库 它为用户注册后进行网上搜索而设计的。用户搜索下来的信息自动存入该数据库,再返回到页面显示给用户。该数据库分成 2 张表单。一张为记录了各种食品分类的总表;另一张为记录用户在网上搜索出的各种信息的明细列表,有商品编号、商品名称、价格、规格等 4 种信息。233 电子字典库 为了系统的需要,根据本地数据库,建立了模糊查询库,当用户查询信息时,可输入该商品的类别或品牌名称,通过关键字查找到该商品的前几位编号,再通过编号查询到该商品的分类,最后查找到该以关键字为品牌的商品信息。234 用户信息库 它是为用户注册而设计的,其

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号