个人web搜索服务系统的研究

上传人:E**** 文档编号:118244806 上传时间:2019-12-11 格式:PDF 页数:5 大小:286.69KB
返回 下载 相关 举报
个人web搜索服务系统的研究_第1页
第1页 / 共5页
个人web搜索服务系统的研究_第2页
第2页 / 共5页
个人web搜索服务系统的研究_第3页
第3页 / 共5页
个人web搜索服务系统的研究_第4页
第4页 / 共5页
个人web搜索服务系统的研究_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《个人web搜索服务系统的研究》由会员分享,可在线阅读,更多相关《个人web搜索服务系统的研究(5页珍藏版)》请在金锄头文库上搜索。

1、计算机科学2 0 0 4 V 0 1 3 1 N Q - 1 0 ( 增刊) 个人W e b 搜索服务系统的研究 R e s e a r c hO nt h eS y s t e mo fP e r s o n a lW e bS e a r c hS e r v i c e 李战胜杜亚军齐冬梅 ( 西华大学计算机与数理学院成都6 1 0 0 3 9 ) A b s t r a c tN O W ,W e bs e a r c he n g i n eb e c o m e san e wt e c h n i q u eo ft h ee x t e n s i v eu s a g eO

2、nI n t e r n e t I tm a k e sI n t e r n e t l i v i n g H o w e v e r 。s o m ep r o d u c t so fW e bs e a r c he n g i n eo f f e r e dac o n s i s t e n ts e r v i c ef o rt h ep e o p l e P e r s o n a lW e b S e a r c hS e r v i c e ( P W S S ) i san e wt e c h n i q u eo tW “i M o r n f l a l

3、i o nr e t r i e v a ls e r v i c e ,w h oh a ss o m ec h a r a c t e r i s t i c ss u c h a sd i v e r s l f i c a t i o n ,s p e c i a l i z a t i o n i n t e l l e c t u a l i z a t i o na n dD e r s o n a I i z a t i o n I tu s e ss o m ek e yt e c h n i q u e ss u c ha st a s k s e a r e h ,p e

4、 r s o n a l i 芑e dr a n ka n do n l i n ec l u s t e r i n g ,a n di n t e g r a t e sm e t as e a r c h , i t ht a s ts e a r c h S o ,i tw i l tk c o t r l et h e b e s tp l a t f o T mf o ri n d i v i d u a lo b t a i n i n gt h ei n f o r m a t i o na n dd a t a K e y w o r d sW e bs e a r c he

5、 n g i n e 。P e r s o t k a l w e bs e a r c hs e r v i c e 。T a s ks e a r c h 。P e r s o n a l 谊e dr a n k 0 n l i n ec l u s t e r i n g 1 介绍 W e b 搜索引擎是一种常见的w W w 资源搜索 技术,其基本思想是:首先通过爬行虫( C r a w l e r ) 将 W e b 文档下载到本地数据库;然后对其进行解析、 索引l 最后响应用户的查询请求,返回相关的文档链 接列表,并可视化显示。随着I n t e r n e t 的普及和信息 资源的

6、飞速膨胀,W e h 搜索引擎越来越受到网络用 户的青睐。它已经发展成为使用率仅次于E - m a i l 的 新一代网络技术,同时也给网络广告带来了新的动 力,是当今I n t e r R e t 盈利模式中的璀璨明珠。 自1 9 9 8 年G o o g l e 搜索引擎口3 的面世以来,w e b 搜索技术和产品得到了飞速发展,其市场情景看好, 估计达到上百亿美元o 。其它比较著名的W e b 搜索 有Y a h o o ! ,M S N ,A O L 0 v e r t u r e ,L y c o s 等,国内有 百度,慧聪等。搜索的范围从原来单纯的网页到现在 的图片、M P 3 、

7、新闻、商品等许多类型。搜索技术也 越来越智能化,如个性化搜索、主动式服务、语音搜 索、W e b 文档联机聚类等。搜索工具也越来越丰富, 有工具条和桌面工具等。而真正服务于个人的W e b 搜索引擎个人w e b 搜索服务( P e r s o n a lW e b S e a r c hS e r v i c e ) ,必将成为信息检索领域研究的热 点,商家视线的焦点。 1 1 个人W e b 搜索服务( P W S S ) 系统的特点 我们提出的个人w e b 搜索服务( P W S S ) 是一 种服务类型多样化和专业化、个性化、智能化的 w e b 信息检索服务技术。它具有不同于传统W

8、 e b 搜索引擎的特点: 服务多样化和专业化当前,传统搜索引擎服 务日趋于多样化,搜索的范围也很广;面向主题和领 域的专业化搜索,日益被人们所接受和青睐。P W S S 不仅提供传统搜索服务,而且还将强化用户定制的 任务式联机和脱机搜索( 我们将它们统称为任务搜 索T a s kS e a r c h ) 服务以及主动式服务,满足个性化 需求,成为个人获取外界信息和资源的最佳平台。 个性化P W S S 最基本的特征就是个性化。它 所服务的对象是某一个体,而传统的搜索引擎是面 向大众的、一致的服务。针对个人,就必须提供个性 化的服务,如不同对象即使查询的关键字相同,但由 于个人的兴趣、背景等

9、不同得到的搜索结果也应该 是不同的。我们通过收集用户行为日志,分析和提取 用户个性特征建立用户行为模型来提供个性化服 务。 智能化 智能化是P w S S 最具鲜明的特征, 简易性看来,颜色特征仍旧是一个非常高效且有发 展前景的方向。发展这种方法的关键在于,我们既要 保持颜色索引简便的特性。同时还要联合其它的特 征来提高图像检索的执行效率,为研制实用的多媒 体数据库提供有效算法。这些问题有待今后做进一 步的研究。 参考文献 1S w a i nMJ ,B a l l a r dDHC o l o ri n d e x i n g I n t e r n a t i o n a lJ o u r

10、 n a lo f C o m p u t e rV i l i o n ,1 9 9 1 ,7 ( I ) 1 1 3 2 2S t r i e k e rM ,D i m a iA C o l o ri n d e x i n gw i t hw e a ks p a t i a lc o n 1 2 4 a t t a i n t s c I S & T S p I PC O O f o nS t o r a g ea n dR e t r i e v a lf o rI m - a g ea n dV i d e oD a t a b a s e * I V V 0 1 2 6 7 0

11、 S a nJ o s e ,C A :1 9 9 6 2 9 4 0 3 章毓晋基于内容的视觉信息检索科学出版社,2 0 0 3 5 8 5 9 4S a b eN M i c h a e lS L e w AM a x i m u nL i k e l i h o n dI n v e s t i g a t i o n I n t oC o l o tI n d e x i n g L e i d e nI n s t i t u t eo fA d v a o c e dC o m p u t e rS c i - e n c e ,1 9 9 8 5R u iY ,H u a n g

12、TSR e l e v a n c eF e e d b a e k :Ap o w e rt o o lf o ri n t e r - a c t i v ec o n t e n t b a s e di m a g er e t r i e “I E E ET r a n s a c t i o n so nc l r - c u l t sa n ds y s t e m sf o rv i d e ot e c h n o l o g y ,1 9 9 8 8 ( 5 ) :6 4 4 6 5 5 6P a t e lNV S a t h ilS V i d e os h o td

13、 e t e c t i o na n dc h a r a c t e r i z a t i o nt o t r d e od a t a b a s ed a t a b a s e s P a t e r nR e c o g n i t i o n ,1 9 9 7 ,3 0 :5 8 3 5 9 2 个性化的服务需要智能地支持。要建立个性化用户 模型,就需要智能地收集用户行为日志,分析和提取 用户个性特征。为了达到短响应时间和好的服务质 量的要求,需要智能地选择搜索路径和筛选相关信 息。同样,对搜索结果的排序和聚类显示,需要智能 化支持和处理。 元搜索( M e t aS e a

14、 r c h ) 与任务搜索( T a s k S e a r c h ) 相结合元搜索通过整合不同的搜索引擎 产生的搜索结果,能较好地满足用户的需求o 。任务 搜索是指用户可以定制任务参数的个性化搜索技 术。元搜索与任务搜索相结合,将很好地满足用户多 方面的需求,提供更好的服务。 1 2P W S 8 系统的功能 P W S S 系统主要实现以下三大功能: 元搜索包括网页、文本文件、电子文档、书 籍、多媒体文件、软件和商品等搜索。主要通过各大 主流搜索引擎提供的W e bS e r v i c e s 取得服务资源。 任务搜索按照用户对搜索时间的不同要求, 我们将任务搜索分为联机任务搜索和脱

15、机任务搜 索。一般地,联机任务搜索指任务容量较小的在线搜 索服务,如论坛、新闻等实时搜索;脱机任务搜索指 搜索时间比较长且任务容量大的搜索服务,如由用 户定制的对某一网站、某一类型的文件进行大规模 的搜索。对于脱机任务搜索的结果我们透常采用 E m a i l 等的形式离线传递给用户。 任务搜索可以自定义搜索类型的参数,主要有 网站( 搜索结果局限于某个具体网站或整个I n t e r - n e t ) 、文件类型、关键字、是否下载、文件容量限制、 时间限制等。 主劝式服务我们根据用户行为模型,为用户 提供个性化的主动式服务。在得到用户的许可情况 下,通过E - m a i l 等形式定期地

16、提供用户感兴趣的网 络资源和信息。 我们努力把P W S S 设计成为个人获取信息和 资料的最佳平台,突出个性化和智能化特征,使之达 到搜索效果好、短响应时间和满足不同需求的目的。 2 关键技术 2 1 任务搜索 任务搜索( T a s kS e a r c h ) 系统主要由初始U R L 库、爬行虫( C r a w l e r ) 、过滤器( F i l t e r ) 等构成。当用 户提交搜索任务后,系统从初始U R L 库提取相关 U R L 作为C r a w l e r 的起点启动C r a w l e r 带着任务 进行联机或脱机搜索( 按用户对搜索时间的要求进 行选择) ;F i l t e r 对爬行结果进行过滤,并保存符合 任务要求的结果;当完成给定的搜索任务,即停止爬 行,返回搜索结果。 2 1 1初始u R L 库 初始U R L 库中的 u R L 是C r a w l e r 爬行的起点。能否快速地搜索

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号