基于web的多媒体移动搜索引擎的设计与实现

上传人:E**** 文档编号:117999171 上传时间:2019-12-11 格式:PDF 页数:61 大小:1.98MB
返回 下载 相关 举报
基于web的多媒体移动搜索引擎的设计与实现_第1页
第1页 / 共61页
基于web的多媒体移动搜索引擎的设计与实现_第2页
第2页 / 共61页
基于web的多媒体移动搜索引擎的设计与实现_第3页
第3页 / 共61页
基于web的多媒体移动搜索引擎的设计与实现_第4页
第4页 / 共61页
基于web的多媒体移动搜索引擎的设计与实现_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《基于web的多媒体移动搜索引擎的设计与实现》由会员分享,可在线阅读,更多相关《基于web的多媒体移动搜索引擎的设计与实现(61页珍藏版)》请在金锄头文库上搜索。

1、摘要 论文题 目: 指导老师: 基干W e b 的多媒体移动搜索引堆的设计与实现 计算机系统结构 赵 卓签 名 : 1 0 1 - 一一 黄 樟 钦签 名:钱 A ( A ) 摘要 随着 I n t e r n e t 技术的普及和应用,从 We b上获取信息,以及 多媒体信息,已经成为信息社会的一个发展趋势。而实现这一目 标的关键就是搜索引擎技术。目前搜索引擎技术己经获得了巨大 的成功和广泛的引用,但是对于多媒体信息的搜索还停留在一个 较低的水平上,也还没有出现性能令人满意的商用产品。 本文通过对多媒体搜索技术的研究和分析,提出了多媒体搜 索引擎的数学模型和逻辑结构,在这一模型下用户可以实现

2、对多 媒体信息的搜索。本文首先给出了实现这一模型的系统结构,并 分三个部分阐述了这一系统设计中所解决的若干关键问题:移动 搜索、多媒体语义信息的通用描述以及多媒体信息的获得、表示 和匹配。本文尤其对多媒体语义信息的通用描述进行了深入的研 究,提出了基于 X ML 的多媒体语义标记语言一一MC ML ( M u l t i m e d i a C o n t e x t M a r k u p L a n g u a g e ) , 同时本文对多媒体信息 的表示和匹配模型也进行了深入的研究,并结合 MC ML ,运用语 义信息完整的提出了基于语义方式的多媒体搜索技术。随后,本 文给出了多媒体搜索

3、引擎系统的反馈模块和设置模块的设计,并 给出了基于这一系统设计方案的一个原型系统 L e o n的实现。 在本 文的最后,对所做的工作进行了总结护并提出了对进一步工作的 构想 。 【 关键字】多媒体搜索: 搜索引擎:语义信息;移动A g e n t ; XML, 【 论文类型】应用基础 人b s t mc t T i t l e : R e s e a r c h a n d I mp l e me n t a t i o n o f a Mu l t i m e d i a S e a r c h E n g i n e Ma j o r : C o mp u t e r A r c h i

4、 t e c t u r e N a me : Z h a o Z h u o S i g n a t u r e S u p e r v i s o r : Hu a n g Z h a n g Qi n S i g n a t u r e W e b - b a s e d Abs t r a c t Wi t h t h e d e v e l o p m e n t o f I n t e r n e t , i t i s a t r e n d t o o b t a i n t h e i n f o r ma t i o n , i n c l u d i n g t h e

5、m u l t i me d i a i n f o r m a t i o n v i a I n t e r n e t . T h e k e y t e c h n o l o g y t o a c h i e v e t h i s a i m i s t h e s e a r c h t e c h n o l o g y . T h o u g h t h e s e a r c h e n g i n e h a s b e e n a g r e a t s u c c e s s , t h e s e a r c h f o r mu l t i me d i a i

6、 n f o r ma t i o n i s s t i l l o n a l o w - l e v e l a n d n e e d t o b e i mp r o v e d . B a s e d o n t h e a n a l y z i n g o f t h e g e n e r a l p r o c e s s o f s e a r c h e n g i n e , w e p u t f o r w a r d a m o r e u n i v e r s a l m o d e l a n d i t s l o g i c a l s t r u c

7、 t u r e . U s e r c a n g e t 、 a c c e s s t o m u l t i m e d i a u n d e r t h e m o d e l . T h i s p a p e r i s m a i n l y f o c u s e d o n t h r e e k e y t e c h n o l o g i e s o f m u l t i m e d i a s e a r c h , w h i c h a r e mo b i l e s e a r c h , i n f o r ma t i o n r e p r e s

8、 e n t a t i o n a n d i n f o r ma t i o n r e t r i e v a l . I t b r i n g s f o r w a r d s o m e n e w i d e a s i n m u l t i - a g e n t c o m m u n i c a t i o n a n d w e g i v e m u c h a t t e n t i o n t o s e t u p a s t a n d a r d o f d e s c r i b i n g i n f o r ma t i o n , a n d t

9、 h e n w e f i r s t l y p u t f o r w a r d t h e MC ML ( Mu l t i m e d i a C o n t e x t Ma r k u p L a n g u a g e ) b a s e d o n X ML . Wi t h t h e c o n t e x t p r o v i d e d b y MC ML , w e f i x o n t h e p a r a me t e r s i n VS M ( V e c t o r S p a c e Mo d e l ) a n d s o l v e t h

10、e p r o b l e m s o f i n f o r m a t i o n L e p r e s e n t a t i o n a n d i n f o r m a t i o n r e t r i e v a l . A p r o t o t y p e s y s t e m L e o n i s t h e n p r e s e n t e d a s a n i mp l e me n t a t i o n o f t h e mo d e l a n d t e c h n o l o g i e s . A t t h e e n d o f t h i

11、 s p a p e r , w e s u m ma r i z e t h e w h o l e w o r k a n d t h e p o s s i b i l i t y o f e x t e n d i n g t h e c u r r e n t s y s t e m f o r f u r t h e r a p p l i c a t i o n s i s e x a m i n e d . K e y w o r d s I M u l t 伽e d i a S e a r c h ; S e a r c h E n g i n e ; C o n t e x

12、 t ; X M L ; Mo b i l e Ag e n t T h e s i s T y p e A p p l i e d F u n d a m e n t a l 第一章 绪论 第一章 绪论 1 . 1 课题背景I I I 随着 I n t e r n e t 在世界范围内的迅猛发展,“ 计算”的方式己经 步入了 “ 以网络为中心”的 “ 计算”时代,同时人类社会也发生 了巨大的变化一一人们己经告别了信息缺乏的旧时代,进入了一 个崭新的信息社会。信息从数量上来讲已经不再是一种稀缺的资 源,相反无处不在、唾手可得的大量信息充斥着我们身边的整个 世界。信息爆炸,这一说法在某种程度上己

13、经成为了我们现实生 活的真实写照。 作为现在获取信息的一个主要的渠道, We b自 从 1 9 9 1 年出现 以来,经过迅速的发展,己经成为了一个巨大的全球化信息空间。 最新的统计数据表明,在 1 9 9 2年2月,We b上大约有 2 , 8 0 0 , 0 0 0 台服务器,存储了 8 0 0 , 0 0 0 , 0 0 0个页面,信息量高达 1 5 T B。在中 国,I n t e r n e t的发展也十分迅速 。根据 中国互联网络信息中心 ( C N NI C)的最新调查结果显示,截止到 2 0 0 1 年 1 2月 3 1日,我 国上网计算机数约 1 2 5 4万台;我国上网用户

14、人数约 3 3 7 0万人; 除计算机外同时使用其它设备 ( 移动终端、信息家电)上网的用 户人数为 1 1 8万。C N下注册的域名数约 1 2 7 3 1 9 . WWW 站点数 ( 包括 C N, . C O M, .N E T . . O R G下的网站):约 2 7 7 1 0 0个。我 国国际出口带宽的总量为:7 5 9 7 . 5 M. 因此,对这些信息的有效访问始终是一个重要的问题。1 9 9 4 年初,第一代真正基于 We b的搜索引擎诞生。到 1 9 9 5年,商业 化的搜索引擎开始大规模开发,其第一代产品的代表厂商包括 Y a h o o . E x c i t e .

15、I n f o S e e k . A I t a V i s t a等。这些搜索引擎给用户提 供了一个可以现实有效地访问We b上大量信息的途径。 但是目前仍然存在着一些技术瓶颈, 妨碍了I n t e r n e t 技术的进 一步发展。典型的问题之一就是,面对这浩如烟海的大量信息, 反而使我们时常无所适从。用户会发现试图通过浏览 We b来发现 信息已经变得越来越困难,往往费时很多却所获甚少。究其原因, 首先,I n t e r n e t 上信息资源呈几何级数增长,导致了 “ 信息过载” 和 “ 资源迷 向”两个问题 的出现 。 “ 信息过载”是指用户从网上 西安交通大学硕 卜 学位论

16、文 下载的信息过多、难以消化。而 “ 资源迷向”则是指网上信息过 多,用户难以寻求所需的信息,这些问题都已成为提高 I n t e r n e t 信它 、 服务质量的瓶颈。其次,现在 We b己经成为了一个复杂而独 特的多媒体信息来源。大量的数字化的文本、音频、图像、视频 相互连接组成了整个互联网。仅以图像而论,据估计在 1 9 9 9年的 时候,在互联网上有 1 8 0 , 0 0 0 , 0 0 0幅公开的图像可以被检索到,图 像数据总量约 3 T B ( L a w r e n c e 定义 1 . A w e b r o b o t i s a p r o g r a m t h a t t r a v e r s e s t h e We b s h y p e r t e x t s t r u c t u r e b y r e t r i e v i n g a d o c u me n t , a n d r e c u r s i v e l y r e t r i e v i n g a l l d o c u me n t

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号