一种Deep Web数据集成系统预取策略的研究

上传人:人*** 文档编号:431411685 上传时间:2023-04-28 格式:DOCX 页数:61 大小:156.96KB
返回 下载 相关 举报
一种Deep Web数据集成系统预取策略的研究_第1页
第1页 / 共61页
一种Deep Web数据集成系统预取策略的研究_第2页
第2页 / 共61页
一种Deep Web数据集成系统预取策略的研究_第3页
第3页 / 共61页
一种Deep Web数据集成系统预取策略的研究_第4页
第4页 / 共61页
一种Deep Web数据集成系统预取策略的研究_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《一种Deep Web数据集成系统预取策略的研究》由会员分享,可在线阅读,更多相关《一种Deep Web数据集成系统预取策略的研究(61页珍藏版)》请在金锄头文库上搜索。

1、哈尔滨工程大学研究生学位论文一种Deep Web数据集成系统预取方略的研究姓名:阴丽莹申请学位级别:研究生专业:计算机技术指引教师:王念滨0312一种DeepWeb数据集成系统预取方略的研究摘要随着Web有关技术的日益成熟和Deep Web所蕴含信息量的迅速增长,通过W曲 数据库访问徐徐成为人们获取信息的重要手段,因此对于Deep W曲的研究也越来越受 到人们的关注。本文的研究目的是提出一种基于Deep Web数据集成环境下的预取方略, 将预取技术应用到Deep wreb数据的访I-J过程中,使顾客在获得更专业更高质量的数据 的同步,减少网络延迟导致的不利影响,提高顾客的查询响应速度。预取技术

2、是一种积极式的Cache技术,缓存的内容既可以是客户访问过的内容,也 可以是客户从未访问过的内容。预取运用的是顾客访问Web内容的空闲时间,把顾客 不久将要使用的Web对象提前取回,并寄存到Web缓存中。由于预取对象的传播运用 的是系统的空闲时间,使Web数据的传播和顾客的浏览与思考时间可以平行进行。Web 预取改善的是使用者所感觉到的延迟时间。Web顾客访问的时间局部性和空间局部性的 客观存在,为预取技术的研究提供的直接根据。语义缓存技术是数据库优化措施之一,它是将查询成果和有关语义信息缓存,运用 顾客查询的语义局部性来重用缓存数据。本文将预取技术与语义缓存技术相结合,提出了一种合用于Dee

3、p Web数据集成系统下的预取方略。根据Web数据库的访问特点,一方面对基于Deep Web数据集成系统下 的语义缓存项及查询匹配类型进行定义,对顾客提出的查询祈求都生成一种与其相相应 的语义缓存项,根据不同的查询匹配类型对每一种语义缓存项进行访问概率记录,通过 多项式回归模型对每条语义缓存项的下一种周期的访问概率进行预测,按照预取队列的 生成条件获得需要预取的语义缓存项,在每一种新的访问周期到来时进行预取,将顾客 感爱好的数据提前保存到缓存中供顾客查询使用。针对缓存空间有限及缓存内容需要保 持一致性的规定,提出了合用于Deep Web数据集成系统下缓存替代方略及缓存一致性 方略。实验表白,在

4、Deep Web数据集成系统中加入预取模型,可以大大减少顾客的查 询响应时间,同步预取精确率和网络流量随着缓存数量的增长而提高,当缓存数量达到 某一值后,预取精确率反而减少,因此在对缓存数量进行选择时,要综合考虑查询响应 时间、预取精确率和网络流量增长率三者之间的关系,避免网络流量的增长对网络性能 的影响。核心ii-J:Deep Web;预取;语义缓存;多项式回归;一种Deep Web数据集成系统预取方略的研究AbstractWith the graduate maturity of Web techniques and the fast increase of Deep Webs conta

5、ining data,Web database is turning into the main way for people to obtain information As a result,the study on Deep Web is attracting more and more attention todayThis paper aims at posting a prefetch strategy based on Deep Web integrated environmentWith prefetch technique applied into the accessing

6、 course of Deep Web data,users would get not only higher quality information but also faster response since the bad influence of network delaycould be reducedPrefetch technique is a kind of proactive Cache technique,the cached information contains not only the visited information but also those unvi

7、sitedWith prefetch technique,thedata which users ale going to visit would be extracted in advance and stored into the web cache when users ale visiting the present contentSince the transmission of prefetch data takes the spare time of system,it could be carried out when usePs are reading and thinkin

8、g The improvement which prefetch technique brings about is reducing the delay time userscould feelThe existence of time and place limitation for USerS visiting provides direct basisfor the study of prefetch techniqueMeaning caching technique is one of the optimization methods for data base,making up

9、 for the deficiency that tuple caching and page caching can not sufficiently support relational database。As a result,it is of plenty study valueWith Meaning caching technique,the searching result and relative meaning would be cached,which would provide answers to thefuture searchThis technique reuse

10、s cached data based on the meaning locality,namely thecorrelation of searched resultsWith the combination of prefetcthing technique and semantic caching,this paper posts a prefetching strategy which is appropriate for Deep Web data integration systemAccording to the access features of Web database,f

11、irstly,properly define semantic cached items and their matching types which based on the Deep Web;then,corresponding semantic cached itemsare generated for queries putting forward by usersAt the same time the access frequency ofeach semantic item is calculated according to different required matchin

12、g types and through polynomial regression model,the visit possibility of each semantic items next pedod is predictedThose semantic items to be prefetched ale obtained under the forming condition of prefetching queueTherefore,on every new visit cycle,usersinterested data will be stored in the cache i

13、n advance for further searching useExperimental results show that adding哈尔滨下程大学硕十学何论文prefetching mode to deep web data integration system will largely reduce the inquiry respond time of users,meanwhile,the prefetching accuracy and network flow will be improved along with the increase of cachesHoweve

14、r,when the number of caches reach to a certain extent, the prefetching accuracy will decline to the opposite,therefore,when selecting the right number of catches,we should comprehensively take every aspects into consideration to avoid influencing the performance of network causing by network traffic

15、Keywords:Deep Web;prefetch;semantic caching;polynomial regression第1章绪论第1章绪论11课题研究的背景及意义随着着互联网技术的飞速发展,网络上蕴含着丰富的信息呈爆炸式的增长。有调查显示-J,目前整个互联网上蕴含的信息量超过200,000 TB,并且还在迅速地增长。 由文本和超链接构成的网页是互联网对外发布信息的重要方式,它的特点是:数量巨大,信息量丰富;开发者不同,形式与内容差别很大;Web数据具有异质性且缺少构造性。一般将Web划分为Surface w曲和Deep Web两部分,这是按照整个Web上所蕴涵 的信息“深度”来划分的。Surface Web是指由超链接连接起来的静态页面集合,它可以通 过老式的搜索引擎索引到;Deep Web又叫隐蔽网络(Invisible Web)或者看不见的网(Hidden Web),是在1994年由DrJill Ellsworth提出来的,它是指老式的搜索引擎难以发 现的网络信息资源,一般觉得Deep Web重要涉及如下4个方面的内容:(1)不能被搜 索引擎搜索出来的没有超链接指向的页面;(2)需要注册后才可以访问的内容或是需要 满足限定的条件才可以访问的内容;(3)通过填写表单形成对后台在线数据库的查询而 得到的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号