10.以物件群组分析网页代理伺服器之快取效能doc.doc

上传人:m**** 文档编号:557885006 上传时间:2024-02-23 格式:DOC 页数:14 大小:887.01KB
返回 下载 相关 举报
10.以物件群组分析网页代理伺服器之快取效能doc.doc_第1页
第1页 / 共14页
10.以物件群组分析网页代理伺服器之快取效能doc.doc_第2页
第2页 / 共14页
10.以物件群组分析网页代理伺服器之快取效能doc.doc_第3页
第3页 / 共14页
10.以物件群组分析网页代理伺服器之快取效能doc.doc_第4页
第4页 / 共14页
10.以物件群组分析网页代理伺服器之快取效能doc.doc_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《10.以物件群组分析网页代理伺服器之快取效能doc.doc》由会员分享,可在线阅读,更多相关《10.以物件群组分析网页代理伺服器之快取效能doc.doc(14页珍藏版)》请在金锄头文库上搜索。

1、以对象群组分析网页代理服务器之快取效能Analyzing the Cache Performance of Web Proxy Server with Object Groups段裘庆*杨键樵Chiu-Ching TuanChen-Chau Yang国立台北科技大学电子工程系*国立台湾科技大学电子工程系1摘要有鉴于网页代理服务器之快取效能对现行WWW之服务品质具有关键性的影响,所以本研究拟以 ”网页对象特征” 作观察面;以 ”网页对象群组” 为观察点,来分项评量系统的快取效能。作法上,对象特征概分为Http状态码、内容型式、数据量大小与下传时间等四个层面;而对象群组是依单项对象特征再作分群,以

2、约57个群组为主。再配合为网页群组所定义的三项评估因子,包括群组总存取比()、群组总命中比()与群组命中率基准差()等,以对校园代理服务器作快取效能分析,期望分析出影响本地快取效能的关键要素。由分析所得之统计资料,于实务上可望供区域网管人员作为案例参考藉以微调网内代理服务器的快取系统组态;另于理论上,则对致力于网页快取替换策略制定的研究人员可提供新的分析数据与思惟方向藉以研定更高效能的快取机制。关键词:网页代理服务器、快取效能、网页对象特征、替换换策。投稿受理时间:89年11月6日审查通过时间:89年12月3日ABSTRACTBased on the facts, the cache perf

3、ormance of web proxy server had critically impacted on the quality of service (QoS) of World Wide Web (WWW). In this paper, we will propose an analytical way to investigate the factors affecting the cache performance by analyzing the on-line access logs supported by NTUT. Four facets of web objects

4、including “Http code”, “content type”, “object size”, and “elapsed time” will be used for examining the cache performance. Moreover, in each facet, all cached objects would be partitioned into 5-7 groups for performing the analysis. In the analysis, we use three kinds of evaluation including “access

5、 percentage”, “hit percentage”, and “hit ratio difference” to explore the cache performance, and to find out the critical causes that affect the performance.Finally, we expect that the results of analysis could contribute in two folds. In practice, it could help the administrators of LAN to adapt th

6、e cache configuration of proxy server effectively. In theory, it could assist the researchers to study the cache mechanism and construct a novel and more efficient replacement policy.2Keywords:web proxy server,cache performance,web object property,replacement policy.壹、绪论全球信息网(World Wide Web, WWW)系由隶

7、属于欧洲核子研究委员会(CERN)的Tim Berners-Lee 在1989年所倡议,意图建置一个分布式超媒体系统可经由因特网存取散布在各地的研究资料。随后于1993年,Marc Andreessen和Eric Bina于美国国家超级计算应用中心(NCSA)开发出以鼠标点选超媒体文件的网页浏览器 NCSA Mosaic1,开启了WWW高速成长的新纪元。由于WWW简便易用的特性以及对超媒体文件的有效支持,这已使得因特网的使用人口数与连网的主机数每年均屡创新高且呈现急速地激增。根据研究统计,2000年1月全球连网的主机数约7240万部,而我国亦有约85万部的成长,就此趋势预料于新世纪2001年时

8、全球连网主机数目将超过一亿台。若往后人们对因特网仍旧如此地深度使用,这恐怕对人类生活型态的影响将更为深远。资策会于2000年8月底公告2指出我国因特网用户数已达557万户且普及率攀升上25%;若依用户类型区分,其中台湾学术网(TANet)之用户数高居第二位达174万并且维持约7%年成长率。于同年9月中旬,加拿大多伦多外电指出2台湾学生在校上网率达63%是高居16个调查国家中的第三位,仅次于瑞典、加拿大,但领先英、美两国;惟台湾学生在家里上网的比率则仅有45%略逊于他国。无论如何,诸多研究的统计数据均显示出因特网之使用早已是一股锐不可挡的新潮流将影响人类甚巨,而全球各国也都积极地规划因应之道。W

9、WW虽成功地促进了因特网的使用热潮,然而相较于使用人口的快速激增,现行实体网络基础建设的速度却远落后于使用者的需求,在网络频宽供需失衡之状况下更恶化网络的使用质量,分析其原因有如后几点,包括:(1) 网页内容逐渐地大量使用较高容量的多媒体对象。(2) 网页服务器端为了因应系统需要而引用自动的网页推播(push)机制。(3) 传统的商务系统大幅地整合并且改以网页平台提供全球性跨国服务,造就了电子商务(e-Commerce)的崛起。(4) 因特网服务供货商(ISP)竞相设立更加吸纳大量新兴的网络使用人口。相对于网络使用质量的低弱,为了改善以及增进因特网质量也有几个相关的研究议题,例如:(1) 因特

10、网基础建设:建置宽带网络与研发更高速的网络传输技术,例如电缆数据传输(cable modem)和异步数字用户专线(ADSL)。(2) 网络协议:改善现有的协议或者设计更具效率的新网络协议。(3) 数据压缩技术:设计压缩效率更佳的与压缩率更大的编码技术,则高容量的多媒体对象经过压缩后再作网络传输时,可大幅地降减网络频宽的使用。(4) 网页快取(cache)技术:网页的快取则是利用数据备份的概念来达到加速对象存取与节省频宽的目的。上述这几项研究议题中,又以网页快取技术在不须增加网络频宽的基础建设下,可以立即得到较大的效益并且也可以轻易地应用在现有的网络环境中。因此目前大部分的网页浏览都透过快取系统

11、来加快存取速度并减少对远程服务器作重复的对象要求,以期使有限的网络频宽作更有效的运用。但是在众多客户端于浏览网页过程中,快取系统很难以预知其所属的客户端群于未来之存取所需;也不易去评估一个网页对象继续保留于快取中的使用价值。因此,我们将以实际的网页存取日志文件(access log)作为案例来探究现行代理服务器(proxy server)的快取效能,其评量方式是以预选的四项网页对象特征来分项分析可能影响本地快取效能的关键要素。可望由分析所得之结论,有助于网管人员改善代理服务器的系统组态与快取效能;此外,也有利于研究人员研制更高效能的网页快取替换机制。本文之章节架构如后,包括第2节讨论阶层式网页

12、快取系统;第3节分项分析与探讨代理服务器的快取效能;最后一节,第4节作扼要的结论。贰、阶层式网页快取系统于全球信息网上使用快取系统可以有效提升网页浏览的服务质量,快取系统对内而言可加快网页下载的速度;对外而言可减少对相同的网页对象作重复性要求,藉以舒缓远程服务器的工作负荷;并且可降低对网络频宽的使用,以提高WWW总体的运作效能来满足客户端的需求。以下分节说明WWW快取运作方式与TANet架构范例。一、阶层式快取系统之运作现行WWW所用的快取系统概分为两类:(1) 浏览器快取:系透过客户端的网页浏览器,例如Microsoft IE与Netscape Communicator,以预设的硬盘空间来执

13、行网页快取的功能。(2) 网页代理服务器快取:一般是设置于局域网络内,此类型的系统软件中较著名的有CERN HTTP Daemon3、Squid4、Microsoft Proxy Server5以及Netscape Proxy Server6等。圖一、網頁代理伺服器之快取運作模式WWW快取系统的基本架构如图一所示,当网页代理服务器收到由客户端浏览器所发出的网页请求(Http request)时,它会先检查该网页数据是否存在于快取硬盘中,若是快取命中(hit)则直接地取出该数据并传回给浏览器;反之,若为快取误失(miss)则再转向远程网页服务器或更上层的代理服务器发出网页请求并等候数据回传。当代

14、理服务器收到由上层所响应的网页数据后,除了将数据再回传给浏览器之外,并且将复制一份副本存入快取系统中,以等待随后若再度被取用时能直 接命中而快速的响应给客户端。至于网页快取替换(replacement)策略的研究,目前大致可归纳为三类:(1) 沿用较传统的策略,例如LRU、LFU与FIFO等。(2) 依多关键特征次序作比较,例如LOG2-SIZE和HYPER-G7等。(3) 以制定的计算公式作为计量基础,例如LNC-R-W38,9、LRFU10、LUV11与二阶灰关联度法14等。惟现行的代理服务器系统例如Squid Proxy,其所用之替换策略仍大多以LRU为主,原因在于LRU演算程序较为简易

15、,但是快取效能的表现通常并不特别彰显。再者,于WWW上所快取的各类型网页对象,其档案平均大小的相差级距甚大(由MB至KB);且个别的网页对象网址(URL)原始所在的服务器端也散布全球五大洲,故网页对象下传所需要的等待时间就存在更大的差距。这常使得不耐久候的客户端会经常中断请求服务,而更加恶化网络的壅塞与浪费网络频宽的使用。因此,一效率佳的网页快取技术可以实质地减少网页对象在网络上的重复传输,并且可圖二、台北科技大學(NTUT)校園代理伺服器之階層架構圖加速客户端存取网页数据。所以,有关于高效能网页快取或预取技术的研制17,目前而言仍是具有高度的研发价值。二、校园代理服务器之阶层架构图二所示为台湾学术网TANet校园网络之范例架构,其中的台北科大NTUT校园局域网络以一条T3(45Mbps)连接至隶属教育部的TANet;而TANet再经由一条与中央研究院(SINICA)和国家高速计算机中心所共享的T3专线跨海连接至美国。同时,于NTUT校网内是以单部的本地代理服务器proxy.cc.ntut.edu.tw(140.124.10.1)全权专责快取国内、外网域所属的网页物件。此外,快取系统组态中尚可设定的协同快取代理服务器包括如下两型: (1) 兄弟(sibling)协同快取:其运作模式,通常是先以 ”快取摘录”(caching digest)方式来推测拟作转向存取的网页对象

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号