HTTP协议的头详解

上传人:pu****.1 文档编号:513645088 上传时间:2022-09-06 格式:DOCX 页数:16 大小:41.87KB
返回 下载 相关 举报
HTTP协议的头详解_第1页
第1页 / 共16页
HTTP协议的头详解_第2页
第2页 / 共16页
HTTP协议的头详解_第3页
第3页 / 共16页
HTTP协议的头详解_第4页
第4页 / 共16页
HTTP协议的头详解_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《HTTP协议的头详解》由会员分享,可在线阅读,更多相关《HTTP协议的头详解(16页珍藏版)》请在金锄头文库上搜索。

1、HTTP协议的头信息详解.txtlO有了执著,生命旅程上的寂寞可以铺成一片蓝天;有了执著, 孤单可以演绎成一排鸿雁;有了执著,欢乐可以绽放成满圆的鲜花。HTTP 协议的头信息详解在数据挖崛方面有时候会经常分析网页内容,这时候就需要对 HTTP 协议有一定的了解,下边 摘录了网上关于这方面的介绍HTTP (HyperTextTransferProtocol)是超文本传输协议的缩写,它用于传送WWW方式的数据, 关于HTTP协议的详细内容请参 考RFC2616。HTTP协议采用了请求/响应模型。客户端向服 务器发送一个请求,请求头包含请求的方法、URI、协议版本、以及包含请求修饰符、客户信 息和内

2、容的类似于MIME的消息结构。服务器以一个状态行作为响应,相应的内容包括消息协 议的版本,成功或者错误编码加上包含服务器信息、实体元信息以 及可能的实体内容。通常HTTP消息包括客户机向服务器的请求消息和服务器向客户机的响应消息。这两种类型的 消息由一个起始行,一个或者多个头域,一个只是头域结束的空行和可 选的消息体组成oHTTP 的头域包括通用头,请求头,响应头和实体头四个部分。每个头域由一个域名,冒号(:)和 域值三部分组成。域名是大小写无关的,域 值前可以添加任何数量的空格符,头域可以被扩 展为多行,在每行开始处,使用至少一个空格或制表符。通用头域通用头 域包含请求和响应消息都支持的头域

3、,通用头域包含 Cache-Control、 Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via。对通用头域的扩展要求通 讯双方都支持此扩 展,如果存在不支持的通用头域,一般将会作为实体头域处理。下面简单 介绍几个在UPnP消息中使用的通用头域。Cache-Control 头域Cache -Control 指定请求和响应遵循的缓存机制。在请求消息或响应消息中设置 Cache-Control 并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令包括 no-cache no-s to re、max-age max-s tale、min

4、-fresh、only-if-cached,响应消息中的 指令包括 public、 private、 no-cache、 no- store、 no-transform、 must-revalidate、 proxy-revalidate、max-age。各个消息中的指令含义如 下:Public 指示响应可被任何缓存区缓存。Private 指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务 器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效。no-cache 指示请求或响应消息不能缓存no-store 用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和

5、响应消息 都不使用缓存。max-age 指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。 min-fresh 指示客户机可以接收响应时间小于当前时间加上指定时间的响应。max-stale 指示客户机可以接收超出超时期间的响应消息。如果指定 max-stale 消息的 值,那么客户机可以接收超出超时期指定值之内的响应消息。Date 头域Date 头域表示消 息发送的时间,时间 的描述格式由 rfc822 定义。 例如, Date:Mon,31Dec200104:25:57GMT。Date描述的时间表示世界标准时,换算成本地时间,需 要知道用户所在的时区。Pragma 头域Pragma

6、头域用来包含实现特定的指令,最常用的是Pragma:no-cache。在HTTP/1.1协议 中,它的含义和 Cache- Control:no-cache 相同。请求消息请求消息的第一行为下面的格式:MethodSPRequest-URISPHTTP-VersionCRLFMethod 表示对于 Request-URI 完成的方法, 这个字段是大小写敏感的,包括OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE。方法 GET和HEAD应该被所有的通用WEB服务器支持,其他所有方法的实现是可选的。GET方法取 回由Request-URI标识的信息。HEAD方法也是取回

7、由Request-URI标识的信息,只是可以 在响应时,不返回消息体。 POST 方法可以请求服务器接收包含在请求中的实体信息,可 以 用于提交表单,向新闻组、BBS、邮件群组和数据库发送消息。SP表示空格。Request-URI遵循URI格式,在此字段为星 号(*)时,说明请求并不用 于某个特定的资源地址,而是用于服务器本身。HTTP-Version表示支持的HTTP版本,例如 为HTTP/1.1。CRLF表示换行回车符。请求头域允许客户端向服务器传递关于请求或者关于客 户机的附加 信息。请求头域可能包含下列字段 Accept、 Accept-Charset、 Accept- Encodin

8、g、 Accept-Language 、 Authorization、 From、 Host、 If-Modified-Since、 If- Match、 If-None-Match 、 If-Range 、 If-Range 、 If-Unmodified-Since 、 Max-Forwards 、 Proxy-Authorization、Range、Referer、User-Agent。对请求头域的扩展要求通讯双方都支 持,如果存在不支持的请 求头域,一般将会作为实体头域处理。典型的请求消息:GET http:/download.microtool.de:80/somedata.exeH

9、ost: download.microtool.deAccept:*/*Pragma: no-cacheCache-Control: no-cacheReferer: http:/download.microtool.de/User-Agent:Mozilla/4.04en(Win95;I;Nav)Range:bytes=554554-上例第一行表示 HTTP 客户端(可能是浏览器、下载程序)通过 GET 方法获得指定 URL 下的文件。棕色的部分表示请求头域的信息,绿色的部分表示通用头部分。Host 头域Host 头域指定请求资源的 Intenet 主机和端口号,必须表示请求 url 的原始

10、服务器或网 关的位置。HTTP/1.1请求必须包含主机头域,否则系统会以400状态码返回。Referer 头域Referer 头域允许客户端指定请求 uri 的源资源地址,这可以允许服务器生成回退链表, 可用来登陆、优化cache等。他也允许废除的或错误的连接由于维护的目的被 追踪。如果请 求的 uri 没有自己的 uri 地址, Referer 不能被发送。如果指定的是部分 uri 地址,则此地 址应该是一个相对地址。Range 头域Range 头域可以请求实体的一个或者多个子范围。例如,表示头500个字节:bytes=0-499表示第二个 500 字节: bytes=500-999 表示最

11、后 500 个字节: bytes=-500 表示 500 字节以后的范围: bytes=500- 第一个和最后一个字节: bytes=0-0,-1 同时指定几个范围: bytes=500-600,601-999 但是服务器可以忽略此请求头,如果无条件GET包含Range请求头,响应会以状态码206 (PartialContent)返回而不是以 200(OK)。User-Agent 头域User-Agent 头域的内容包含发出请求的用户信息。响应消息响应消息的第一行为下面的格式:HTTP-VersionSPStatus-CodeSPReason-PhraseCRLFHTTP -Version表示

12、支持的HTTP版本,例如为HTTP/1.1。Stat us- Code是一个三个数 字的结果代码。 Reason-Phrase 给 Status-Code 提供一个简单的文本描述。 Status-Code 主要 用于机器自 动识别, Reason-Phrase 主要用于帮助用户理解。 Status-Code 的第一个数字定 义响应的类别,后两个数字没有分类的作用。第一个数字可 能取5个不同的值:lxx:信息响应类,表示接收到请求并且继续处理2xx: 处理成功响应类,表示动作被成功接收、理解和接受3xx:重定向响应类,为了完成指定的动作,必须接受进一步处理4xx: 客户端错误,客户请求包含语法错

13、误或者是不能正确执行5xx:服务端错误,服务器不能正确执行一个正确的请求 响应头域允许服务器传递不能放在状态行的附加信息,这些域主要描述服务器的信息和 Request-URI 进一步的信息。响应头域包含 Age、Location、Proxy-Authenticate、Public、 Retry-After、Server、Vary、Warning、WWW-Authenticate。对响应头域的扩展要求通讯双 方都支持,如果存在不支持的响应头 域,一般将会作为实体头域处理。典型的响应消息:HTTP/1.0200OKDate:Mon,31Dec200104:25:57GMTServer:Apache

14、/1.3.14(Unix)Content-type:text/htmlLast-modified:Tue,17Apr200106:46:28GMTEtag:a030f020ac7c01:1e9fContent-length:39725426Content-range:bytes554554-40279979/40279980上例第一行表示HTTP服务端响应一个GET方法。棕色的部分表示响应头域的信息,绿色 的部分表示通用头部分,红色的部分表示实体头域的信息。Location 响应头Location响应头用于重定向接收者到一个新URI地址。Server 响应头Server 响应头包含处理请求的原

15、始服务器的软件信息。此域能包含多个产品标识和注 释,产品标识一般按照重要性排序。实体请求消息和响应消息都可以包含实体信息,实体信息一般由实体头域和实体组成。实体头域包含关于实体的原信息,实体头包括Allow、Content- Base 、Content-Encoding、Content-Language、 Content-Length、Content-Location、Content-MD5、Content-Range、 ContentType、 Etag、 Expires、 Last-Modified、 extensionheader。 extensionheader 允许客户端定义新的实体

16、 头,但是这些域可能无法未接受方识别。实体可以是一个经过编码 的字节流 ,它 的编 码方 式由 ContentEncoding 或 ContentType 定 义, 它的 长度 由 ContentLength 或 ContentRange 定义。ContentType 实体头ContentType 实体头用于向接收方指示实体的介质类型,指定 HEAD 方法送到接收方的 实体介质类型,或 GET 方法发送的请求介质类型 ContentRange 实体头ContentRange 实体头用于指定整个实体中的一部分的插入位置,他也指示了整个实体 的长度。在服务器向客户返回一个部分响应,它必须描述响应覆盖的范围和整个实体长度。 一般格式:ContentRange

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号