HTTP 协议的头信息详解.txt10 有了执著,生命旅程上的寂寞可以铺成一片蓝天;有了执著,孤单可以演绎成一排鸿雁;有了执著,欢乐可以绽放成满圆的鲜花。 HTTP 协议的头信息详解 在数据挖崛方面有时候会经常分析网页内容,这时候就需要对HTTP 协议有一定的了解,下边摘录了网上关于这方面的介绍 HTTP( HyperTextTransferProtocol)是超文本传输协议的缩写,它用于传送WWW 方式的数据,关于HTTP 协议的详细内容请参 考RFC2616。 HTTP 协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URI、 协议版本、以及包含请求修饰符、客户 信息和内容的类似于MIME 的消息结构。服务器以一个状态行作为响应,相应的内容包括消息协议的版本,成功或者错误编码加上包含服务器信息、实体元信息以 及可能的实体内容。 通常HTTP 消息包括客户机向服务器的请求消息和服务器向客户机的响应消息。这两种类型的消息由一个起始行,一个或者多个头域,一个只是头域结束的空行和可 选的消息体组成。HTTP的头域包括通用头,请求头,响应头和实体头四个部分。每个头域由一个域名,冒号(:)和域值三部分组成。域名是大小写无关的,域 值前可以添加任何数量的空格符,头域可以被扩展为多行,在每行开始处,使用至少一个空格或制表符。 通用头域 通 用头 域 包 含请求 和响应 消息都 支持的头域 ,通用 头域包 含Cache-Control、 Connection、 Date、 Pragma、 Transfer-Encoding、 Upgrade、 Via。对通用头域的扩展要求通讯双方都支持此扩 展,如果存在不支持的通用头域,一般将会作为实体头域处理。下面简单介绍几个在UPnP 消息中使用的通用头域。 Cache-Control 头域 Cache -Control 指定请 求和响应遵 循的缓 存机制 。在请求消 息或响 应消息 中设置 Cache-Control并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令包括no-cache、 no-store、 max-age、 max-stale、 min-fresh、 only-if-cached,响应消息中的指令包括public、 private、 no-cache、 no- store、 no-transform、 must-revalidate 、proxy-revalidate、 max-age。各个消息中的指令含义如 下: Public 指示响应可被任何缓存区缓存。 Private 指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效...