简介
  网络上已经有不少介绍HTTP的的好文章。对HTTP的一些细节介绍的比较好,所以本篇文章不会对HTTP的细节进行深究,而是从够高和更结构化的角度将HTTP协议的元素进行分类讲解。
  HTTP的定义和历史
  在一个网络中。传输数据需要面临三个问题:
  1.客户端如何知道所求内容的位置?
  2.当客户端知道所求内容的位置后,如何获取所求内容?
  3.所求内容以何种形式组织以便被客户端所识别?
  对于WEB来说,回答上面三种问题分别采用三种不同的技术,分别为:统一资源定位符(URIs),超文本传输协议(HTTP)和超文本标记语言(HTML)。对于大多数WEB开发人员来说URI和HTML都是非常的熟悉。而HTTP协议在很多WEB技术中都被封装的过多使得HTTP反而不被熟悉。
  HTTP作为一种传输协议,也是像HTML一样随着时间不断演进的,目前流行的HTTP1.1是HTTP协议的第三个版本。
  HTTP 0.9
  HTTP 0.9作为HTTP协议的第一个版本。是非常弱的。请求(Request)只有一行,比如:
  GET www.cnblogs.com
  从如此简单的请求体,没有POST方法,没有HTTP头可以看出,那个时代的HTTP客户端只能接收一种类型:纯文本。并且,如果得不到所求的信息,也没有404 500等错误出现。
  虽然HTTP 0.9看起来如此弱,但已经能满足那个时代的需求了。
  HTTP 1.0
  随着1996年后,WEB程序的需求,HTTP 0.9已经不能满足需求。HTTP1.0大的改变是引入了POST方法,使得客户端通过HTML表单向服务器发送数据成为可能,这也是WEB应用程序的一个基础。另一个巨大的改变是引入了HTTP头,使得HTTP不仅能返回错误代码,并且HTTP协议所传输的内容不于纯文本,还可以是图片,动画等一系列格式。
  除此之外,还允许保持连接,既一次TCP连接后,可以多次通信,虽然HTTP1.0默认是传输一次数据后关闭。
  HTTP 1.1
  2000年5月,HTTP1.1确立。HTTP1.1并不像HTTP1.0对于HTTP0.9那样的革命性。但是也有很多增强。
  首先,增加了Host头,比如访问我的博客:
  GET/Careyson HTTP/1.1
  Host:www.cnblogs.com
  Get后面仅仅需要相对路径即可。这看起来虽然仅仅类似语法糖的感觉,但实际上,这个提升使得在Web上的一台主机可以存在多个域。否则多个域名指向同一个IP会产生混淆。
  此外,还引入了Range头,使得客户端通过HTTP下载时只下载内容的一部分,这使得多线程下载也成为可能。
  还有值得一提的是HTTP1.1默认连接是一直保持的,这个概念我会在下文中具体阐述。
  HTTP的网络层次
  在Internet中所有的传输都是通过TCP/IP进行的。HTTP协议作为TCP/IP模型中应用层的协议也不例外。HTTP在网络中的层次如图1所示。


  图1.HTTP在TCP/IP中的层次

  可以看出,HTTP是基于传输层的TCP协议,而TCP是一个端到端的面向连接的协议。所谓的端到端可以理解为进程到进程之间的通信。所以HTTP在开始传输之前,首先需要建立TCP连接,而TCP连接的过程需要所谓的“三次握手”。概念如图2所示。


  图2.TCP连接的三次握手

  在TCP三次握手之后,建立了TCP连接,此时HTTP可以进行传输了。一个重要的概念是面向连接,既HTTP在传输完成之间并不断开TCP连接。在HTTP1.1中(通过Connection头设置)这是默认行为。所谓的HTTP传输完成我们通过一个具体的例子来看。
  比如访问我的博客,使用Fiddler来截取对应的请求和响应。如图3所示。


  图3.用fiddler抓取请求和相应
 

  可以看出,虽然仅仅访问了我的博客,但锁获取的不仅仅是一个HTML而已,而是浏览器对HTML解析的过程中,如果发现需要获取的内容,会再次发起HTTP请求去服务器获取,比如图2中的那个common2.css。这上面19个HTTP请求,只依靠一个TCP连接够了,这是所谓的持久连接。也是所谓的一次HTTP请求完成。
  HTTP请求(HTTP Request)
  所谓的HTTP请求,也是Web客户端向Web服务器发送信息,这个信息由如下三部分组成:
  1.请求行
  2.HTTP头
  3.内容
  一个典型的请求行比如:
  GET www.cnblogs.com HTTP/1.1
  请求行写法是固定的,由三部分组成,第一部分是请求方法,第二部分是请求网址,第三部分是HTTP版本。
  第二部分HTTP头在HTTP请求可以是3种HTTP头:1.请求头(request header)2.普通头(general header)3.实体头(entity header)
  通常来说,由于Get请求往往不包含内容实体,因此也不会有实体头。
  第三部分内容只在POST请求中存在,因为GET请求并不包含任何实体。
  我们截取一个具体的Post请求来看这三部分,我在一个普通的aspx页面放一个BUTTON,当提交后会产生一个Post请求,如图4所示。


  图4.HTTP请求由三部分组成

  HTTP请求方法
  虽然我们所常见的只有Get和Post方法,但实际上HTTP请求方法还有很多,比如:PUT方法,DELETE方法,HEAD方法,CONNECT方法,TRACE方法。这里我不细说了,自行Bing。
  这里重点说一下Get和Post方法,网上关于Get和Post的区别满天飞。但很多没有说到点子上。Get和Post大的区别是Post有上面所说的第三部分:内容。而Get不存在这个内容。因此像Get和Post其名称所示那样,Get用于从服务器上取内容,虽然可以通过QueryString向服务器发信息,但这违背了Get的本意,QueryString中的信息在HTTP看来仅仅是获取所取得内容的一个参数而已。而Post是由客户端向服务器端发送内容的方式。因此具有请求的第三部分:内容。