从输入URL访问服务器,到获得相应的响应信息的全部过程

从输入URL访问服务器,到获得相应的响应信息的全部过程,第1张

不知道楼主想了解哪个过程,了解到什么程度,我提供两个部分吧(1)如果在URL中使用域名,以 www.qq.com 为例,DNS名称解析过程: 当客户端向DNS服务器发送请求,要求解析地址地址 www.qq.com 时,将执行如下步骤: 1.为了查询 www.qq.com 的IP地址,客户端发出请求并向所设置的DNS服务器发送递归查询。 2.若所设DNS服务器无法在其数据库中找到 www.qq.com 的匹配项,则向根目录域的权威DNS发送迭代查询。 3.若根目录域权威DNS服务器也找不到 www.qq.com 的匹配项,则以com域的权威DNS服务器的IP地址返回给1中的服务器。 4.1中的DNS服务器收到根目录域返回信息后,向com域的权威DNS服务器发送迭代查询。 5.若com域的权威DNS服务器也找不到 www.qq.com 的匹配项,则以web.com域的权威DNS服务器的IP地址返回给1中的服务器。 6.1中的DNS服务器收到com域返回信息后,向web.com域的权威DNS服务器发送迭代查询。 7.若web.com域的权威DNS服务器在其数据库中找到了 www.qq.com 的匹配项,则以 www.qq.com 的IP地址返回给1中的服务器。 8.1中的DNS服务器收到web.com域返回信息后,将 www.qq.com 的IP地址作为响应发送给客户端。(2)URL种类很多啊,我这里以最常用的HTTP协议为例吧 在http传输的过程中,被称为客户端的请求者向服务器请求一个文件。 最基本的过程是: 1 客户端连接一个主机; 2 服务器接收连接, 3 客户端请求一个文件, 4 服务器发送一个应答. 实例:在浏览器上敲入“ http://www.maketop.net/resource/rs_041112_02.php ”.浏览器将连接 www.maketop.net 然后发送: >>GET /resource/rs_041112_02.php Http1.1 >>Host: www.maketop.net >>Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, >>Accept-Language: en >>Accept-Encoding: gzip, deflate >>User-Agent: Mozilla/5.0 (WindowsUWindows NT 5.1rv:1.7.3) Gecko/20040913 Firefox/0.10 >>Connection: Keep-Alive 解释:浏览器请求页面“/resource/rs_041112_02.php”。并使用HTTP1.1协议。并告诉服务器你的浏览器是Firefox0.10。操作系统是Windows XP。 浏览器希望保持与 www.maketop.net 之间的连接,并请求获得多的文件,包括网页中的图片。翻译成语言上面是: >>用HTTP1.1协议获得 /resource/rs_041112_02.php >>访问的主机是: www.maketop.net >>接收的文件包括了: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, >>使用的语言是: en >>接收的编码方式(浏览器能够解释的)是: gzip, deflate >>用户的浏览器信息:Windows XP的操作系统 Firefox/0.10的浏览器

HTTP是Web协议集中的重要协议,它是从客户机/服务器模 型发展起来的。客户机/服务器是运行一对相互通信的程序,客户与服务器连接时,首先,向服务 器提出请求,服务器根据客户的请求,完成处理并给出响应。浏览器就是与Web服务器产生连接的客户端程序,它的端口为TCP的80端口,。浏览器与Web 服务器之间所遵循的协议就是HTTP。

HTTP的早期版本为HTTP/0.9,它适用于各种数据信息的简洁快速协议,但是其远不能满足日益发展各种应用的需要。 但HTTP/0.9作为HTTP协议具有典型的无状态性:每个事务都是独立进行处理的,当一个事务开始就在客户与服务器之间建立一个连接,当事务结束时就 释放这个连接。HTTP/0.9包含Simple-Request&Simple-Responsed的报文结构。但是客户无法使用内容协商,所 以服务器也无法返回实体的媒体类型。

1982年,Tim Berners-Lee提出了HTTP/1.0,在此后的不断丰富和发展中,HTTP/1.0成为最重要的面向事务的应用层协议。该协议对每一次请求/响 应,建立并拆除一次连接。其特点是简单、易于管理,所以它符合了大家的需要,得到了广泛的应用。其缺点是仍会发生下列问题:对用户请求响应慢、网络拥塞严 重、安全性等。

1997年形成的HTTP/1.1,也就是现在普遍使用的协 议,在持续连接操作机制中实现流水方式,即客户端需要对同一服务器 发出多个请求时,其实现在多数的网页都是有多部分组成(比如多张图片),可用流水线方式加快速度,流水机制就是指连续发出多个请求并等到这些请求发送完 毕,再等待响应。这样就大大节省了单独请求对响应的等待时间,使我们得到更快速的浏览。

另外,HTTP/1.1服务器端处理请求时按照收到的顺序进行,这就保证了传输的正确性。当然,服务器端在发生连接中断时,会自动的重传请求,保证数据的完整性。

HTTP/1.1还提供了身份认证、状态管理和Cache缓存 等机制。这里,我想特别提一下关于HTTP/1.1中的Cache缓存机制对 HTTP/1.0的不足之处的改进,它严格全面,既可以减少时间延迟、又节省了带宽。HTTP/1.1采用了内容协商机制,选择最合适的用户的内容表现形 式。

现在,很多地方都有用到的虚拟主机技术在HTTP/1.1中也 可以实现。所谓的虚拟主机技术,就是同一主机地址实际对应多台主机。通俗的 讲,当你同时在一个网站申请两个主页时,用协议分析仪可以发现其实这两个主页对应的是同一个IP地址。这样用多台完全相同的机器形成WWW服务器就可以提 高处理的吞吐量。

传统的解决方案是改造域名服务器使其可以根据一定的算法将同一域名解释成不同的IP地址。分别对应虚拟主机的每台机器,其缺点是要求每台机器占用完全独立的IP地址,这与IP地址的缺乏是相矛盾的。

HTTP/1.1提供的解决方案在HTTP协议自身中加入了指定不同主机的功能,从而多台主机可以共享一个IP地址,既提高了性能又便于管理。

因为HTTP/1.1是Internet现行的标准协议,这里详细介绍其相关语法。

首先,HTTP/1.1格式可写为:

其中请求方法是请求一定的Web页面的程序或用于特定的URL。可选用下列几种:

GET: 请求指定的页面信息,并返回实体主体。

HEAD: 只请求页面的首部。

POST: 请求服务器接受所指定的文档作为对所标识的URI的新的从属实体。

PUT: 从客户端向服务器传送的数据取代指定的文档的内容。

DELETE: 请求服务器删除指定的页面。

OPTIONS: 允许客户端查看服务器的性能。

TRACE: 请求服务器在响应中的实体主体部分返回所得到的内容。

PATCH: 实体中包含一个表,表中说明与该URI所表示的原内容的区别。

MOVE: 请求服务器将指定的页面移至另一个网络地址。

COPY: 请求服务器将指定的页面拷贝至另一个网络地址。

LINK: 请求服务器建立链接关系。

UNLINK: 断开链接关系。

WRAPPED: 允许客户端发送经过封装的请求。

Extension-mothed:在不改动协议的前提下,可增加另外的方法。

比如:

GET /index.html HTTP/1.1

Accept: text/plain /*纯ASCII码文本文件*/

Accept: text/html /*HTML文本文件*/

User-Agent:Mozilla/4.5(WinNT)

说明浏览器使用Get方法请求文档/index.html。浏览器则只允许接收纯ASCII码文本文件和HTML文本文件,其使用的引擎是Mozilla/4.5(Netscape)。

当服务器响应时,其状态行的信息为HTTP的版本号,状态码,及解释状态码的简单说明。现将5类状态码详细列出:

① 客户方错误

100  继续

101  交换协议

② 成功

200  OK

201  已创建

202  接收

203  非认证信息

204  无内容

205  重置内容

206  部分内容

③ 重定向

300  多路选择

301  永久转移

302  暂时转移

303  参见其它

304  未修改(Not Modified)

305  使用代理

④ 客户方错误

400  错误请求(Bad Request)

401  未认证

402  需要付费

403  禁止(Forbidden)

404  未找到(Not Found)

405  方法不允许

406  不接受

407  需要代理认证

408  请求超时

409  冲突

410  失败

411  需要长度

412  条件失败

413  请求实体太大

414  请求URI太长

415  不支持媒体类型

⑤ 服务器错误

500  服务器内部错误

501  未实现(Not Implemented)

502  网关失败

504  网关超时

505 HTTP版本不支持

比如:(在《TELNET……》一文中用telnet登陆80端口,相同的方法用在HTTP/1.1中,会发现没有显示,下面补充说明之)

telnet www.fudan.edu.cn 80

HEAD / HTTP/1.1

host:www.fudan.edu.cn /*本行为输入内容*/

HTTP/1.1 501 Method Not Implemented

Date: Web, 01 Nov 2000 07:12:29 GMT /*当前的日期/时间*/

Server: Apache/1.3.12 (Unix) /*Web服务器信息*/

Allow: GET, HEAD, OPTION, TRACE /*支持的方法类型*/

Connection: close

Connect-Type: Text/htmlcharset=iso-8859-1/*连接的媒体类型*/

<!DOCTYPE HTML PUBLIG "-//IETF//DTD HTML 2.0//EN">

<HTML><HEAD>

<TITLE>501 Method

Not Implemented</TITLE>

</HEAD><BODY>

<H1>Method Not Implemented</H1>

head to /inde

x.html not supported.<P>

Invalid method in request head / htp/1.1<P>

<HR>

<ADDRESS>

Apache/1.3.12 Server at www.fudan.edu.cn Port 80</ADDRESS>

</BODY></HTML>

关于实体头部的内容还可以有:

Last Modified :请求文档的最近修改时间。

Expires :请求文档的过期时间。

Connect-length:文档数据的长度。

WWW-authenricate:通知客户端需要的认证信息。

Connect-encoding :说明有无使用压缩技术。

Transfer-encoding :说明采用的编码变换类型。

随着Internet的发展,下一代的HTTP协议HTTP-ng已经在酝酿之中,它将会提供更好的安全性、更快的速度,其改进要点为:模块化强、网络效率高、安全性更好、结构更简单。

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1759249

http 是一个相对简单的协议,它定义了客户(通常通过浏览器)和www服务器之间的会话过程。现在我们来看看这个会话过程的简要说明:客户打开与服务器的套接, 使用的端口通常是80。然后它服务器发送请求行,请求标题,最后是请求空行。客户的请求通常是请求文档,它可以是文本文件,图片或者是程序等。服务器接受 这个请求,然后查找请求的数据,最后根据查找的结果做出响应。如果上面的过程是一个cgi程序的话,那么服务器将会执行这个程序,并将程序执行的结果输给 客户端。所以不明白cgi程序的朋友,可以这样理解cgi程序,它可以用很多的语言来写,只要它能完成一个任务:分析客户请求行中的数据,然后代替服务器 做出响应!我们今天要讨论的就是从客户端的角度来理解这个问题,首先来看一个标准的客户请求格式:

请求方法 文挡地址 http/版本

请求标题:数据1

…………….

请求标题:数据N

空白行

在上面的格式中,第一行是必须的,它指明请求的文挡,又称请求头。下面的是请求标题可以多个。最后的空白行表示终止。这里还有一个问题,如果请求方法是 POST的话那么空白行后面还可以发送附加数据。这里有一个非常重要的问题就是请求方法。无论对于我们cgi新手还是喜欢web安全的朋友,都是必须的知 识

这是一个典型的请求头:

GET /bbs/login.asp HTTP/1.0

其中GET就是一个请求方法。/bbs/login.asp是文挡的地址即URI,它是URL的一部分。HTTP/1.0 是http 协议的版本号。这种方式的请求是建立在已经和服务器的套接建立的基础上的。完整的URL 可以是这样的方式:http://www.target.com/bbs/login.asp 。在http 1.0的协议里定义了三种请求方式:GET,POST,HEAD。http 1.1又补充了一些,如PUT,DELETE,OPTIONS和TRACE。现在也越来越多的服务器支持这些方法。下面我们来介绍一下常用的方法。

GET 这个是浏览器用语向服务器请求最常用的方法。我们在浏览器上发送的URL就是一个GET请求,当然我们也可以用程序,比如netcat,webget等来做。我们有的时候在看到一些黑客高手们在文章中提到的一些请求的例子,可能新手朋友们很难理解,比如:

http://www.target.com/bbsxp165/bbsxp/searc...password)>1)

这就是一个相当复杂的GET请求,/searchok.asp?是请求这个asp文件,后面就是要传输给这个程序的数据,这个数据是根据网页的交互固定 的。服务器接受这个请求后这些数据将被放入环境变量QUERY_STRING中。数据通常是一些数据名/数据值对。没对数据名/数据值之间用&来 分开。例子的提交里forumid=()空格里的是一个sql语句,这是由于这里存在sql injection漏洞,当然不在我们讨论的范围。还有GET请求的数据不能超过一个特定的长度,比如2000字节。

POST 这个方法也是用来传送数据的,但是与GET不同的是,使用POST的时候,数据不是附在URI后面传递的,而是要做为独立的行来传递,此时还必须要发送一 个Content_length标题,以标明数据长度,随后一个空白行,然后就是实际传送的数据。网页的表单通常是用POST来传送的。这里我们来举两个 安全人士常用的提交方式,通常就是黑客们所谓的发现某个网页的或者某个cgi程序的漏洞然后构造一个特殊请求的时候用的:

1,脚本实现

…………

$socket = IO::Socket::INET->new(PeerAddr =>$host, PeerPort =>$port, Proto =>"tcp", Type =>SOCK_STREAM) or die “can’t connect to the host\n”

print $socket "POST /$b HTTP/1.1\r\n"

print $socket "Host: $host\r\n"

print $socket "Content-Type: text/xml\r\n"

print $socket "Content-length: $length\r\n\r\n"

print $socket "$data\r\n"

$socket->recv($rbuf,500)

close($socket)

……….

以上是perl程序POST提交的主体部分,比如一个溢出程序,关键的地方就在于$b(URI)和$data 的构造上!

2, 使用nc来提交

建立一个hack.txt的文件输入下面的内容:

POST /cgi-bin/websendmail HTTP/1.0

Content-length: xxx (should be replaced with the actual length of the

string passed to the server, in this case xxx=90)

receiver=mail+your_address\@somewhere.org

然后用nc来请求

nc www.victim.com 80 <hack.txt

这样就完成了一个post的提交,当然还有很多别的方法可以实现这个提交,这里只是举两个我认为方便的办法。

HEAD 方法和GET的语法是一样的,如果用HEAD方法请求的话,则服务器返回的只是响应标题,而不会返回被请求的文挡,HEAD方法通用于一些搜索引擎中,当然我们的cgi扫描软件很多都是使用这个方式请求的。

以下方法属于http 1.1的标准,我们目前使用的还少,简单的介绍一下定义。

PUT 可以将客户提交的文挡保存在服务器的URI上

DELETE 用于请求服务器删除指定的URI

OPTIONS 可以请求对于指定URI可用的通用选项信息

TRACE请求服务器将附加的文挡无变更的返回,主要用于调试。

提到了请求,自然要讲一下,服务器的响应了,它的标准格式如下

HTTP/版本号 状态码 消息

响应标题:数据1

………….

响应标题:数据N

空白行

客户提交的文挡

看个例子吧:

nc www.victim.com 80

GET /index.html

HTTP/1.1 400 Bad Request

Date: Tue, 14 May 2002 07:03:02 GMT

Server: Apache

Connection: close

Transfer-Encoding: chunked

Content-Type: text/htmlcharset=iso-8859-1

127

……………

响应预定义的状态码有很多,通常是服务器默认的设置,是三位数,以1,2,3,4,5开头的

1xx 主要用于调试和实验的目的

2xx 主要表示请求成功

3xx 表示请求的uri有多个选择或者已经移动位置了

4xx 400表示请求行中有语法错误,404表示文挡不存在

5xx 表示服务器内部错误

有的时候可能大家总是忽略了这些东西的做用,事实上有的时候他们的作用还真的不小,比如我们手头没有任何工具,如何知道服务器上是否有 ida,printf等映射呢,我们可以这么请求:http://www.victim.com/*.ida 如果出现500 服务器内部错误,我想问题就已经很清楚了。

既然都说这么多的废话了,那么再给大家来点关于URL编码,数据传输的小知识,和cookies的一些介绍吧。

URL编码和数据传输

下面是一个例子:

http://www1.baidu.com/baidu?word=netcat+ex...gb2312&cl=3&f=1

通常我们的浏览器在发送数据的时候要先经过编码,这是一种规范。GET 和POST 都是一样的,当然对于表单你可以用enctype字段来规定其他的编码方式。上面的例子语法,格式是用HEAD请求的。我们看到其中有一些特殊的符号 如”%”,这是由于当数据中有非字母或数据的字符时,URL编码会将该字符转化为其ASCII码对应的数字,这样便以一个两位数字的16进制编码来代表字 符。在 URL 编码中由百分号指示。 因此,%25 表示百分号本身(25是十六进制的,就是以 16 为基,代表百分号的 ASCII 码值),所有127(7fhex) 以上,和 33 (21hex) 以下的所有字符都会被转义,这包含空格符,空格的转义符为 %20. 加号被解释为空格符。

cookies 内容简介

cookies的作用,这里我就不说了,光是对它语法和格式本身就进介绍,我们先来看一个cookies的例子

aspsky

userhidden=2&password=469e80d32c0559f8&userid=1&userclass=%B9%DC%C0%ED%D4%B1&username=admin&usercookies=1

localhost/bbs/

0

3061727232

29562033

2222055456

29561914

*

参考这个例子我们来看看cookies 的 properties 主要包括:

key -->aspsky

value-->userhidden=2&password=469e80d32c0559f8&userid=1&userclass=%B9%DC%C0%ED%D4%B1&usernam e=admin&usercookies=1

damain-->localhost/bbs/

secure-->0 相当于no

expire-->3061727232 29562033 有效时间需要解码才能读出来

modified-->3061727232 29562033 修改时间,解码方式和expire一样

created in ->server

有的时候还有ip address

以上这些介绍只是方便大家对cookies的理解,具体的请参考一些专业的资料。有的时候经常遇到一些朋友问起怎么伪造cookies,我想写到这里已经非常清楚了。

说了这么多,总结一下吧

如果你是一个新手的话,如果你对http协议不是很清楚的话,建议你好好读读一些资料,毕竟这个是我们一天到晚泡网的基础哦,如果你是一个和我一样,喜欢 研究网络编程安全的朋友,那么希望我们能一起交流,一起进步。本文只是简单的介绍了一下http方面的一些基础知识,并没有深入的讲述,在一定程 度上说只是给新手朋友们一个概念,但是对于大家理解在网络一些高手的精彩文章,还是相当有用的。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/683627.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-30
下一篇2023-07-30

发表评论

登录后才能评论

评论列表(0条)

    保存