http状态代码各代表什么意思_服务器知识

此状态码提供关于请求状态的信息，告诉 Googlebot 关于您的网站和请求的网页的信息。一些常见的状态码为：200 - 服务器成功返回网页 404 - 请求的网页不存在 503 - 服务器超时下面提供 HTTP 状态码的完整列表。点击链接可了解详情。您也可以访问 HTTP 状态码上的 W3C 页获取更多信息。1xx（临时响应）表示临时响应并需要请求者继续执行操作的状态码。100（继续）请求者应当继续提出请求。服务器返回此代码表示已收到请求的第一部分，正在等待其余部分。101（切换协议）请求者已要求服务器切换协议，服务器已确认并准备切换。2xx（成功）表示成功处理了请求的状态码。200（成功）服务器已成功处理了请求。通常，这表示服务器提供了请求的网页。如果是对您的 robots.txt 文件显示此状态码，则表示 Googlebot 已成功检索到该文件。201（已创建）请求成功并且服务器创建了新的资源。202（已接受）服务器已接受请求，但尚未处理。203（非授权信息）服务器已成功处理了请求，但返回的信息可能来自另一来源。204（无内容）服务器成功处理了请求，但没有返回任何内容。205（重置内容）服务器成功处理了请求，但没有返回任何内容。与 204 响应不同，此响应要求请求者重置文档视图（例如，清除表单内容以输入新内容）。206（部分内容）服务器成功处理了部分 GET 请求。3xx（重定向）要完成请求，需要进一步操作。通常，这些状态码用来重定向。Google 建议您在每次请求中使用重定向不要超过 5 次。您可以使用网站管理员工具查看一下 Googlebot 在抓取重定向网页时是否遇到问题。诊断下的网络抓取页列出了由于重定向错误导致 Googlebot 无法抓取的网址。300（多种选择）针对请求，服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作，或提供操作列表供请求者选择。301（永久移动）请求的网页已永久移动到新位置。服务器返回此响应（对 GET 或 HEAD 请求的响应）时，会自动将请求者转到新位置。您应使用此代码告诉 Googlebot 某个网页或网站已永久移动到新位置。302（临时移动）服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求的 301 代码类似，会自动将请求者转到不同的位置，但您不应使用此代码来告诉 Googlebot 某个网页或网站已经移动，因为 Googlebot 会继续抓取原有位置并编制索引。303（查看其他位置）请求者应当对不同的位置使用单独的 GET 请求来检索响应时，服务器返回此代码。对于除 HEAD 之外的所有请求，服务器会自动转到其他位置。304（未修改）自从上次请求后，请求的网页未修改过。服务器返回此响应时，不会返回网页内容。如果网页自请求者上次请求后再也没有更改过，您应将服务器配置为返回此响应（称为 If-Modified-Since HTTP 标头）。服务器可以告诉 Googlebot 自从上次抓取后网页没有变更，进而节省带宽和开销。 .305（使用代理）请求者只能使用代理访问请求的网页。如果服务器返回此响应，还表示请求者应使用代理。307（临时重定向）服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求的 301 代码类似，会自动将请求者转到不同的位置，但您不应使用此代码来告诉 Googlebot 某个页面或网站已经移动，因为 Googlebot 会继续抓取原有位置并编制索引。4xx（请求错误）这些状态码表示请求可能出错，妨碍了服务器的处理。400（错误请求）服务器不理解请求的语法。401（未授权）请求要求身份验证。对于登录后请求的网页，服务器可能返回此响应。403（禁止）服务器拒绝请求。如果您在 Googlebot 尝试抓取您网站上的有效网页时看到此状态码（您可以在 Google 网站管理员工具诊断下的网络抓取页面上看到此信息），可能是您的服务器或主机拒绝了 Googlebot 访问。404（未找到）服务器找不到请求的网页。例如，对于服务器上不存在的网页经常会返回此代码。如果您的网站上没有 robots.txt 文件，而您在 Google 网站管理员工具"诊断"标签的 robots.txt 页上看到此状态码，则这是正确的状态码。但是，如果您有 robots.txt 文件而又看到此状态码，则说明您的 robots.txt 文件可能命名错误或位于错误的位置（该文件应当位于顶级域，名为 robots.txt）。如果对于 Googlebot 抓取的网址看到此状态码（在"诊断"标签的 HTTP 错误页面上），则表示 Googlebot 跟随的可能是另一个页面的无效链接（是旧链接或输入有误的链接）。405（方法禁用）禁用请求中指定的方法。406（不接受）无法使用请求的内容特性响应请求的网页。407（需要代理授权）此状态码与 401（未授权）类似，但指定请求者应当授权使用代理。如果服务器返回此响应，还表示请求者应当使用代理。408（请求超时）服务器等候请求时发生超时。409（冲突）服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。服务器在响应与前一个请求相冲突的 PUT 请求时可能会返回此代码，以及两个请求的差异列表。410（已删除）如果请求的资源已永久删除，服务器就会返回此响应。该代码与 404（未找到）代码类似，但在资源以前存在而现在不存在的情况下，有时会用来替代 404 代码。如果资源已永久移动，您应使用 301 指定资源的新位置。411（需要有效长度）服务器不接受不含有效内容长度标头字段的请求。412（未满足前提条件）服务器未满足请求者在请求中设置的其中一个前提条件。413（请求实体过大）服务器无法处理请求，因为请求实体过大，超出服务器的处理能力。414（请求的 URI 过长）请求的 URI（通常为网址）过长，服务器无法处理。415（不支持的媒体类型）请求的格式不受请求页面的支持。416（请求范围不符合要求）如果页面无法提供请求的范围，则服务器会返回此状态码。417（未满足期望值）服务器未满足"期望"请求标头字段的要求。5xx（服务器错误）这些状态码表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误，而不是请求出错。500（服务器内部错误）服务器遇到错误，无法完成请求。501（尚未实施）服务器不具备完成请求的功能。例如，服务器无法识别请求方法时可能会返回此代码。502（错误网关）服务器作为网关或代理，从上游服务器收到无效响应。503（服务不可用）服务器目前无法使用（由于超载或停机维护）。通常，这只是暂时状态。504（网关超时）服务器作为网关或代理，但是没有及时从上游服务器收到请求。

代理服务器的应用非常广泛。比如，在企业网内部，它可以用来控制员工在工作时浏览的Internet内容，阻止员工访问某些类型的内容或某些指定的网站。代理服务器实际上扮演着浏览器和Web服务器之间的中间人的角色，能够对浏览器请求进行各种各样的处理，能够过滤广告和Cookie，能够预先提取Web页面，使得浏览器访问页面的速度更快，等等。

一、基础知识

不管以哪种方式应用代理服务器，其监控HTTP传输的过程总是如下：

步骤一：内部的浏览器发送请求给代理服务器。请求的第一行包含了目标URL。

步骤二：代理服务器读取该URL，并把请求转发给合适的目标服务器。

步骤三：代理服务器接收来自Internet目标机器的应答，把应答转发给合适的内部浏览器。

例如，假设有一个企业的雇员试图访问www.cn.ibm.com网站。如果没有代理服务器，雇员的浏览器打开的Socket通向运行这个网站的Web服务器，从Web服务器返回的数据也直接传递给雇员的浏览器。如果浏览器被配置成使用代理服务器，则请求首先到达代理服务器；随后，代理服务器从请求的第一行提取目标URL，打开一个通向www.cn.ibm.com的Socket。当www.cn.ibm.com返回应答时，代理服务器把应答转发给雇员的浏览器。

当然，代理服务器并非只适用于企业环境。作为一个开发者，拥有一个自己的代理服务器是一件很不错的事情。例如，我们可以用代理服务器来分析浏览器和Web服务器的交互过程。测试和解决Web应用中存在的问题时，这种功能是很有用的。我们甚至还可以同时使用多个代理服务器（大多数代理服务器允许多个服务器链接在一起使用）。例如，我们可以有一个企业的代理服务器，再加上一个用java编写的代理服务器，用来调试应用程序。但应该注意的是，代理服务器链上的每一个服务器都会对性能产生一定的影响。

二、设计规划

正如其名字所示，代理服务器只不过是一种特殊的服务器。和大多数服务器一样，如果要处理多个请求，代理服务器应该使用线程。下面是一个代理服务器的基本规划：

等待来自客户（Web浏览器）的请求。

启动一个新的线程，以处理客户连接请求。

读取浏览器请求的第一行（该行内容包含了请求的目标URL）。

分析请求的第一行内容，得到目标服务器的名字和端口。

打开一个通向目标服务器（或下一个代理服务器，如合适的话）的Socket。

把请求的第一行发送到输出Socket。

把请求的剩余部分发送到输出Socket。

把目标Web服务器返回的数据发送给发出请求的浏览器。

当然，如果考虑细节的话，情况会更复杂一些。实际上，这里主要有两个问题要考虑：第一，从Socket按行读取数据最适合进一步处理，但这会产生性能瓶颈；第二，两个Socket之间的连接必需高效。有几种方法可以实现这两个目标，但每一种方法都有各自的代价。例如，如果要在数据进入的时候进行过滤，这些数据最好按行读取；然而，大多数时候，当数据到达代理服务器时，立即把它转发出去更适合高效这一要求。另外，数据的发送和接收也可以使用多个独立的线程，但大量地创建和拆除线程也会带来性能问题。因此，对于每一个请求，我们将用一个线程处理数据的接收和发送，同时在数据到达代理服务器时，尽可能快速地把它转发出去。

三、实例

在用java编写这个代理服务器的过程中，注意可重用性是很重要的。因为这样的话，当我们想要在另一个工程中以不同的方式处理浏览器请求时，可以方便地重用该代理服务器。当然，我们必须注意灵活性和效率之间的平衡。

图一显示了本文代理服务器实例（HttpProxy.java）的输出界面，当浏览器访问http://www-900.ibm.com/cn/时，代理服务器向默认日志设备（即标准输出设备屏幕）输出浏览器请求的URL。图二显示了SubHttpProxy的输出。SubHttpProxy是HttpProxy的一个简单扩展。

图一

图二

为了构造代理服务器，我从Thread基类派生出了HttpProxy类（文章正文中出现的代码是该类的一些片断，完整的代码请从本文最后下载）。HttpProxy类包含了一些用来定制代理服务器行为的属性，参见Listing 1和表一。

【Listing 1】

/*************************************

* 一个基础的代理服务器类

*************************************

import java.net.*

import java.io.*

public class HttpProxy extends Thread {

static public int CONNECT_RETRIES=5

static public int CONNECT_PAUSE=5

static public int TIME-OUT=50

static public int BUFSIZ=1024

static public boolean logging = false

static public OutputStream log=null

// 传入数据用的Socket

protected Socket socket

// 上级代理服务器，可选

static private String parent=null

static private int parentPort=-1

static public void setParentProxy(String name, int pport) {

parent=name

parentPort=pport

}

// 在给定Socket上创建一个代理线程。

public HttpProxy(Socket s) { socket=sstart()}

public void writeLog(int c, boolean browser) throws IOException {

log.write(c)

}

public void writeLog(byte[] bytes,int offset,

int len, boolean browser) throws IOException {

for (int i=0i<leni++) writeLog((int)bytes[offset+i],browser)

}

// 默认情况下，日志信息输出到

// 标准输出设备，

// 派生类可以覆盖它

public String processHostName(String url, String host, int port, Socket sock) {

java.text.DateFormat cal=java.text.DateFormat.getDateTimeInstance()

System.out.println(cal.format(new java.util.Date()) + " - " +

url + " " + sock.getInetAddress()+"<BR>")

return host

}

表一

变量/方法说明

CONNECT_RETRIES 在放弃之前尝试连接远程主机的次数。

CONNECT_PAUSE 在两次连接尝试之间的暂停时间。

TIME-OUT 等待Socket输入的等待时间。

BUFSIZ Socket输入的缓冲大小。

logging 是否要求代理服务器在日志中记录所有已传输的数据（true表示“是”）。

log 一个OutputStream对象，默认日志例程将向该OutputStream对象输出日志信息。

setParentProxy 用来把一个代理服务器链接到另一个代理服务器（需要指定另一个服务器的名称和端口）。

当代理服务器连接到Web服务器之后，我用一个简单的循环在两个Socket之间传递数据。这里可能出现一个问题，即如果没有可操作的数据，调用read方法可能导致程序阻塞，从而挂起程序。为防止出现这个问题，我用setSoTimeout方法设置了Socket的超时时间（参见Listing 2）。这样，如果某个Socket不可用，另一个仍旧有机会进行处理，我不必创建一个新的线程。

【Listing 2】

// 执行操作的线程

public void run() {

String line

String host

int port=80

Socket outbound=null

try {

socket.setSoTimeout(TIMEOUT)

InputStream is=socket.getInputStream()

OutputStream os=null

try {

// 获取请求行的内容

line=""

host=""

int state=0

boolean space

while (true) {

int c=is.read()

if (c==-1) break

if (logging) writeLog(c,true)

space=Character.isWhitespace((char)c)

switch (state) {

case 0:

if (space) continue

state=1

case 1:

if (space) {

state=2

continue

}

line=line+(char)c

break

case 2:

if (space) continue// 跳过多个空白字符

state=3

case 3:

if (space) {

state=4

// 只分析主机名称部分

String host0=host

int n

n=host.indexOf("//")

if (n!=-1) host=host.substring(n+2)

n=host.indexOf('/')

if (n!=-1) host=host.substring(0,n)

// 分析可能存在的端口号

n=host.indexOf(":")

if (n!=-1) {

port=Integer.parseInt(host.substring(n+1))

host=host.substring(0,n)

}

host=processHostName(host0,host,port,socket)

if (parent!=null) {

host=parent

port=parentPort

}

int retry=CONNECT_RETRIES

while (retry--!=0) {

try {

outbound=new Socket(host,port)

break

} catch (Exception e) { }

// 等待

Thread.sleep(CONNECT_PAUSE)

}

if (outbound==null) break

outbound.setSoTimeout(TIMEOUT)

os=outbound.getOutputStream()

os.write(line.getBytes())

os.write(' ')

os.write(host0.getBytes())

os.write(' ')

pipe(is,outbound.getInputStream(),os,socket.getOutputStream())

break

}

host=host+(char)c

break

}

catch (IOException e) { }

} catch (Exception e) { }

finally {

try { socket.close()} catch (Exception e1) {}

try { outbound.close()} catch (Exception e2) {}

}

和所有线程对象一样，HttpProxy类的主要工作在run方法内完成（见Listing 2）。run方法实现了一个简单的状态机，从Web浏览器每次一个读取字符，持续这个过程直至有足够的信息找出目标Web服务器。然后，run打开一个通向该Web服务器的Socket（如果有多个代理服务器被链接在一起，则run方法打开一个通向链里面下一个代理服务器的Socket）。打开Socket之后，run先把部分的请求写入Socket，然后调用pipe方法。pipe方法直接在两个Socket之间以最快的速度执行读写操作。

如果数据规模很大，另外创建一个线程可能具有更高的效率；然而，当数据规模较小时，创建新线程所需要的开销会抵消它带来的好处。

Listing 3显示了一个很简单的main方法，可以用来测试HttpProxy类。大部分的工作由一个静态的startProxy方法完成（见Listing 4）。这个方法用到了一种特殊的技术，允许一个静态成员创建HttpProxy类（或HttpProxy类的子类）的实例。它的基本思想是：把一个Class对象传递给startProxy类；然后，startProxy方法利用映像API（Reflection API）和getDeclaredConstructor方法确定该Class对象的哪一个构造函数接受一个Socket参数；最后，startProxy方法调用newInstance方法创建该Class对象。

【Listing 3】

// 测试用的简单main方法

static public void main(String args[]) {

System.out.println("在端口808启动代理服务器\n")

HttpProxy.log=System.out

HttpProxy.logging=false

HttpProxy.startProxy(808,HttpProxy.class)

}

【Listing 4】

static public void startProxy(int port,Class clobj) {

ServerSocket ssock

Socket sock

try {

ssock=new ServerSocket(port)

while (true) {

Class [] sarg = new Class[1]

Object [] arg= new Object[1]

sarg[0]=Socket.class

try {

java.lang.reflect.Constructor cons = clobj.getDeclaredConstructor(sarg)

arg[0]=ssock.accept()

cons.newInstance(arg)// 创建HttpProxy或其派生类的实例

} catch (Exception e) {

Socket esock = (Socket)arg[0]

try { esock.close()} catch (Exception ec) {}

}

} catch (IOException e) {

}

利用这种技术，我们可以在不创建startProxy方法定制版本的情况下，扩展HttpProxy类。要得到给定类的Class对象，只需在正常的名字后面加上.class（如果有某个对象的一个实例，则代之以调用getClass方法）。由于我们把Class对象传递给了startProxy方法，所以创建HttpProxy的派生类时，就不必再特意去修改startProxy。（下载代码中包含了一个派生得到的简单代理服务器）。

结束语

利用派生类定制或调整代理服务器的行为有两种途径：修改主机的名字，或者捕获所有通过代理服务器的数据。processHostName方法允许代理服务器分析和修改主机名字。如果启用了日志记录，代理服务器为每一个通过服务器的字符调用writeLog方法。如何处理这些信息完全由我们自己决定——可以把它写入日志文件，可以把它输出到控制台，或进行任何其他满足我们要求的处理。writeLog输出中的一个Boolean标记指示出数据是来自浏览器还是Web主机。

和许多工具一样，代理服务器本身并不存在好或者坏的问题，关键在于如何使用它们。代理服务器可能被用于侵犯隐私，但也可以阻隔偷窥者和保护网络。即使代理服务器和浏览器不在同一台机器上，我也乐意把代理服务器看成是一种扩展浏览器功能的途径。例如，在把数据发送给浏览器之前，可以用代理服务器压缩数据；未来的代理服务器甚至还可能把页面从一种语言翻译成另一种语言……可能性永无止境。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/381853.html

http状态代码各代表什么意思

发表评论

评论列表（0条）