华域联盟
登陆 / 注册 搜索

USERCENTER

SEARCHSITE

搜索

查看: 241|回复: 0

百度蜘蛛(Baiduspider+)匍匐返回代码的含义

[复制链接]
发表于 2017-6-27 20:45:57 | 显示全部楼层 |阅读模式

【CHU】
信息来源: 华域联盟(www.cnhackhy.com)

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x

8 b4 D2 d  z+ t0 J
! i# X0 v- k) c8 [$ X
031413qzs1ssjjvijk071s.jpg
# x$ b/ E" a; A0 K5 z% b+ q( f" Q5 g) N
! l# E" Z: z6 Z, `4 v9 t& V
  具有自己的博客或网站的人都希望百度能收录自已发表的文章,特别是对运作网站的站长来说,更是希望百度蜘蛛(Baiduspider)多抓取自己网站的内容,查看效劳器日志时我们会发现如200 0 0 17571等代码,这些代码是什么含义你明白吗?' _. ~) }3 Q; y: P7 Q5 D
  下面,以抓取一家网站的访问日志来作为案例:9 g/ y& Y* ~5 s) w
  Software: Microsoft Internet Information Services 6.0
0 m( G5 [3 q5 I! O* R3 e2 f  #Version: 1.0
2 }  i  S) ^7 A, ^2 b  #Date: 2011-05-28 16:12:15
' M' f" `3 t4 E/ J% l  #Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status sc-bytes
% c- x0 u* K6 \  2011-05-28 16:31:41 W3SVC854 116.254.252.22 GET /news/1032.html - 80 - 220.181.108.179 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 200 0 0 17571
/ O; C2 U& a4 S& Y  留意粗体内容:5 X  J& x. M- s9 L; b) Z' [2 B! h1 ]
  date表示记载访问日期;7 f/ u% r* h/ @* p' l2 _: [8 `
  time访问时间;$ S- |1 a8 X. D5 C' _
  s-sitename表示你的虚拟主机的代称。& ^# ~/ k& \# L- ?4 t
  s-ip访问者IP;& ]5 ~( f3 Q& Q
  cs-method表示访问办法,常见的有两种,一是GET,就是平常我们翻开一个URL访问的动作,二是POST,提交表单时的动作;
( |& n/ P. W' J% z1 G0 U  cs-uri-stem就是访问哪一个文件;8 @3 L) @7 b) d/ C6 c
  cs-uri-query是指访问地址的附带参数,如asp文件?后面的字符串id=12等等,假定没有参数则用-表示;1 N$ B5 x: {1 u4 P
  s-port 访问的端口
4 |. w- l8 Z5 L# ?& U  cs-username 访问者称号9 v9 C' b! c6 ^" t- O) ]2 J* x& _
  c-ip 来源ip
8 u% G- O$ ^9 N) h% c. f( O: M  cs(User-Agent)访问来源;
' _2 Y1 R5 I: n( A# v$ A  V  sc-status状态,200表示胜利,403表示没有权限,404表示打不到该页面,500表示程序有错;/ D) t4 N* _# t2 F% q6 r
  sc-substatus 效劳端传送到客户端的字节大小;. Y6 j' J0 X( i& o5 v- T. w. q- x; R
  cs–win32-statu客户端传送到效劳端的字节大小;6 E9 ]9 n/ M9 E( W
  1**:央求收到,继续处置
  Z$ {& w8 u# Y/ X) @  2**:操作胜利收到,剖析、接受4 X& H  ~# i2 I' y
  3**:完成此央求必需进一步处置
6 \" Q0 p5 |# o  t  R  4**:央求包含一个错误语法或不能完成& ~. {" g/ ~$ T; N
  5**:效劳器执行一个完好有效央求失败6 }: J+ _4 X5 C, [
  100——客户必需继续发出央求0 B# F7 W$ g7 S& S; D+ a6 \
  101——客户央求效劳器依据央求转换HTTP协议版本
% V" w: T" Q0 h  200——买卖胜利$ p6 R  d2 w# J3 r% \( @
  201——提示知道新文件的URL
" n% c; G$ `7 c8 Z, e) ?5 Y; |  202——接受和处置、但处置未完成
# J! @' s+ V, m: o3 r  203——返回信息不肯定或不完好. y$ O: o& T) e, {
  204——央求收到,但返回信息为空
3 f# G# X% w+ Q$ c7 I5 W2 s  }$ d  205——效劳器完成了央求,用户代理必需复位当前曾经阅读过的文件9 A$ I) d$ i! c& W
  206——效劳器曾经完成了部分用户的GET央求/ G, P2 \0 O* K4 h( A# Y; E
  300——央求的资源可在多处得到* b. y3 W$ |8 c* n1 [
  301——删除央求数据
; R# q3 C$ M; k5 v8 [3 h  302——在其他地址发现了央求数据3 X  B% E$ O, a. U' T  i
  303——倡议客户访问其他URL或访问方式
. X% s( k# _/ a; I9 b  304——客户端曾经执行了GET,但文件未变化4 I* H" _" n2 B2 [% o0 K0 ?1 x
  305——央求的资源必需从效劳器指定的地址得到! b2 m/ L  w8 X) D" t  J
  306——前一版本HTTP中运用的代码,现行版本中不再运用; }+ ]$ L' ~7 q
  307——声明央求的资源暂时性删除) L4 z$ Y1 E/ {6 K+ u) _0 c; a# |
  400——错误央求,如语法错误
( W' R6 v3 O; A( E( i' p  B* u  401——央求受权失败
  B, c  K( f+ q/ I9 |  402——保管有效ChargeTo头响应
1 e& q$ |) A# n/ U  403——央求不允许6 g7 x" J! a3 N, D! n0 \
  404——没有发现文件、查询或URl* v' |4 X2 M- O! d
  405——用户在Request-Line字段定义的办法不允许" _2 X* v! A2 n4 s
  406——依据用户发送的Accept拖,央求资源不可访问
/ }) ?- Y& F2 V( n, b* i$ G4 J% g  407——相似401,用户必需首先在代理效劳器上得到受权9 J  [. |/ V* h' }0 Y
  408——客户端没有在用户指定的饿时间内完成央求
2 B+ m4 }9 ]' Z9 P' F, D  409——对当前资源状态,央求不能完成- u$ C, ]8 j' K" h1 m
  410——效劳器上不再有此资源且无进一步的参考地址6 t- @1 i" N; Z3 `4 M7 o: s4 `
  411——效劳器拒绝用户定义的Content-Length属性央求
7 `5 J2 X' W5 ]8 D1 x* Q  412——一个或多个央求头字段在当前央求中错误* p# ~9 d( q# I' k
  413——央求的资源大于效劳器允许的大小
- ^4 b$ X3 P: n+ \  C  414——央求的资源URL擅长效劳器允许的长度
/ ]1 _  \; \- w0 P, ]) I3 A  415——央求资源不支持央求项目格式
* A. x% R# `  [+ D* x! W1 `/ ?. K1 ?  416——央求中包含Range央求头字段,在当前央求资源范围内没有range指示值,央求也不包含If-Range央求头字段
! E1 @- g- H3 Y7 P5 @  417——效劳器不满足央求Expect头字段指定的希冀值,假定是代理效劳器,可能是下一级效劳器不能满足央求
/ o7 M) n: V1 _. u0 G  500——效劳器产生内部错误) A9 O7 ^2 [1 s! ^+ W* w
  501——效劳器不支持央求的函数! ~$ x  R. [% i4 O- C2 I
  502——效劳器暂时不可用,有时是为了避免发作系统过载
* P" r+ D* I- e+ E" g+ j5 i8 S  503——效劳器过载或暂停维修5 p4 s5 ]$ \, a4 C
  504——关口过载,效劳器运用另一个关口或效劳来响应用户,等候时间设定值较长6 u: D8 ^6 \8 p; |, \: b
  505——效劳器不支持或拒绝支央求头中指定的HTTP版本
9 H5 X& f/ e( m, q/ n  上以这些代码,有些或许你历来都没有见到,那是好事,呵呵,见到了阐明网站有问题了,那就要对号入座,好好剖析一下在日常的操作中有什么不当的中央,及时矫正,毕竟,网页只需被搜索引擎收录并放出来了,他人才干看到。9 e& ^. Z$ w/ K* f
 
文章来源:华域联盟

 

                                                  




上一篇:史上最全的百度索引量降落缘由剖析及处置计划
下一篇:华域联盟 2017年6月28日签到记录帖

帖子的最近访客

回复 百度谷歌雅虎搜狗搜搜有道360奇虎 天涯海角搜一下: 百度 谷歌 360 搜狗 搜搜 有道 谷粉 雅虎 必应 即刻

使用道具 举报

GMT+8, 2017-9-25 06:48 , Processed in 0.218750 second(s), 42 queries .

© 2020 华域联盟 | 蒙公网安备 15062202000105号 版权删帖举报人口

备案号: 蒙ICP备17000689号-2                                                                                                                                                                    

快速回复 返回列表