华域联盟
登陆 / 注册 搜索

USERCENTER

SEARCHSITE

搜索

查看: 337|回复: 0

百度蜘蛛(Baiduspider+)匍匐返回代码的含义

[复制链接]
发表于 2017-6-27 20:45:57 | 显示全部楼层 |阅读模式

【CHU】
信息来源: 华域联盟(www.cnhackhy.com)

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
4 g2 D$ r; X, ~

3 I+ D$ A$ i; P4 A
031413qzs1ssjjvijk071s.jpg

5 ~0 ]/ q9 K9 [0 K7 I: z6 U6 F+ c- ]2 A4 @; e) U6 b
  具有自己的博客或网站的人都希望百度能收录自已发表的文章,特别是对运作网站的站长来说,更是希望百度蜘蛛(Baiduspider)多抓取自己网站的内容,查看效劳器日志时我们会发现如200 0 0 17571等代码,这些代码是什么含义你明白吗?
5 i: N0 Z" P. `- ]  下面,以抓取一家网站的访问日志来作为案例:
6 S  U* k5 @. V6 k. h* A  Software: Microsoft Internet Information Services 6.0
& N# w$ f  @3 P3 [) _  #Version: 1.08 L0 N9 c" ~- j$ t: {; Y- O! x
  #Date: 2011-05-28 16:12:15( f  z0 P! F6 F- ~+ x0 Q; o3 m) Q2 ~
  #Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status sc-bytes% J6 `; k& k+ ~# D& N3 ^% s4 G
  2011-05-28 16:31:41 W3SVC854 116.254.252.22 GET /news/1032.html - 80 - 220.181.108.179 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 200 0 0 17571
/ `& `% D+ ?+ |" O( L# v8 W% b! X  留意粗体内容:
: ^, n/ D- o) @4 V; ?  J  date表示记载访问日期;
' f% ^% ~. H- O& E  time访问时间;
/ E8 |1 Q, ~: `5 K9 x  s-sitename表示你的虚拟主机的代称。6 d4 f* E* i& Y* v& \' i
  s-ip访问者IP;
8 e4 Z! X$ L% b9 b  cs-method表示访问办法,常见的有两种,一是GET,就是平常我们翻开一个URL访问的动作,二是POST,提交表单时的动作;$ M( j  x+ n4 [6 A+ Q# C" j- _8 r
  cs-uri-stem就是访问哪一个文件;
5 T1 J3 f! H, n, W; B. ?  cs-uri-query是指访问地址的附带参数,如asp文件?后面的字符串id=12等等,假定没有参数则用-表示;) t1 Z0 D7 ?9 |+ z: \' I5 l
  s-port 访问的端口
# w! w. h( H3 x9 [8 `  cs-username 访问者称号
( S% }( W1 s  u* `+ ~  c-ip 来源ip
6 D) b2 L# l7 C" W. l' d5 I$ g  Z( e  cs(User-Agent)访问来源;( b5 x8 U' L; r/ W
  sc-status状态,200表示胜利,403表示没有权限,404表示打不到该页面,500表示程序有错;
* b; A1 i3 {9 W- _  sc-substatus 效劳端传送到客户端的字节大小;, T8 ?; s/ Y* {4 k
  cs–win32-statu客户端传送到效劳端的字节大小;( F, y- k$ C. x3 m4 m) J
  1**:央求收到,继续处置( J" }$ n! m- r* W/ H
  2**:操作胜利收到,剖析、接受
" o2 e# \: w" |. ]  3**:完成此央求必需进一步处置) o+ l+ h. x  L
  4**:央求包含一个错误语法或不能完成& X2 O, ^9 h) f! I' u9 r# f5 {9 B
  5**:效劳器执行一个完好有效央求失败
% T/ u! O: }, S# Y4 g! }9 _  100——客户必需继续发出央求: V4 O+ r: c. ?) K
  101——客户央求效劳器依据央求转换HTTP协议版本
% K5 B& I- G9 ~3 M4 [  200——买卖胜利
( s9 F& B/ k; _! N' v4 A  201——提示知道新文件的URL( u3 c2 U' U$ ^# a
  202——接受和处置、但处置未完成! h- ?; W2 X/ u; A4 Y, n" j
  203——返回信息不肯定或不完好
, |% n& N. _) [' {: F: \: N5 ^1 C. T2 p  204——央求收到,但返回信息为空
) m$ v/ y+ g0 b/ O  G  205——效劳器完成了央求,用户代理必需复位当前曾经阅读过的文件
% f% ?% z0 r/ L! i" U' \$ f  206——效劳器曾经完成了部分用户的GET央求" O3 R+ S& L; ~( z5 o) B
  300——央求的资源可在多处得到3 ^( G- C% |4 A1 s$ Q/ M
  301——删除央求数据% H1 e* v6 `! q4 x5 n2 e; c1 Y
  302——在其他地址发现了央求数据+ z' p7 W9 C, O% ~- T, y
  303——倡议客户访问其他URL或访问方式
8 c; m7 W1 ]1 l4 G7 ?. U  304——客户端曾经执行了GET,但文件未变化, l) S& T" M: G6 }+ s( p
  305——央求的资源必需从效劳器指定的地址得到, X* H! j5 r0 }) @- e2 A
  306——前一版本HTTP中运用的代码,现行版本中不再运用- S9 `) k# o) F- ^& ?* u1 s( Q
  307——声明央求的资源暂时性删除4 b4 k9 G/ c4 J, j( @
  400——错误央求,如语法错误* r, O4 G6 I" A! s& E  ]4 U
  401——央求受权失败' l" e7 Q5 f- l) n) {
  402——保管有效ChargeTo头响应
1 p# z, F. Y2 V1 k% Q. e; u8 P  403——央求不允许
& g# L3 D2 o5 m; W5 t" C  404——没有发现文件、查询或URl
+ p+ E: X; B4 w3 B; g  405——用户在Request-Line字段定义的办法不允许
' V. o) S  W- A: K1 A' U' `  406——依据用户发送的Accept拖,央求资源不可访问3 [) m+ F! w; i: a1 I& f
  407——相似401,用户必需首先在代理效劳器上得到受权' x. z3 y& G( H2 u& y! q& A
  408——客户端没有在用户指定的饿时间内完成央求* D' C+ t& o9 _' O( r  x& h7 |
  409——对当前资源状态,央求不能完成, |; D8 ~% r, F" p6 e3 D
  410——效劳器上不再有此资源且无进一步的参考地址' E" y" }* r9 ~* n- n* ~+ v
  411——效劳器拒绝用户定义的Content-Length属性央求) C7 K- o/ g- I2 z( p0 R! N
  412——一个或多个央求头字段在当前央求中错误" x- ^+ p  z5 O* b6 ?. T
  413——央求的资源大于效劳器允许的大小! t# @! D0 }/ j; M4 F
  414——央求的资源URL擅长效劳器允许的长度2 G7 f" Z7 ^% m# s
  415——央求资源不支持央求项目格式
7 M* h" S% i, D9 \  m6 E7 g3 O  416——央求中包含Range央求头字段,在当前央求资源范围内没有range指示值,央求也不包含If-Range央求头字段
& t0 O7 u' B6 O  417——效劳器不满足央求Expect头字段指定的希冀值,假定是代理效劳器,可能是下一级效劳器不能满足央求5 k# g% F1 ]& K+ y; z
  500——效劳器产生内部错误
: q# Q  j, x- r- h% o3 L  501——效劳器不支持央求的函数
2 ?* h' }; }! {7 V) r5 A, E* c  502——效劳器暂时不可用,有时是为了避免发作系统过载& q8 T% F" P8 C9 b0 I
  503——效劳器过载或暂停维修
' G# G2 T. \$ r( Y  x6 ~: M  504——关口过载,效劳器运用另一个关口或效劳来响应用户,等候时间设定值较长& O: z* C9 m9 r9 z8 Z, }( P# m- ?
  505——效劳器不支持或拒绝支央求头中指定的HTTP版本/ g- [9 l! [1 ~. k. s
  上以这些代码,有些或许你历来都没有见到,那是好事,呵呵,见到了阐明网站有问题了,那就要对号入座,好好剖析一下在日常的操作中有什么不当的中央,及时矫正,毕竟,网页只需被搜索引擎收录并放出来了,他人才干看到。5 L& U1 N2 c: z5 e: y; u9 C: Z
 
文章来源:华域联盟

 

                                                  




上一篇:史上最全的百度索引量降落缘由剖析及处置计划
下一篇:华域联盟 2017年6月28日签到记录帖

帖子的最近访客

回复 百度谷歌雅虎搜狗搜搜有道360奇虎 天涯海角搜一下: 百度 谷歌 360 搜狗 搜搜 有道 谷粉 雅虎 必应 即刻

使用道具 举报

GMT+8, 2017-11-22 01:13 , Processed in 0.296875 second(s), 42 queries .

© 2020 华域联盟 | 蒙公网安备 15062202000105号 版权删帖举报人口

备案号: 蒙ICP备17000689号-2                                                                                                                                                                    

快速回复 返回列表