网站资讯 news
您现在的位置:首页 > 网站资讯 > 网站日志里常用抓取返回码说明
NEWS

新闻资讯

网站日志里常用抓取返回码说明

发布时间:2017/03/08 网站资讯 浏览次数:693

昆山网站建设

这里列举的是常见的百度支持的返回码:其他的服务器返回码还有很多。大家有兴趣,可以百度一下。
1、404:最常见,代表“NOT FOUND”,认为网页已经失效,通常百度会在索引库中删除,即使网站在短期内spider再次发现这条url,也不会再进行抓取;如果你的日志里好多的404,你还是赶快排查一下死链和无效链接吧。
2、503:代表“Service Unavailable”,认为网页临时不可访问,通常网站临时关闭,带宽有限,服务器维护等等会产生这种情况。对于网页返回503状态码,百度spider不会把这条url直接删除,同时短期内将会反复访问几次,如果网页已经恢复,则正常抓取;如果继续返回503,那么这条url仍会被认为是失效链接,从库中删除。
3、403:代表“Forbidden”,认为网页目前禁止访问。如果是新url,spider暂时不抓取,短期内同样会反复访问几次;如果是已收录url,不会直接删除,短期内同样反复访问几次。如果网页正常访问,则正常抓取;如果仍然禁止访问,那么这条url也会被认为是失效链接,从库中删除。
4、301:代表是“Moved Permanently”,认为网页重定向至新url。当遇到站点迁移、域名更换、站点改版的情况时,我们推荐使用301返回码,同时使用站长平台网站改版工具,以减少改版对网站流量造成的损失。
5、302:代表“Temporarily Moved”,认为暂时性转移,通常情况下,301会传递权重,而302是不传递权重的。
6、200:代表一切正常,网页未发现任何事。

云风网络是集昆山网站制作,昆山网页设计,昆山网站推广于一体的昆山网络公司,业务涵盖:昆山手机网站制作,昆山网站设计,昆山网络建设,昆山做网站,昆山网站建设,电话:13912673321

相关推荐
点击这里给我发消息 技术咨询
回到顶部