咨询热线:18482003530
咨询邮箱:846220395@qq.com
041微信
041手机版
成都SEO > 网站优化 > 网站蜕变必经之路、蜘蛛日志分析

网站蜕变必经之路、蜘蛛日志分析

2018-06-23

  SEO优化其网站数据分析中包含了一个是对于蜘蛛的日志分析,其分析结果为查看蜘蛛爬行网站时经过文件与链接及其蜘蛛IP状态码,其也是对网站必经之路,SEO优化网站想提升搜索引擎对站点的爱好,展现优质内容,摒弃不利于优化排名内容;满足蜘蛛爬行需求而来;

网站蜘蛛日志分析

  什么是网站蜘蛛日志

  网站蜘蛛日志是站点web服务器所接收处理器的请求以及运营的原始信息记录,一般以log后缀结尾的文件,准确来讲,应该服务自动抓取记录;(简单来说就是蜘蛛每日对网站访问爬行动态)

  为什么要分析网站日志:

  网站蜘蛛日志分析能看到站点的不足,以及站点的运营情况,网站服务器是否出现异常蛛爬去情况、停留时间、爬取了哪些页面、用户的访问时间、访问页面、访问ip、网站代码是否异常等等。

  怎么进行日志分析:

  一般网站日志存储在服务器中的根目录里面的log文件;下载之后使用日志分析工具从而针对数据分析蜘蛛的爬行动态!

  网站蜘蛛的名称:

  百度(Baidu)爬虫名称(Baiduspider)

  谷歌(Google)爬虫名称(Googlebot)

  雅虎(Yahoo)爬虫名称(Yahoo Slurp)

  有道(Yodao)蜘蛛名称(YodaoBot)

  搜狗(sogou)蜘蛛名称(sogou spider)

  MSN的蜘蛛名称:msnbot

网站日志状态码

  网站日志中的状态服务代码:

  200 - 服务器成功返回网页

  404 - 请求的网页不存在

  503 - 服务器暂时不可用

  500 - 服务器出现错误

  SEO如何分析网站蜘蛛日志:

  61.135.168.22 - - [11/Feb/2014:04:02:45 +0800] " /SEOjishu/161.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+https://www.baidu.com/search/spider.htm)" 以上的代码是我从自己的空间下载的一段日志,现在与大家一起来分析一下,这段代码具体意思如下:

  61.135.168.22:来路IP,也就是说这个用户或者蜘蛛进来我们网站的IP是多少。

  11/Feb/2014:04:02:45:时间2014年2月11日早上4点02分45秒。

  /wzyho.html:蜘蛛访问的页面,加上网站的主域名如:http://www.cduseo.com/wzyh/

  200:表示能够正常访问你的网站。

  8450:表示此次加载了8450个字节。

  Baiduspider:百度蜘蛛的全名。

  以上是网站日志分析的细节,那么以上的内容有两点,是我们需要注意的,同时在分析的过程中也需要记住的。那就是状态代码和程序名的解析。

提高网站蜘蛛爬取方式

  如何使网站蜘蛛经常光顾站点:

  那么蜘蛛会经常进行光顾的,SEO看懂数据之后发现网站蜘蛛日志中,访问量很少,那么我们需要对蜘蛛进行吸引,蜘蛛是个贪吃的家伙,所以需要三点做好,蜘蛛会经常进行光顾的;

  1、定时更新:如果是博客站点或者是小网站,定时更新内容不需要太多,1-3篇定时定点的进行从而养成蜘蛛的爬行习惯;如果是大型站点,就需要大量更新内容,视网站情况而定;

  2、网站地图:吸引蜘蛛爬行网站,通过网站地图来为蜘蛛进行带路引导,蜘蛛一般在抓取网站的时候,会首先抓取robots文件,所以将地图放在robots里面是指引蜘蛛抓取地图,从而爬行网站内容;

  3、外链引导:网站优化从外部使蜘蛛进入自己的网站页面,通过使用外链平台,发布纯文本链接,蜘蛛在抓取平台页面时会进入都我们的网站页面引导蜘蛛进行对网站进行爬行;

  网站蜘蛛日志分析,是SEO通过数据来对网站进行优化从而针对蜘蛛进行处理错误的一个基础技术;网站蜕变之路是必经SEO网站蜘蛛日志分析的,站点之中有较多的文件与文档不会蜘蛛不会喜欢抓取,从而需要进行系统的排除;

分享:

@2013-2020 点瑞科技 版权所有    免责声明:站内图片、内容、字体来自网络,如有侵权联系删除  蜀ICP备20011026号-5