百度关键词优化三天上首页!同行都是朋友, 欢迎一起互利共赢。谢绝一切非正规行业服务,感谢以下同行、团队、平台和代理的支持:

百度站长平台、MIP开发小组、SEO焦大老友、SEO每天一贴ZAC大哥、卢松松大哥、海瑶SEO兄弟、附子SEO兄弟、探索者SEO、帮站SEO好友、互点宝、超快排平台

百亿互刷宝、下拉天下、SEO自学网、SEO研究中心、小明SEO、王德春SEO、马海祥博客、踏雪无痕挂机工作室、SEO云优化好友、云客网、杭州思亿欧、网赚吧、北京SEO韩非老弟

需要了解以上同仁的相关信息,我们已经给你做好了搜索框,看右上角绿色那个,输入搜索即刻直达

网站统计: 共有读稿:14367部 / 今日更新:1篇 / 评论:12条 / 会员:48 名 / 阅读:382492
您好,请 【登陆】【注册】
技术学习内容页横幅广告
您现在的位置:SEO平台 > SEO技术学习 >

如何进行网站日志在线分析?

2017.02.07

浏览:

【导语】如果您觉得本篇内容还不错,请点击文章下面的赞,然后分享给朋友哦!...

江西SEO曾庆平本文在大家进行SEO工作之后会用到。 1、网站刚上线,看搜索引擎蜘蛛的抓取情况; 2、网站收录异常,对比日志中蜘蛛的行为情况; 3、解决网站被封问题时,观察日志情况。 网站日志是网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎...请看详情...

seo

seo
江西SEO曾庆平本文在大家进行SEO工作之后会用到。   1、网站刚上线,看搜索引擎蜘蛛的抓取情况;   2、网站收录异常,对比日志中蜘蛛的行为情况;   3、解决网站被封问题时,观察日志情况。   网站日志是网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。   下载日志:   通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。   如图:

log日志的文件夹
  下载查看:   下载、解压、打开日志文件。   日志文件内容如:   61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /seo/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"   (注:百度,这部分为本文添加   203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"   (注:Google)   202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)"   (注:雅虎)   65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)"   (注:MSN)
  搜索引擎蜘蛛   分析日志:   蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider   在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。   我们分析的主要点是,HTTP状态码,如以上的200和301。   " 200 5162 " 代表正常抓取,这次抓取了5162个字节。   不同的服务器或虚拟主机设置的日志记录内容不同。   有的如:200 0 33834 237 953  我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。   有的如:200 0 0或200 0 64  这是没有记录抓取字节数。注意:200 0 0和 200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。   在日志里,发现比较多的HTTP状态码是:200(正常)、304(没变化)、404(错误链接)。   304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。   404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。   返回开篇问题:   1、网站刚上线,看搜索引擎蜘蛛的抓取情况;   如果网站提交给搜索引擎2天后,发现日志里蜘蛛不少,并都返回200,则说明已经可以正常收录。   只是Google展示的时间比较快,而百度则需要20天左右(经验平均值)展示出来。   2、网站收录异常,对比日志中蜘蛛的行为情况;   收录正常增加时和现在异常时的日志,进行对比分析。如果没有异常,则应该是搜索引擎展示数据库出问题所致。   如果蜘蛛爬取量明显减少,观察是否外链突然减少很多。如果日志依然,则认为是搜索引擎的展示问题。   3、解决网站被封问题时,观察日志情况。   网站被封时,往往日志里有百度蜘蛛,但很少,而且往往只访问robots.txt文件和首页。   经过这里的建议:”http://www.qingpingseo.com/seojishu/78.html” 修改后,再提交给百度,之后的2天观察日志情况。   如果一直这样的情况维持1个月,可以考虑放弃该域名。如果蜘蛛明显增加,而且返回200居多,则收录的希望很大,时间问题。   本文相关:   FTP的工具下载和使用指南: ”http://www.qingpingseo.com/jiaocheng/57.html” (FTP工具可以进SEO交流群:109450372 群文件下载   HTTP状态码更多知识:”http://www.qingpingseo.com/jiaocheng/85.html   相关疑问:   1、日志分析工具可以用哪些?   可以在百度搜索下光年日志分析工具金花日志分析工具
  光年日志分析工具   2、提供的样板日志文件里的 http://bsalsa.com/  是什么?   这是一个浏览器插件开发商,日志里有这个代表,采用该插件的用户访问过你的网站。这个不用理会。   3、我的网站怎么没有日志文件?   这个需要主机服务商开通。请联系空间商的技术   4、我的日志里怎么都没有蜘蛛?   很大的可能是,主机没有记录蜘蛛的功能。请看下同主机下其他站点的收录情况是否正常。   如果是win的主机,请看下这里:   【分享】   换了个虚拟空间,这几天分析日志,发现日志格式不大一样,几天下来就是没有搜索引擎爬虫的痕迹,类似于Baiduspider+怎么都看不到,问空间商,空间商也不知道,后来终于知道原来是虚拟空间商那边IIS设置不对,在IIS日志记录属性下的“高级”选项卡下,勾选用户代理(cs(User-Agent))等选项就可以了,否则无法在日志中无法找到蜘蛛的影子;由于无法上传图片,所以就没有上传图片过来,具体可以搜索IIS日志设置。   5、好像日志里收录了,但不一定展示出来?   是的。我们可以看到百度蜘蛛和google机器人访问很频繁,但不一定他们都展示出来。这个目前没有解决办法。但只要它们频繁访问和正常抓取,一切就会很正常。   6、发现日志里蜘蛛情况和之前都一样,但最近收录或排名发生变化,是怎么回事?   这应该属于搜索引擎数据库变更,可以说没有具体对网站进行如何改进来挽救的明显有效措施。   7、日志文件几十M,太大了,用什么打开比较合适?   可以采用 editplus  这个工具。可以SEO交流群:109450372 群文件下载。
 
29
赞一个
关键词:
☆喜欢这篇文章吗?分享给你的好友吧!点击这里复制网址☆
共有106人阅读,期待你的评论!评论
请先登陆后才能发表评论哦!没账号?赶紧注册一个吧!
最新评论
热门标签
回到顶部