Categories


Tags


网站日志的分析是每个SEO人员的必备技能之一

每个做SEO的站长们都应该基本分析网站日志的能力。因为通过网站的日志可以分析出搜索引擎蜘蛛的动态,用户访问的动态,以及发现网站哪些链接存在异常。

网站日志的分析和诊断就像给网站看病一样,我们通过网站日志的分析,可以更加清楚的知道网站的健康状况,可以利于这些数据让我们更好的做网站SEO优化。下面就和大家说下日志分析的一些事项:

常见的蜘蛛名称:

Baiduspider;Baiduspider-Image;Googlebot;Googlebot-Image;360Spider;sogou spider。

一、网站日志的重要作用?

1、通过网站日志可以了解蜘蛛对网站的基本爬取情况,可以知道蜘蛛的爬取轨迹和爬取量,通过我们的网站日志,外链的多和少和网站蜘蛛的爬取量是有直接影响的,我们所说的链接诱饵就是如果你做了一个外链,蜘蛛在爬取这个外链页面并把页面放出来时,蜘蛛可以通过你留的这个链接来爬取你的网站,而网站日志正是会记录下蜘蛛的这次爬取行动。

2、网站的更新频率也和网站日志中蜘蛛抓取的频率有关,一般来说更新频率越高,蜘蛛的抓取频率越高,而我们网站的更新不但仅只是新内容的添加同时还有我们的微调操作。

3、我们可以按照网站日志的反应情况,对我们的空间的某些事情和问题提前进行预警,因为办事器如果出问题的话在网站日志中会第一时间反映出来,要知道办事器的不变速度和打开速度两者都会直接影响我们的网站。

4、通过网站日志我们可以知道网站的那些页面是很受蜘蛛欢迎的,而哪些页面是蜘蛛连碰都不去碰的,同时我们还能发现有一些蜘蛛由于是过度爬取对我们的办事器资源损耗是很大的,我们要进行屏蔽工作。

二、如何下载日志及日志设置注意事项?

1、首先我们的空间要支持网站日志下载,这一点是很重要的,在我们购买空间之前必需要先问好支不支持网站日志下载,因为有的办事商是不提供这项办事的,如果支持的话空间后台一般都有日志WebLog日志下载这个功能把它下载到根目录在用FTP传到当地就可以,办事器的话可以设置将日志文件下载到指定路径。

2、这里有个很重要的问题,网站日志强烈建议设置成每小时生成一次,小型的企业站和页面内容较少的网站可以设置成一天,它默认是一天,如果内容多或者大型站设置成一天生成一次,那么一天只生成一个文件,这个文件会相当的大,我们有时电脑打开是会造成死机,设置的话找空间商协调设置即可。

三、网站日志的分析。

1、日志的后缀名是log的我们用记事本打开,选择格式里的自动换行这样看起来便利,同时用搜索功能搜索BaiduSpider和Googlebot这两个蜘蛛。

例如:

百度蜘蛛 2012-03-13 00:47:10 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo+(+ baidu /search/spider ) 200 0 0 15256 197 265

谷歌机器人 2012-03-13 08:18:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1+(+ google /bot ) 200 0 0 985 200 31

我们分段来解释

2012-03-13 00:47:10 蜘蛛爬取的日期和时间点;W3SVC177 这个是机器码这个是惟一的 我们不去管它;116.255.169.37 这个IP地址是办事器的IP地址;GET 代表事件,GET后面就是蜘蛛爬取的网站页面,斜杠就代表首页,80 是端口的意思,220.181.51.144 这个IP则是蜘蛛的IP,这里快排发包技术小编告诉大家一个辨别真假百度蜘蛛的方法,我们电脑点击开始运行输入cmd打开命令提示符,输入nslookup空格加蜘蛛IP点击回车,一般真百度蜘蛛都有本身的办事器IP而假蜘蛛则没有。

如果网站中出现了大量的假蜘蛛则说明有人冒充百度蜘蛛来采集你的内容,你就需要注意了,如果太跋扈獗那会很占用你的办事器资源,我们需要屏蔽他们的IP.

200 0 0这里是状态码 状态码的意思可以在百度里搜索下;197 265最后两个数字则代表着拜候和下载的数据字节数。

2、我们分析的时候先看看状态码 200代表下载成功,304代表页面未修改,500代表办事器超时,这些是一般的其他代码可以百度一下,对于差别的问题我们要处理。

3、我们要看蜘蛛经常爬取哪些页面,我们要记录下来,分析他们为什么会经常被蜘蛛爬取,从而分析出蜘蛛所喜欢内容。

4、有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。


Public @ 2011-11-26 15:32:55

以SEO为目的的行业分析,需要考察哪些方面呢?

以SEO为目的的行业分析需要考察以下方面: 1. 竞争对手分析:分析领域内的竞争对手,包括在谷歌和其他搜索引擎中排名前几位的网站,他们的优势和弱点等。 2. 关键词研究:研究行业内网站及产品所需的关键词和热门词汇,并分析这些关键词的竞争性和搜索量。 3. 网站结构分析:分析网站结构对SEO的影响,包括网站的布局、页面设计、内链关系和内容等。 4. 内容分析:分析行业内网站的内容,包括网站文

Public @ 2023-05-26 11:50:17

为什么大家都喜欢列表

网络上,列表式的文章总是很受欢迎,这篇文章以身作则的列出了列表式文章受欢迎的8个理由。1. 能够迅速的得到知识。2. 不需要多少思考。3. 列表具有权威性。4. 容易记的住,以便在谈话中引用。5. 易于浏览和略读。6. 有着统一的格式。7. 列表式文章都有结尾,而不会出现个待续之类的。8. 人们喜欢计数。来源:http://www.netbusinessblog.com/2007/02/03/8-

Public @ 2021-04-13 15:18:33

服务器日志是什么?如何查看服务器日志?

服务器日志是指服务器所生成的记录了各种系统操作、网络请求、资源使用、错误信息等记录的文件。通过查看服务器日志,可以了解服务器的运行状态和问题,以便及时发现和解决各种问题。 具体查看服务器日志的方法取决于服务器的操作系统和日志管理工具的不同。以下是一些常见的查看服务器日志的方法: 1. 使用命令行工具:在Linux或UNIX系统中,可以使用命令行工具如tail、grep、less来查看日志文件。

Public @ 2023-08-01 04:00:18

怎样看原始日志文件

读者hiisee问请问如何用PHP脚本在后台获取蜘蛛的详细信息呀?如哪里的蜘蛛/何时来的/搜索了哪几个页面/哪些它喜欢哪些不喜欢等,和判断浏览器是不是用一样的技术?谢谢,再次麻烦您了.刚好关于流量统计和分析以前还没有谈过,这两天分几个方面专门谈一下。今天先来谈作为SEO,怎样读服务器原始日志文件(server raw logfile)。网站服务器会把每一个访客来访时的一些信息自动记录下来,存在服务

Public @ 2013-10-12 15:32:49

更多您感兴趣的搜索

0.431156s