1、SEO优化如何进行网站日志分析
网站日志中数据量过大,所以我们一般需要借助网站日志分析工具来查看。常用的日志分析工具有:光年日志分析工具、web log exploer 、WPS表格等
117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatible; MSIE8.0;Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)"
分析:
117.26.203.167:来访ip
02/May/2011:01:57:44 -0700 访问日期 -时区
GET/index.php HTTP/1.1 根据HTTP/1.1 协议 抓取(域名下)/index.php 这个页面(GET表示服务器动作)
500:服务器响应状态码
服务器响应状态码通常状态码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证 明蜘蛛在这次爬行中顺利的发现了一些新的内容。而301则代表用户所访问的某个页面url已经做了301重定向(永久性)处理,302则是暂时性重 定向。404则代表所访问的页面已经不存在了,或者说访问的url根本就是个错误的。500则是服务器的错误。
19967:表示抓取了19967个字节
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0;
AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa
Toolbar表示访问者使用火狐浏览器及Alexa Toolbar 等访问端信息
如果你的日志里格式不是如此,则代表日志格式设置不同。
很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。
抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知,抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断,当然,我们希望百度蜘蛛每日抓取的次数越多越好,这里分享下如何分辨百度蜘蛛《如何分辨真假百度搜索引擎蜘蛛IP》。
有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。
我们分析日志分析时间长了,我们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都可以看出来,这些抓取频率间隔时间是蜘蛛根据网站权重和网站更新频率来自动确定的。
蜘蛛对于我们的页面的抓取是分等级的,是根据权重依次递减的,一般顺序为首页、目录页、内页
2、SEO怎么分析服务器日志,服务器日志到底看哪些数据
蜘蛛日志,一般看的数据:
1.查看搜索引擎什么时候来过我们网站,是哪个搜索引擎,内谷歌还是百容度还是其他。
2.查看网站状态码,发现网站的情况
3.查看是否被竞争对手采集或是攻击等
多看多分析有好处的,SEO重要的是思路
3、有没有人知道,我们要学会如何去看我们服务器日志、我们该怎样查看服务器日志,我是做seo的,有关的方面
利用Windows 2003服务器的远程维护功能,并通过IE浏览界面,就能对服务器的日志文件进行远程查看了,不过默认状态下,Windows 2003服务器的远程维护功能并没有开通,需要手工启动。
查看服务器日志文件的作用
网站服务器日志记录了web服务器接收处理请求以及运行时错误等各种原始信息。通 过对日志进行统计、分析、综合,就能有效地掌握服务器的运行状况,发现和排除错误原 因、了解客户访问分布等,更好的加强系统的维护和管理。
对于自己有服务器的朋友或是有条件可以看到服务器日志文件的朋友来说,无疑是了 解搜索引擎工作原理和搜索引擎对网页抓取频率的最佳途径。
通过这个文件,您可以了解什么搜索引擎、什么时间、抓取了哪些页面,以及可以知 道是主搜索蜘蛛还是从搜索蜘蛛抓取了您的网站等的信息。
访问原理
1、客户端(浏览器)和Web服务器建立TCP连接,连接建立以后,向Web服务器发出 访问请求(如:Get),根据HTTP协议该请求中包含了客户端的IP地址、浏览器类型、 请求的URL等一系列信息。
2、Web服务器收到请求后,将客户端要求的页面内容返回到客户端。如果出现错误,那么返回错误代码。
3、服务器端将访问信息和错误信息纪录到日志文件里。
下面我们就对本公司自己服务器其中的一个日志文件进行分析。由于文件比较长,所以我们只拿出典型的几种情况来说明。
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2006-05-12 03:56:30
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2006-05-12 03:56:30 三圆三圆三圆** 218.25.92.169 GET / - 80 - 220.181.18.98 Baispider+(+http://www.baidu.com/search/spider.htm) 403 14 5
/* 说明 */
上面定义了在2006年5月12日的3点56分30秒的时候,IP为220.181.18.98的百度蜘蛛通过80端口(HTTP)访问了IP为218.25.92.169的服务器的根目录,但被拒绝。
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2006-05-12 10:18:39
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2006-05-12 10:33:36 三圆三圆三圆** 218.25.92.169 GET /***/index.htm - 80 - 10.2.57.6 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1) 200 0 0
2006-05-12 10:33:36 三圆三圆三圆** 218.25.92.169 GET /***/***/***.gif - 80 - 10.2.57.6 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1) 200 0 0
/* 说明 */
上面定义了在2006年5月12日的10点33分36秒的时候,IP为10.2.57.6的用户正常访问了网站三圆三圆三圆**中***目录下的index.htm页和***/***下的***。gif图片。
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2006-05-12 13:17:46
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2006-05-12 13:17:46 三圆三圆三圆** 218.25.92.169 GET /robots.txt - 80 - 66.249.66.72 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 404 0 2
2006-05-12 13:17:46 三圆三圆三圆** 218.25.92.169 GET / - 80 - 66.249.66.72 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 403 14 5
/* 说明 */
上面定义了在2006年5月12日的13点17分46秒的时候,IP为66.249.66.72的Google蜘蛛访问了robots.txt文件,但没有找到此文件,有访问了此网站的根目 录,但被拒绝。
现在也有很多日志分析工具,如果您的服务器流量很大的话,作者推荐使用分析工具来分析服务器日志。
Windows独享主机如何查看服务器系统日志?
服务器系统日志是记载着服务器每时每刻的信息的一个数据库,上面记载着的一些信息对于我们了解服务器的运行状况都有很大的帮助。
查看方法:登陆服务器后进入控制面板—管理工具—事件查看器
4、有懂SEO的请帮帮我,急求服务器日志问题
403错误是资源不可用,服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。
1、查看一下服务器的权限设置是不是有问题。
2、search.php没有必要用robots屏蔽掉吧!
5、SEO如何查看日志代码
博客优化1、是网站标题的优化,包括博客的标题,每一篇文章的标题,它和网站的关键词优化有相通之处,对自己的博客进行定位,然后对自己的核心关键字进行组合,把这些组合放到标题中去。在文章的开头,要适当的进行关键字的重复,但不能恶意的重复,是到哪个的加粗也可以的。2、博客的标题是要大于内容的,别人第一眼看到的是你的标题,标题能不能吸引人就决定了博文或不会被打开3、可以再图片或者文字上加一些超级链接,这些链接可以链接到在自己想让浏览者看到的页面,比如公司的页面或者产品页面4、博文上要图文相间,主题明确,协调美观博文最好是原创的,或者进行伪原创处理,搜索引擎会对转载的或者镜像的文件不收录的。你也要想各个搜索引擎提交自己的博客这是我个人见解,呵呵
6、服务器日志对seo站长有何作用
不管是新站还是抄老站,对于搜索引擎的抓取都需要掌握,不管是抓取的链接还是没抓取的链接都需要了解,这样才能够对于没有抓取的链接进行优化修改内容。那么对于这些资讯都从哪里获取呢?服务器日志就是记录搜索引擎对网站抓取的记录,以及搜索引擎对于链接的返回码状态都能够查看到。
http://www.chengjv.com/youhua/20170728435.html
7、seo每天工作日志报表要怎么写
如果说,你的网站快照不更新、快照后退甚至是网站被降权,你铁定去查看网站有没有定期更新原创,以及去看网站的哪些友情链接出问题了,其实,在百度搜索引擎上,快照后退、不更新都是正常的,而这并非是你网站和你网站有交换链接的网站出问题了,这只是百度给网站的快照滞留或者是没放出来,你要做的就是每天的定时更新原创和发布外链。那么怎么去判断,你的网站出现这些情况不是自己的问题?这就要看你有没有每天观察网站日志:
网站日志的分析永远是最全的也是最准的,通过网站日志我们可以知道搜索引擎蜘蛛在我们网站的爬行情况以及停留时间,以及查询网站内容是否被收录知道网站那些地方在蜘蛛访问时出现了错误信息!好,了解了观察日志的好处,:要做网站日志分析首先得先获得网站日志,我想肯定有很多人在自己的网站根目录中找不到自己的网站日志,那是因为你没有在主机后台开启获取网站日志的功能,只要在主机后台开启获取网站日志,那么第二天就能在网站根目录下一个名称为log的文件夹中找到网站日志。找到网站日志以后,把它下载到本地,因为日志中都是记录的蜘蛛的爬行状态,这个我们看可能看不懂,我们要借助一个工具(光年日志分析工具,直接百度搜索可以下载到!)这个工具可以帮我们快速分析网站日志,直接把结论展现给我们,我们要做的就是建立一个EXCEL表格记录这些数据,这些数据要长期坚持记录,这样,我们才能够分析出蜘蛛长期在我们的网站的爬行趋势从而知道我们网站的发展方向!
数据永远是最直接、最有说服力的,做SEO要注重数据的分析,这个应该是作为一个SEOer最基本的技能了。关于记录日志表格应该包括的内容有抓取量、抓取次数、爬行时间、不重复抓取量、单个爬虫的平均爬取量、单个爬虫的平均爬取时间、爬虫爬取所遇到的404页面的次数!每天花点时间记录下来这些数据才能知道你网站的发展情况,而不是空洞的感觉怎么样,做为SEO应该学会用数据说话,因为往往数据比想象更有说服力!
8、如何查看网站seo日志?
搜外网告诉你怎么查看网站日志文件的位置主要有以下几个步骤:
1.使用远程链接方式进入服务器
2.找到IIS管理器
3.打开IIS管理器
4.点击本地计算机下的网站按钮
5.找到要查看网站日志的网站
6.右键点击要查看的网站,然后再点属性按钮
7.进入网站属性面板,再选择头部的网站按钮
8.网站面板下面有个“活动日志格式”这快,我们再点击下“属性”按钮
9.好了,在属性面板下面的“日志文件目录”,我们就可以看到网站的日志文件在什么地方了。
9、谈谈每天的SEO工作日志怎么写
上次笔者在《网站日志在SEO中担任着怎样的角色?》已经简单了介绍了网站SEO工作中对于网站日志的简单查看,提及了日志的重要性。其实在笔者看来,网站日志所呈现的每一条记录与其说是痕迹,不如说是镜像来的贴切。上次笔者提到了,很重要的一点,也是很多人容易陷入的误区就是:百度蜘蛛是先进入你的网站,再去查看内容质量而不是先知道内容质量再决定用什么IP去查看。很多读者对此很不屑,今天笔者,就拿出证据给你们看。 请看以上红笔圈出的部分,同样页面一天内爬行了两次,两个IP分别是220的页面,而非带 www的链接。所以笔者就把这个平台理解为是一个高质或者高效的平台。 第三,综合的指导。经常性我们在日志里可以发现一些返回值不是200的条目,而通过日志的返回值我们就可以很容易地找到,这个页面,并且对于这个页面的错误或者不足进行修改。而通过对于网站每天日志的对比记录,我们可以发现,蜘蛛每天来网站的次数是增加了还是减少了。如果增加了,是一些友好的IP还是不好的IP,这些记录又是从哪个入口进入的。从而分析出我们在日常的网站SEO工作中,在哪些方面是做得比较好的,哪些方面是不足的。 当然日志的作用还有很多,我相信它给每个站长所带来的信息也不止于此,笔者也只是一个皮毛的研究者。笔者在这里给每一个站长一个建议:每天第一件事就是去查看你昨天的工作记录,然后与网站日志对比下,从而找出工作中好的与不好的地方。在笔者看来,保证网站关键字排在第一位并不是不可能,那只是官方的说法而已。只要你做好网站优化的每一项工作,第一只是早晚而已。至少每一个站长都要有一颗第一的心。 本文由联科科技提供,转载请注明出处。
10、如何做好网站服务器日志在优化中的重要作用
网站服务器日志在项目中的一些常见的用法及作用。
1.发现错误页面
通常情况下,网站SEO 负责人会对自身网站结构有清晰的认识,非常了解什么地方有什么页面。但是由于一些产品功能、交互的原因,或代码方面的原因,或其他原因,会有一些意料之外的错误页面生成。而且很多情况下,这些错误的页面的量级很可能还不小,从而对网站优化造成不小的麻烦。这种时候,只有通过日志才能发现。
2.修正抓取分布
对于大型站点,尤其是海量数据的网站,相对每个页面资源来说,其获取到的抓取资源也是非常有限的。这很有可能就会导致一些版块的优化产生问题。比如网站有10个核心的栏目内容,但是其中有5 个是被爬虫频繁抓取的版块,而另外5 个版块爬虫很少光顾,从而导致这5 个版块的SEO 很不好。从数据上看,就是前5 个栏目的SEO 表现非常好,后5 个栏目的SEO数据非常难看。这种问题,通过日志分析,也很快就能找出来。找到问题后,通过一些技术手段,将抓取资源引导到后5 个栏目,能够达到事半功倍的效果
3.发现内容问题
SEO中有一个点很难把握,就是页面内容的质量到底好不好? 这种具体的情况很难判断,因为牵涉这个页面本身,以及这个页面在网站内、页面在行业内,甚至页面在整个互联网内的相对价值有多高。有可能我们自身认为某个页面的内容的价值很高,但是,把它放在更大范围来看,相对价值就非常低。从而使得其排名、流量表现都非常差。因为搜索引擎简单来说就是一个排序,并不是说你本身优秀就可以,你还需要做到比别人更优秀,才有可能有出头的机会。
做好日志分析可以帮助我们在优化中分析和处理网站在优化中遇到的一些问题,使我们的工作更加高效,少走弯路。