1、百度蜘蛛抓取了不存在我们网站上的链接(也绝对不是外链导致的问题)
不是...
百度进网页第一件事是找robots.txt.因为这个文件里可以屏蔽哪些路径是不要百度去爬取的.
相关的你要先了解下robots.txt的知识.
2、最近一个月我网站的百度抓取都出现链接超时异常,谁能帮忙分析一下??
楼主,解决了没有啊,我也遇到这种情况了,help
3、百度站长平台上抓取诊断一共四个页面,3个失败,报错是其他错误,抓取时间是3秒。怎么判断问题在哪?
抓取失败是链接错误的吧,应该是网站内部链接的错误,你改成https后,链接会不会也要改什么的,你查看看吧。找个优化人员做个SEO检测报告,看看问题出在哪吧
4、SEO百度抓取诊断失败,链接失败,请问是什么原因?
有以下几点原因
1,检查网站robots文件是否屏蔽百度蜘蛛
2,网站服务器是否稳定
3,百度有时抽筋,过段时间再试就好了
5、百度站长工具老是显示抓取异常的链接
这个我的网站也有的 都有以前做做站的资料 等更新的就好了 我的是站长汇免费友情链接平台
6、网站日志分析百度有抓取 在百度站长抓取诊断却是抓取失败是怎么回事啊
鉴于这种情况,是可以暂时忽略的,因为你没有屏蔽,第二网站日志都有抓取,第三网站收录应该也都是正常的,网站索引也都有,这可能是你的抓取工具出现异常,如果它连首页不抓取,那你的栏目页,和文章页抓取也都是异常,如果都是异常,自然你的百度收录和索引的数据也应都是0,毕竟抓取不到,那就是错误的网页,百度不会建立索引和放出快照,因此如果你的以上都正常,暂时可以忽略这个工具。
反馈一下,等他们回复再做下一步打算。
7、百度蜘蛛抓取异常的原因?
有一些网页,内容优质,用户也可以正常访问,但是Baispider却无法正常访问并抓取,造成搜索结果覆盖率缺失,对百度搜索引擎对站点都是一种损失,百度把这种情况叫“抓取异常”。对于大量内容无法正常抓取的网站,百度搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、排序上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。
下面向站长介绍一些常见的抓取异常原因:
1,服务器连接异常
服务器连接异常会有两种情况:一种是站点不稳定,Baispider尝试连接您网站的服务器时出现暂时无法连接的情况;一种是Baispider一直无法连接上您网站的服务器。
造成服务器连接异常的原因通常是您的网站服务器过大,超负荷运转。也有可能是您的网站运行不正常,请检查网站的web服务器(如apache、iis)是否安装且正常运行,并使用浏览器检查主要页面能否正常访问。您的网站和主机还可能阻止了Baispider的访问,您需要检查网站和主机的防火墙。
2,网络运营商异常:网络运营商分电信和联通两种,Baispider通过电信或网通无法访问您的网站。如果出现这种情况,您需要与网络服务运营商进行联系,或者购买拥有双线服务的空间或者购买cdn服务。
3,DNS异常:当Baispider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baispider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。
4,IP封禁:IP封禁为:限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,在这里特指封禁了BaispiderIP。当您的网站不希望Baispider访问时,才需要该设置,如果您希望Baispider访问您的网站,请检查相关设置中是否误添加了BaispiderIP。也有可能是您网站所在的空间服务商把百度IP进行了封禁,这时您需要联系服务商更改设置。
5,UA封禁:UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA封禁。当您的网站不希望Baispider访问时,才需要该设置,如果您希望Baispider访问您的网站,useragent相关的设置中是否有Baispider UA,并及时修改。
6,死链:页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
对于死链,我们建议站点使用协议死链,并通过百度站长平台--死链工具向百度提交,以便百度更快地发现死链,减少死链对用户以及搜索引擎造成的负面影响。
7,异常跳转:将网络请求重新指向其他位置即为跳转。异常跳转指的是以下几种情况:
1)当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或者首页,百度建议站长将该无效页面的入口超链接删除掉
2)跳转到出错或者无效页面
注意:对于长时间跳转到其他域名的情况,如网站更换域名,百度建议使用301跳转协议进行设置。
8,其他异常:
1)针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。
2)针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。
3)JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
4)压力过大引起的偶然封禁:百度会根据站点的规模、访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样Baispider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取
8、百度抓取失败,链接重定向次数超过5次的上限
去测试一下你的服务器,看看有没有问题。然后去看看你的站点得网络日志的爬行情况,看看是来了没有爬去到还是根本就没进入站点。
9、百度站长平台显示网站连接超时,怎么解决
首先怀疑的是不是设置禁止抓取的规则影响了,因为修改规则比较频繁,于是百度反馈一下
站长平台 【抓取异常】 【连接超时次数】 包不包括服务器反回403的状态码
站长平台回复:
您好,抓取异常下如果出现403错误,可以在下方的具体链接错误进行查看,上方图示只展现链接超时、无法抓取和连同等错误问题。感谢您对百度的关注和支持!
而且自己去掉规则,隔两天还是有抓取失败的情况
那就分析一下什么情况会出现【连接超时次数】
站长平台回复:
您好,分析是服务器稳定性问题造成网站抓取超时,目前网站的整体抓取情况良好。感谢您对百度的关注和支持!
是服务器不稳定吗,于是查一下google的站长平台,没有看到抓取失败的情况
于是这个问题就这样搁下了
今天在dnspod设置域名的时候发现,单独为百度的搜索引擎设置了百度的cdn,难道是这个引起的,百度的cdn在试用的时候就老是502错误,而且还跟百度人员QQ沟通过,回复都是服务器错误,服务器根本没有问题。
把百度的搜索引擎设置直接指向ip,过几天看一下结果发现,没有在出现【连接超时次数】的情况