XML地图 黑帽SEO培训为广大SEO爱好者提供免费SEO教程,致力于SEO优化、SEO服务
首页 > SEO教程 » 镜像网站是什么?网站被镜像怎么办?

镜像网站是什么?网站被镜像怎么办?

2018-09-24T14:50:42 | 人围观 | 关键词:镜像网站是什么?网站被镜像怎么办?--SEO培训


  在SEO工作中,经常有人讲,网站被“百度镜像”了,实际上这里讲的并不是百度镜像了你的网站,而是你的网站被镜像,百度收录了这个网站而已。
 

  对于这个问题,SEO人员需要理清思路,分清主客体,这样才能提供解决方案。



 

  什么是恶意镜像网站?
 

  镜像网站指的是和你的网站基本一样、并且实时同步的其它网站。就像照镜子一样,所以名为镜像。
 

  有的镜像网站是没有恶意的,很可能是你自己设置的,为了方便用户能从多个域名访问网站,被封了一个,还有其它的域名。比如著名的草榴社区,好像就有很多镜像可以访问。
 

  有的镜像,也就是这里讨论的镜像,是不怀好意的,通常是别人设置的,要么为了负面SEO你的网站,要么为了利用你的内容获得排名,然后把用户转向到敏感、非法内容网站上去。
 

  网上有的文章把采集和镜像混在一起。虽然表现形式差不多,但严格来说,采集和镜像实现方法、表现形式是有区别的。
 

  采集的网站一般是提前抓取别人网站的内容,放入自己数据库,再用程序调用到页面上。被采集网站有新内容时,采集网站并不能实时同步更新,要再采集之后才能出现。一旦被采集,内容已经在对方数据库里了,从技术上是无法阻止采集网站显示这些内容的。这篇帖子说的不是这种。
 

  镜像网站并不事先抓取内容,而是有人访问网站时,实时从被镜像的网站调取内容,做些处理(替换URL、文字,加文字、加JS等),然后实时显示。被镜像的网站有任何更新,镜像网站是实时同步的。
 

  网上有卖用于镜像网站的小偷程序的。小偷程序通常也可以用来做采集。为了不给他们做宣传,就不提名字了。从他们的官网摘取几条程序功能,有助于理解后面的内容:
 

  全自动分析,内外链接自动转换、图片地址、css、js,自动分析CSS内的图片
 

  内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等
 

  伪原创,近义词替换有利于seo
 

  增加URL路由,实现全站URL变换,个性化本站URL地址
 

  超级模板增加移动模板、自定义栏目功能
 

  增加自动获取301、 302 重定向的采集,解决跳WWW,跳https采集
 

  代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施
 

  其实我是挺迷惑,网信办为什么不责令关闭卖小偷程序的网站,这种网站才是真正该关的,而不是另外一些网站。
 

  被镜像有什么危险
 

  从SEO角度看,权重不高的小站、新站,被镜像意味着有其它网站和你的网站内容基本一样,搜索引擎有可能认为你的网站不是原版,镜像网站才是,所以把排名、流量给了镜像网站。
 

  对有一定历史、权重的网站,镜像网站取代原版网站的可能性微乎其微。但从心情角度考虑,被别人镜像,内容被别人偷走,即使没有其它明显后果,也还是挺烦人的一件事。
 

  另一个烦人的事是,镜像网站一般来说并不是要和你提供同样的产品或服务,而是把用户转到赌博、色情等服务上去。有的是通过JS把赌博、色情内容显示给用户,有的直接把用户转向到另外的网站上去。
 

  那么,网站被镜像,该怎么办?
 

  镜像网站是什么意思:
 

  简单理解:网站镜像主要是指,当你访问某个非自身主体网站的时候,对方的站点内容,几乎与你的网站是同步的,它包括:你的内容、图片、站内链接等元素。
 

  百度镜像网站的形式:
 

  ① 内容同步:对方网站拥有自己独立的网站框架与频道,只是在某个栏目,镜像你的内容,这个方式,更倾向于实时同步,并非完全意义上的镜像网站。
 

  ② 主体同步:它主要是指,整站框架以及内容,当用户访问的时候,会实时调用站点内容,站点的每个元素都基本相同,除了域名以外。
 

  ③ 框架同步:实际上这不能算完全意义上的百度镜像,主要的原因是它是利用框架技术实施,并没有在目标网站生成与主站相关的内容,从SEO的角度,危害性并不大。
 

  镜像网站对SEO的影响:
 

  对于镜像网站对SEO的影响,我们主要通过如下两种情况为大家解读:
 

  ① 低权重站
 

  对于网站权重相对较低的域名,对于具有一定权重网站实施镜像,从SEO的角度,它的影响力度不大,毕竟镜像网站,本身也没有积累百度的信任度,它镜像的内容,也不会得到较高排名。
 

  ② 高权重站
 

  对于高权重站去镜像你的内容,通常是一件让人头痛的事,虽然这类网站常常是站群中的一员,但由于对方拥有高权重,也就意味着,百度的信任度很高,那么它如果镜像一个网站的内容。
 

  很容易混淆搜索引擎对内容的评估,这就是为什么大量的熊掌号原创内容,被高权重站采集后,往往排名靠后,以及丢失原创标签的核心原因。
 

  如何处理网站被镜像:
 

  1、屏蔽IP
 

  面对镜像网站,查询对方的IP地址是首要目标,你可以借用统计代码、网站日志分析进行查询,但值得提醒的是,如果你启用了CDN,你需要试图查询原始IP。
 

  2、JS跳转
 

  利用JS跳转到自身域名,这是一种无奈之举,从SEO的角度,它并没有完全解决网站被镜像的问题,但它最起码可以保障网站流量的损失降低到最低。
 

  前提是,对方在镜像网站的时候,保留了你的网站JS文件。
 

  3、官方举报
 

  对于恶意的网站镜像,百度官方提供了多个反馈渠道,你可以通过百度举报与站长搜索资源平台的后台进行相关反馈。

 

相关内容推荐:

Top