XML地图 深圳SEO培训为广大SEO爱好者提供免费SEO教程,致力于SEO优化、SEO服务
首页 > SEO教程 » 爬行、抓取、索引、收录,指的都是什么?

爬行、抓取、索引、收录,指的都是什么?

2018-11-06T22:01:24 | 人围观 | 关键词:爬行、抓取、索引、收录,指的都是什么?--SEO培训


  爬行、抓取、索引、收录,指的都是什么?
 

  1.爬行是什么?
 

  爬行指的是搜索引擎蜘蛛从已知页面上解析出链接指向的URL,然后沿着链接发现新页面(也就是链接指向的URL)的过程。当然,蜘蛛并不是发现新URL马上就爬过去抓取新页面,而是把发现的URL存放到待抓地址库中,蜘蛛按照一定顺序从地址库中提取要抓取的URL。
 

  2.抓取是什么?
 

  抓取是搜索引擎蜘蛛从待抓地址库中提取要抓的URL,访问这个URL,把读取的HTML代码存入数据库。蜘蛛的抓取就是像浏览器一样打开这个页面,和用户浏览器访问一样,也会在服务器原始日志中留下记录。
 

  3.索引是什么?
 

  索引指的是将一个URL的信息进行整理,存入数据库,也就是索引库,用户搜索时,搜索引擎从索引库中提取URL信息并排序展现出来。索引的英文是index。索引库是用于搜索的,所以被索引的URL是可以被用户搜索到的,没有被索引的URL用户在搜索结果中是看不到的。
 

  要注意的是,所谓“一个URL的信息“,并不限于蜘蛛从URL上抓取来的内容,还有其它来源的信息,如外部链接、链接的锚文字等。有时候,索引库中关于这个URL的信息,根本没有从这个URL抓取来的内容,但搜索引擎知道这个URL的存在,并且有一些其它的信息。抓取和索引并不相同。
 

  4.收录是什么?
 

  收录和索引几乎没有区别。只不过收录是从搜索用户角度看的,搜索时能找到这个URL,就是这个URL被收录了。从搜索引擎角度看,URL被收录了,也就是这个URL的信息在索引库中存在。英文并没有收录这个词,和索引用的是同一个词index。
 

相关内容推荐:

Top