针对搜索引擎蜘蛛的抓取和收录量提升方法当中,我们会对网站生成一个xml为后缀名称的网站地图文件。那么xml网站地图到底是怎么样的一个概念呢?可能很多从事seo的朋友都忽视了xml网站地图的定义,这也属于seo基础的内容范畴,所以希望朋友们也要关注和了解类似与这样的名词解释。
一般来说Sitemap中的S大写的时候,通常就是指的XML版本的网站地图。是由谷歌在2005年首先提出的,2006年微软、雅虎都宣布支持。2007年各个主要搜索引擎都开始支持通过robots文件指定XML网站地图的位置,这里当然也包括百度搜索引擎。
XML后缀的网站地图是由XML标签组成,文件本身必须是utf8编码的。网站地图文件实际上就是列出网站需要被搜索引擎收录的所有网站页面的URL。最简单的网站地图可以是一个纯文本文件,文件只要列出网站所有的页面URL,一行列一个URL就可以,搜索引擎就能抓取并理解文件的内容了。
XML网站地图文件最多可以列出5万个URL,文件大小不能超过10MB。如果网站需要收录的URL超过5万个,可以使用网站地图索引文件,也就是说分成多个XML网站地图文件。一个网站最多可以有1000个XML网站地图文件,从而可以得到一个网站可以列出5000万个网站页面URL地址。
通过XML网站地图可以通知搜索引擎蜘蛛要抓取和收录的页面,但是只能让搜索引擎蜘蛛知道这些页面的存在,并不能保证一定被收录,搜索引擎还要看这些网站页面的权重是否达到收录的最低标准。所以XML网站地图只是辅助方法,并不能代替良好的网站结构。
大中型网站提交网站地图通常有比较好的效果,能使得收录增长很多。但是对于内容量很少的网站,提交网站地图之后几乎是看不到效果的,很多的站长还会发现对于内容量少的网站提交XML网站地图之后反而会有反效果出现。