制作sitemap.xml文件相信很多站长们都会了,而对于sitemap.xml索引文件,听说的人应该就很少。百度一下“制作sitemap.xml索引文件”其SERP数量也很少。很多站长都是使用的google网站管理员工具,在上传sitemap时有时会出现“sitemap文件过大,,网址数量过多”的提示。出现这种的原因是google明确规定了对于上传给google的sitemp文件中网址应不超过50000条或者压缩后不大于10MB。如果超过这个度就会出现网络服务器因传输过大的文件而超载。
Google给各位站长们提供的解决方法是制作多个sitemap文件,然后将这些sitemap文件写进sitemap索引文件中,接着再提交给google。
然后google也只给各位站长们提供了这样一个思路,具体的操作步骤却没有给出,sitemap索引文件如何写?代表了什么含义?还需要用到哪些工具?我们不得而知。下面代码狗V3就来深入介绍一下。还是举例实在些!
sitemap索引示例:
该 sitemap索引列出了三个 sitemap:
<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex xmlns=”http://www.google.com/schemas/sitemap/0.84″>
<sitemap>
<loc>http://www.codegou.com/sitemap.xml</loc>
<lastmod>2009-07-23</lastmod>
</sitemap>
<sitemap>
<loc>http://www.codegou.com/xml/sitemap2.xml.gz</loc>
<lastmod>2009-07-23</lastmod>
</sitemap>
<sitemap>
<loc>http://www.codegou.com/xml/sitemap2.xml.gz</loc>
<lastmod>2009-07-23</lastmod>
</sitemap>
</sitemapindex>
<loc>标记并用其来识别 Sitemap的位置。
<lastmod>是可选标记,用于指示Sitemap文件的修改时间。
<sitemap>封装单个 Sitemaps 的相关信息。
<sitemapindex>会压缩有关文件中的所有 Sitemaps 的信息。
前面这些大多数人通过网络都可以了解到,对于示例中的
http://www.xxx.com/sitemap1.xml.gz后的gz却有点不解,其实很简单,gz格式为xml的压缩格式。
gz为gzip的缩写,gzip最初用于UNIX系统的文件压缩,现今已经成为Internet 上使用非常普遍的一种数据压缩格式,或者说一种文件格式。