当前位置:首页 >> 电脑使用指南 >> 网络软硬件使用心得 >> 其它网络软件 >>

解决Google无法抓取Sitemap

来源:51FixPC.Com 作者:杰迪武士 编辑:帝国战猪 日期:11-15 点击次数:


谷歌  SiteMap  GZIP

  从上个月15号开始,51FixPC.Com的SiteMap就不能被Google读取了,提示为网址超时,但是同时HTTP的状态代码为200,这意味着Google能读取到SiteMap文件,但是传送的时候出现了错误。同时,网站验证方面也出现了一些麻烦,只有通过Google的网站管理员工具再次提交才能重新被Google所认证。

  51FixPC.Com的SiteMap使用的是列在Google网站管理员中心“第三方Sitemap”工具中的工具生成的,生成的SiteMap符合Google对SiteMap的格式要求,同时,生成的文件也没有超过Google对于SiteMap的未压缩小于10M、网址不超过50000个的要求。

  在Google的网站管理员支持论坛(http://groups.google.com/group/google-sitemaps-zh_CN?hl=zh-CN)浏览,发现了不少遇到同样问题的朋友。初步分析,是Google对体积较大的SiteMap文件出现了抓取错误(具体到51FixPC.Com的情况,是未压缩的SiteMap文件超过了4M)。


  在那里泡了两天后,一位email为zb(abcd)@yahoo.com.cn的朋友的发言提醒了我。他也遇到了和51FixPC.Com一样的情况,但是他在更改提交的SiteMap文件的格式后,解决了这个错误。我按照他的思路对SiteMap文件进行了压缩,也顺利的解决了Google读取51FixPC.Com SiteMap错误的情况。

图1、Google读取SiteMap已经正常了
  解决方法(以下以SiteMap名称为sitemap.xml为例):
 
  1、下载你的网站的SiteMap到本地(如果你的网站的SiteMap是在本地生成的,则跳过此步);
 
  2、用gzip对生成的xml文件进行压缩,压缩完成后更改文件的扩展名为“.gz”(引号中的内容);
 
  3、将sitemap.gz上传到网站上;
 
  4、重新向Google提交SiteMap。

  如果你不会使用gzip,那么可以使用这个工具包(点击此处下载)。将这个工具包解压缩到一个文件夹中,将sitemap.xml文件放到同一个文件夹中,然后执行runme.bat。新生成的sitemap.gz就是需要上传到网站的文件(注意:执行runme.bat后,原来的sitemap.xml文件将被删除)。以后重新生成sitemap.gz文件,都只需将新的sitemap.xml文件拷贝到这个目录,然后执行runme.bat就可以了。
 


图2、执行runme.bat文件

 

图3、上传生成的sitemap.gz文件

  至于文章开头说的网站不能被验证,那么只要到网站管理员工具那里重新提交一下就可以(当然,得保证要验证的网站符合Google的要求)。

  如果对本文有什么疑问或者建议,请到51FixPC.Com“网站建设与管理”(http://www.51fixpc.com/bbs/index.asp?boardid=15)板块来参与讨论^_^。

 

上一篇:
下一篇:

论坛网络板块新帖

杭州蓝图资讯工作室 版权所有 ©2006~2008
浙ICP备05037491号