当前位置:首页 >> 电脑使用指南 >> 网络软硬件使用心得 >> 其它网络软件 >>
解决Google无法抓取Sitemap来源:51FixPC.Com 作者:杰迪武士 编辑:帝国战猪 日期:11-15 点击次数: 谷歌 SiteMap GZIP从上个月15号开始,51FixPC.Com的SiteMap就不能被Google读取了,提示为网址超时,但是同时HTTP的状态代码为200,这意味着Google能读取到SiteMap文件,但是传送的时候出现了错误。同时,网站验证方面也出现了一些麻烦,只有通过Google的网站管理员工具再次提交才能重新被Google所认证。 51FixPC.Com的SiteMap使用的是列在Google网站管理员中心“第三方Sitemap”工具中的工具生成的,生成的SiteMap符合Google对SiteMap的格式要求,同时,生成的文件也没有超过Google对于SiteMap的未压缩小于10M、网址不超过50000个的要求。 在Google的网站管理员支持论坛(http://groups.google.com/group/google-sitemaps-zh_CN?hl=zh-CN)浏览,发现了不少遇到同样问题的朋友。初步分析,是Google对体积较大的SiteMap文件出现了抓取错误(具体到51FixPC.Com的情况,是未压缩的SiteMap文件超过了4M)。 在那里泡了两天后,一位email为zb(abcd)@yahoo.com.cn的朋友的发言提醒了我。他也遇到了和51FixPC.Com一样的情况,但是他在更改提交的SiteMap文件的格式后,解决了这个错误。我按照他的思路对SiteMap文件进行了压缩,也顺利的解决了Google读取51FixPC.Com SiteMap错误的情况。 ![]() 图1、Google读取SiteMap已经正常了 解决方法(以下以SiteMap名称为sitemap.xml为例):
1、下载你的网站的SiteMap到本地(如果你的网站的SiteMap是在本地生成的,则跳过此步);
2、用gzip对生成的xml文件进行压缩,压缩完成后更改文件的扩展名为“.gz”(引号中的内容);
3、将sitemap.gz上传到网站上;
4、重新向Google提交SiteMap。
如果你不会使用gzip,那么可以使用这个工具包(点击此处下载)。将这个工具包解压缩到一个文件夹中,将sitemap.xml文件放到同一个文件夹中,然后执行runme.bat。新生成的sitemap.gz就是需要上传到网站的文件(注意:执行runme.bat后,原来的sitemap.xml文件将被删除)。以后重新生成sitemap.gz文件,都只需将新的sitemap.xml文件拷贝到这个目录,然后执行runme.bat就可以了。
![]() 图3、上传生成的sitemap.gz文件 至于文章开头说的网站不能被验证,那么只要到网站管理员工具那里重新提交一下就可以(当然,得保证要验证的网站符合Google的要求)。 如果对本文有什么疑问或者建议,请到51FixPC.Com“网站建设与管理”(http://www.51fixpc.com/bbs/index.asp?boardid=15)板块来参与讨论^_^。 |