最近很多朋友都收到过“百度站长平台:请及时清理历史sitemap文件”的邮件了吧,不过这次比较特殊大部分人都是受到了信息,百度出算法都没有给我们发过短信,这个发了短信为什么?因为要清除我们这边的数据,怕误删,以此提醒,下面代代SEO就为大家详细讲下这个是什么意思,我们站长应该如何应对。
百度原文邮件提示:
尊敬的搜索合作伙伴:
您好!为了提升站点新资源的处理效率,避免旧数据过多造成站点数据抓取与处理异常,请于11月9日之前尽快删除超出站点配额的历史sitemap文件(包括普通收录与死链数据)。如到期未处理,系统将统一删除。感谢您的关注与支持!
这则消息主要表达的意思就是:如果你是一个老网站,在长周期运营的过程中,如果自己提交了大量的sitemap地图文件,超出了百度搜索资源匹配的给到的配额,我们最好合理性的选择去删除一部分,否则截止到规定时期,系统可能会自动从最早的开始删除。其中,乐天提醒大家:核心目的主要是:节省网站匹配的数据提交资源,目的是希望站长把现有的配额分配到给网站有价值的目标URL。
什么是历史sitemap文件!
这个文件就是我们网站地图,提交到百度的站长平台去引导收录,这个是以前的收录方法,现在很少人在用这个技术,因为百度后来出了智能推送,自动推送,快速收录和普通API推送这类。所以sitemap,使用的人并不多,只不过之前很多人使用,使用后,一直存在在站长平台也没有删除。所以引发了百度的持续抓取,浪费抓取量,也会误判一些网站,值得注意的是,百度还提到配额问题,每个网站可以提交sitemap配额都是不同的,有的是10000,有的是10万,这个目前没有准确查询接口,不过可以通过普通提交配额可以进行估算。
什么是误判网站?
举个例子,加入这个网站是5年前被人在运营的,上传提交了很多sitemap,然后一直在保留,等你接手以后哪,就直接运营了,内容被你改了,很多以前的内容都丢失了,但是站长平台还有很多以前的sitmap,索引数据,百度一样会去抓取,当百度识别里面的链接80%都是死链,无法访问的时候,很容易降低你当前站点的评分,从而引发降权,这个大家了解吧。
百度的用意!
这个我们不得不说,sitemap,很多人提交了以后,就不管了,其实sitemap是有一定生效周期的,如果抓取过了,就没有必要去持续提交了,如果我们的站长平台都保留大量的sitemap,百度会浪费很大一部分的抓取量,在抓取的时候很容易出异常,毕竟有很多链接是不存在的,所以会造成网站排名波动,或者百度数据库的异常情况,所以删除对我们站长,和百度都有好处,我也是比较支持百度这样去做。
最后要说一下,如果你发现百度抓取率较低,你可以使用sitemap,或者网站层级比较多的情况下,但是提交一个月以后,如果百度那边提示抓取数量和你sitemap数量差不多的时候,就要删除,重新提交新的,这个是目前比较正确的做法,一般新站提交sitemap,或者层级超过3级别的网站提交的比较多,但是目前主流的做法是直接去用API提交每一条链接,效果会更加快速一些,好了,就讲解到这里吧。