今天一早我习惯性的在Google及百度里site了一下前两周做的新站,结果惊喜的发现两个引擎居然都放出了收录。这次两个引擎居然步调如此的一致,心里感到一些蹊跷。会不会是因为Google真的开始“学习”百度对新站也设置了收录考察期?又或者是因为我这次的提交方法不同以往?想法再疯狂一点,Google盗用百度的垃圾信息处理技术?-_-\\b 越说越离谱了,还是讲讲这次我的操作情况吧。同时也希望与大家一起交流交流。
该站是一个使用kingcms5.0搭建的美容护肤类小站,内容围绕几个长尾关键词进行组织。IP量很低很低,加上相关词总IP量不过两、三百。由于我是第一次学习使用KC系统,所以在本地制作的时间很长,虽然后来很早就解析了域名,但一直没有做任何引导,通过分析IIS日志也可证明一直没有spider爬行。最后在未完成雏形的情况下于10月15日正式开始引导,我在两个已经收录的网站首页分别加上了链接,并未在引擎中进行提交,百度及Google蜘蛛当日即爬行了本站。之后蜘蛛几乎每天都光顾,直到今天才能在引擎中查出结果。其中百度收录6篇,Google收录21篇,仔细查看快照日期发现都是10月15日的。再对收录情况进行仔细分析我得出了一些猜想:
1、严格来说本站并不是10月29日得到收录,而是引导当天(10月15日)就已经被引擎收录到了数据库中,只是在10月29日那天才能查询出结果而已。我估计这中间的两周时间是引擎对互联网中新内容的第一个考查期。
2、两个引擎收录的内容不同,百度只收了首页及一个栏目下的一些页面。而Google则大量广泛的收录了全站的多篇文章。事实证明Google的收录数还是多于百度,站中文章绝大多数都为纯人工转载,那么这是不是说百度鉴别重复内容的能力强于Google呢?其实未必,因为我的原创文章百度同样没有收录,而Google还是像以往一样原创必收。那么百度究竟是因为什么原因只收录了一个栏目的内容呢?再仔细查看两个引擎中的快照,我有了更多的猜想:
本站有四个栏目,分别为栏目A B C D ,其中栏目A中已经充实了较多的文章,其它三个栏目文章数很少。且几个栏目页的布局完全一样:上下部分为导航、banner、版权说明等信息,右侧sidebar都为完全相同的文章列表(包括热门、精选、专题等)。唯一不同的只是左边列出的该栏目下文章列表,但由于BCD三个栏目下文章极少,所以显得这几个栏目相对于栏目A的不同点过少,因此我猜测这是百度不收录这三个栏目的原因。由于栏目页被认定为无价值重复页,所以栏目下链接的文章自然也没有被收录。
3、各种现象都显示出Google也开始注意考察中国新站内容的价值了,也开始采用延长收录考查期这样的策略(有待证实)。前段时间我使用提交页进行直接提交的新站不到一周就能被Google放出,我在门户博客写的文章在引导下更是可以达到几小时内收录。当然,这其中也许还有网站权重的原因。也许在Google看来,使用引导法收录网站就应该增加考查期而已吧。
本文标题中提到的百度与Google收录新站一样快,并不是指百度收录的速度有了提高,而是指Google的收录更为谨慎了。虽然本案例没能给大家带去加快百度收录的方法,但通过其中两个引擎收录情况的对比分析,也许可以对百度收录网页标准及策略的研究提供一些参考。