Google 沙盒效应

沙盒效应是 Google 对网页排名的一种算法。沙盒效应没有被 Google 正式承认过。

但是,我们认为 Google 是存在一种沙盒效应的算法的。

所谓沙盒效应指的是,新的网站在Google里面很难得到好的排名,无论你怎么优化这个网站。换句话说,一个新的网站,可以有很丰富的相关的内容,可以有大量的高质量的链接,网站既搜索引擎友好,也用户友好,所有一切都优化的很好。但是在一段时间之内,就是很难在Google里面得到好的排名。

Google的Sandbox有点像给予新网站的一个试用期。在这段试用期内,新网站几乎无法在竞争比较激烈的关键词下得到好的排名。

这个现象最早是在2004年3月开始被注意到。沙盒效应更多的是发生在以竞争比较激烈的关键词为目标的网站上。那些不太商业的,竞争比较少的关键词,发生沙盒现象的机会就比较小。

虽然沙盒效应是这一两年最热门的话题,但到目前为止,没有人能够确认确实存在沙盒效应,Google从来没有肯定或否定过。有的人认为,沙盒效应本身就是一个独立的过滤算法,把所有新网站的排名暂时都排到后面。

也有人认为沙盒效应只是一种效应或现象,它本身并不是一个过滤器,而是很多其他排名因素所造成的一个现象而已。比如说,Google确实在近一两年开始在把链接的年龄以及链接页的历史情况都考虑在内。还有网站获得链接的速度,如果一个网站在短时间内获得了大量的链接,Google会怀疑这些链接是买来的,或者是通过作弊手段得到的。这些与时间有关的因素组合起来,就可能对新网站产生这种沙盒现象。

虽然对Sandbox的本质是什么众说纷纭,但一般都认为这种现象是存在的,因为是可以观察到的。

大部分人认为Google之所以会制造这种Sandbox效应,是为了清除那些垃圾网站。通常这些垃圾网站都会快速买大量链接,得到好的排名,赚一笔钱后,这些作弊手段被发现了,网站被删除或被惩罚。但是这些人也不在乎,这个域名也就被放弃了,转而开始做另外一个新的网站。

在Google开始出现Sandbox以后,有可能大部分的这些垃圾网站制造者都没什么耐心,要等他的网站从沙盒里面出来,从而也就不建这些垃圾网站了。

通常沙盒效应会维持六个月,有一些针对竞争性不高的关键词的网站,可能在沙盒里会短一些。行业竞争越高,沙盒效应会越长。

从搜索引擎存在的角度来看,如果搜索引擎能够为用户提供尽可能多的有效信息,那么搜索引擎是有存在的价值的,否则搜索引擎自己也会丢掉属于自己的客户。

这个是搜索引擎的生态造成的,基本上,我们认为所有搜索引擎都有一种算法,来对网页的重要性进行评估。这个评估的过程简单来说就是对网页赋权。如果你的原创内容越多,被用户转载得越多,那么对搜索引擎来说,你的网页显然比垃圾网页显然是重要的。你的网页排名就会尽量的靠前。

其实搜索引擎也在通过一个相对智能的算法找到一些重要名字的最初来源。

举例说明,关键词 Apache。

当搜索引擎的用户,输入 Apache 的时候,搜索引擎需要适当的了解用户输入 Apache 这个词语的用途。Apache 是美国印第安的一个部落名称,同时也是一个非常流行的 WEB 服务器。当用户输入 Apache 的时候,很有可能用户是希望知道 Apache 应用服务器的作用,或者了解美国 Apache 基金会的项目,同时也有可能想了解美国 Apache 的部落。在这里,各个不同的用户具有不同搜索期望值。搜索引擎将会按照哪一种顺序来展现给搜索引擎的用户呢?这个就是搜索引擎需要考虑的内容了。

一般来说,搜索引擎可以按照网页的权重来展现给用户,第一条记录应该是最重要的,也就是说搜索引擎认为权重最高的,以此类推。

如果很多用户认为 Apache 这个关键字不是第一条展示的,那么很多用户会去选择第二条,或者第三条。那么后面的条目的权重会逐步增加,第一条的权重就会下降。

这仅仅是基本的理论,在实现上面各个不同的搜索引擎具有不同的实现方法。

为什么说 Google 对于技术人员来说,搜索效果要比百度要好。Google 有自己的优化算法,同样,百度也有自己的优化算法。作为搜索引擎来说,进行必要的商业考虑是应该的。但是,如果过多的商业考虑而损坏了原有的效率,那会得不偿失的。

不同的搜索关键词面向的对象是不一样的,还是刚才的那个例子,Apache。

使用 Apache 进行搜索的,大多数是技术人员,或者说 IT 从业人员,这个人群对 Apache 是否表示为印第安人的部落,并不感冒,他们跟多的是希望知道如何对 Apache 这个服务器进行设置,版本更新,安装等技术相关的问题,同时他们也希望知道 Apache 在那里能够下载,在那里能够找到技术支持服务。

同时 Apache 也是美国军方使用的一个武装直升机,在这方面应该也有感兴趣的用户,所以 Google 针对某一个关键词的检索是进行过优化的。

退回来说其他的搜索引擎,同样的内容,检索效率要低 Google 不少。

在这里,我们无意贬低其他的搜索引擎,从一些搜索引擎的优化角度,应该很容易看到不同搜索引擎的差别。

说完了搜索引擎的展现后,我们再来说说应该怎么面对搜索引擎的策略。

同样还是以 Apache 这个词为例。

现在网络上面关于 Apache 的这个词太多太多了,如果你的网站是技术类型的网站,不管你再怎么收集,摘录其他网络上面的文章,你的排名也不会靠前的,因为你要知道 Apache 这个词已经被用了好几十年了。你的网站是新的网站,你再怎么努力也不会超越相关老网站的权重的。

那不是等于没有办法了,如果你又想做 Apache 相关的信息。其实,也是有办法的,只是困难不少而已。比如,你可以修改关键词为 Apache 阿帕奇服务器,同样是内容,但是出现的概率要小很多,而且意义接近。

你可以通过这个关键词,不停的在你网站重复,然后通过一些有权重的外部链接,积极的扩展相关的内容,加以时日,你的网站就会慢慢的出类拔萃了。

以我们自身的例子来说明,就是因为 Apache 出现的概率太高,我们在 OSS 计算技术论坛上就很没有怎么花精力去处理这个关键词,和找很多的关于 Apache 的文章,只是有一部分而已。因为,我们觉得这样的做法不适合我们快速提高影响力,是费力不讨好的事情。那么,我们可以通过其他版块来吸引用户,不断的促进整个网站的发展。

最后需要说明的是,因为有 搜索引擎的惩罚措施的存在,在交换链接的时候,尽量选择大的有信誉的网站。交换链接不在于多,而在于精,因为好的网站会为你的网页权重增加不少,搜索引擎的检索次数也会多不少。

有时候,适当花点费用也是值得的。

不要贪图便宜而因小失大,SEO 也是一个长期的工作,没有人说能保证你在第一页不动,好的 SEO 只会给你提供建议,帮助你进行改进。

各大搜索引擎,也是通过一些惩罚措施来维持特有的互联网生态。