11月 172008
 

这两天,互联网上出现了这样的观点:“垃圾信息是搜索不公正主因” 。

谷歌中国认为,这是在搜索的“公正性”与“准确性”两个不同层次的事情间偷换概念,我们认为中国搜索行业最需要做的、最紧迫的事情,就是正视公正性与客观性对中国搜索行业的根本性意义,没有搜索公正性,搜索的准确性就无从谈起。

或者让我们用反垃圾信息(这也只是搜索准确性的技术领域之一)来举例。

在海洋般浩瀚的互联网世界里,任何搜索引擎都会受到垃圾乃至不良信息影响,然而这些垃圾或不良信息在不的商业模式面前面临着两种不同的生存可能:一种是鬼鬼祟祟千方百计去骗取网民的注意力;一种是掏点小钱就能“漂白”身份登堂入室畅通无阻。对于搜索厂商而言,能否杜绝前者,只是技术问题;能否根除后者,则是价值观问题。就好比一个人,人可以有能力的不同,但所有人都必须堂堂正正。

事实上,谷歌中国相信,今天搜索行业的技术水平已远远超出了靠人工干预解决垃圾信息的初级水准。在这方面的技术研发上,谷歌从诞生第一天开始就进行积累,至今已有10年历史,而通过机器、技术手段来解决垃圾信息早就成为世界通行的法则,现实已经证明了它的成功。所以,在垃圾信息和公正性上,我们旗帜鲜明的认为:

– 不能用搜索“准确性”混淆甚至代替搜索“公正性”的概念和基础地位
– 世界反垃圾信息技术水准无时无刻不在突飞猛进,不能让反垃圾信息成为大规模人工干预搜索结果的借口

在正式切入公正性的定义、搜索引擎的根本之前,我想讲两个故事,这两个故事都同中文搜索的公正性直接相关。这两个故事或许会让每一个致力于中文搜索技术进步的工程师感到痛心。我们不妨思索这样一个问题——如果搜索结果页面的黄金位置注定是广告,那搜索技术的创新还有什么意义?中文用户会有怎样畸形的体验?

1.迷失的中文搜索“黄金三角区”。
通常搜索引擎结果页面都有一个最最重要的黄金三角区——“搜索结果左上角”,也就是最前面的五个搜索结果,这个区域就好比一张报纸的头版头条一样珍贵和重要。用户期待在这里看到最准确的他们最需要的信息。
我们看到一个调查报告,美国用户在他们最常使用搜索引擎的搜索结果页面上,目光主要聚焦在搜索结果的“黄金三角区”,大概用时30秒,而中国用户的目光却散落在整个页面,用时超过60秒,所谓“黄金三角区”对中文搜索居然毫无意义。这很重要的一个原因,是用户在原本的关键位置无法找到非广告内容所致,他们需要自己满屏地、甚至翻屏的辛苦寻找有用信息。合计起来,中文用户每天比美国用户在搜索上浪费超过250万小时(或者超过10万天)的时间。

   Continue reading »