12月 152006
 

张朝阳放言中文搜索绝对领先 称技术已超百度

2006-12-08 09:11     作者: 胡滢
【 编者按 】
  在他看来,如今,搜狗3.0版的中文搜索结果已经明显优于百度、谷歌和雅虎。
  
  【eNet硅谷动力消息】“我们的搜狗3.0,已经达到中文搜索领域的绝对的领先,而这种差距是竞争对手们在现有技术架构上难以实现的。” 2006年12月7日下午,搜狐公司CEO张朝阳在办公室接受了记者的采访。当谈及即将上线的搜狗3.0版搜索引擎时,他的神情颇为愉悦。

  他甚至略为调侃地评价竞争对手百度“听取的华尔街的声音太多了”。

  尽可能地“抓”

  将于明年1月1日正式推出的搜狗3.0版本的最大亮点,在于将凭借其自主研发的服务器集群并行的抓取技术,将中文网页的收录数量由目前的50亿一举提升到100亿,网页的更新速度将提升到每天5亿。据张朝阳介绍,这样的一个收录数据量,可实现了对全部中文网页50%—75%的覆盖率,在当前中文类搜索引擎中尚属首位。

  要在节省服务器的情况下,达到100亿数据和5亿的日更新量,对于搜索引擎技术而言还是具有一定挑战性的。张朝阳告诉记者,之所以要将搜狗的重点放在增加收录量上,是由于很多新的页面包括用户所产生的内容,都“很有价值”,而只有“把网上出现的页面尽可能地抓过来”,才是实现搜索引擎“好用”和“及时”的基础。

  百度“草根”谷歌“学术”

  “精准”,是搜狗3.0版本的另一优势所在。

  解释这一特点时,张朝阳特意拿出了竞争伙伴们进行对比说明:“拿同一关键词到不同的搜索引擎上搜索,得到的结果是有很多差别的,我们发现,百度的结果草根含量相对高一些,但多个词联合检索效果比Google弱;Google的结学术性含量相对较高;而Yahoo的结果则更倾向于官方信息。”

  注意到这一点后,搜狗开始尝试着将几家的优势综合,在搜索引擎的权重设置方面找到平衡点,以便“让不同的用户更容易找到自己所需要的结果”。

  “搜索引擎是需要强大的人工智能来对网页进行分析,你的构架要有准确的分析,结果就是更了解。”张朝阳如是说道。

  在他看来,如今,搜狗3.0版的中文搜索结果已经明显优于百度、谷歌和雅虎。

  “追赶者必须在技术上超越对手才能够改变用户行为。如果搜狗引擎的水平接近百度,用户还是不会过来,我们2.5版的技术和百度相当,现在3.0版已经超越了百度,达到中文搜索领域的绝对的领先。”

  中文市场还大有可挖

  就在几天前,百度刚刚宣布了将于明年进军日本搜索引擎市场的规划。对此张朝阳显得颇有些不以为然:“他们听取华尔街的声音太多了。”

  他表示,中文市场其实还大有可挖,因此,搜狗将持续专注于中文搜索。

  “我们目前不会考虑去做外文的搜索,主要任务还是把中文的搜索结果做好。”张朝阳告诉记者,在他看来,中国网民很快将成为世界上最大的网民群体,但现在中文搜索的用户满意度,还远远达不到西方人使用英文搜索时的满意度,创新和可供突破改进的空间相当大,因而“我们要先把中文市场做强做好,挖深挖透。”

  网页搜索技术强大之后,各种相应的专项应用也会随之而来。据悉,明年适当时候,搜狐将推出垂直搜索服务。张朝阳还透露,目前搜狗在视频搜索方面也进行了很多储备,包括在视频内容链接搜索以及内容连通和流畅性方面都有很大积累,很快就能推出相关服务。

  “驱动”搜狐

   “我们的3.0,就像一个新的发动机,一旦制造出来并安装上后,速度会一下子上来。”采访中,张朝阳屡次将搜狗3.0比作一个全新的“发动机”。

  在他心目中,这个马力强劲的“发动机”,不但能够迅速驱动搜狐的搜索引擎业务,更将全面“驱动”整个搜狐:“现在应该说搜狗已经成为整个搜狐公司的引擎。因为搜狗研发中心的技术,包括搜索引擎技术、网页分析技术、内容的加速和下载技术等都已经汇集到了了整个搜狐,促进着搜狐技术的进步,并将会使得整个搜狐公司的业绩不断改善和发展。”

  “我们希望把搜狐打造成一个技术的圣殿,如果说两年前我们说这个话可能大家不相信,但是现在随着搜狗的成长,我们基本上已经朝着这个方向走了。”张朝阳笑道。不过他也坦承,从娱乐驱动到如今的技术驱动,自己也经历了一个思想的转变过程:“我一直在考虑互联网公司的核心竞争力到底来自什么?现在确认了,是技术。”

  虽然对搜狗寄寓厚望,目前张朝阳还尚未计划将赢利任务压在搜狗头上。他坦言,虽然在技术上已经超越了百度等竞争对手,但搜狗的流量比起竞争对手来尚有一定差距,因此,目前搜狗的首要任务是先把流量做起来,“让搜狗成为中国人首选的搜索引擎”,然后再考虑赢利和收入问题。

  “在搜狗的品牌方面我们曾经走过一些弯路,现在已经纠正过来了,将来,我们会继续把搜狗的品牌擦亮。” (记者:胡滢)

 回复

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>