按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
simply to focus on web search; attend to every detail and win over users,before working on any other products。(我们的中国战略就是专注于网页搜索,不放过任何一个细节,以此赢得用户。之后,我们才考虑其他产品。)”
艾瑞克非常赞同这个观点,他说:“搜索业务是谷歌成功的奥秘,如果搜索做不好,那么其他的业务想做好就是纸上谈兵。何况,网页搜索业务也是做好网页广告业务的基础。”
在总部认可并决定谷歌中国先做好搜索的基础上,我们开始了提高中文搜索的历程。在做中文搜索之前,我对工程师们说:“那些最酷最吸引眼球的业务,我们肯定都会去做。但不是现在去做,而是将来。在我们作出决定之前,大家可以各抒己见。而现在,一旦公司作了决定,我们希望大家都能够全力以赴,专注搜索业务!”
从那时开始,只要有任何员工想做搜索以外的产品,我都俨然成为一个Mr。No(“说不”先生)!我总是说:“做好搜索后再说!”
统一思想后,我们就开始在搜索页面的每一个细节上钻研,在每一个可能的选择上进行测试。当然,我们选择提高页面搜索质量,让谷歌“读懂中文”,也意味着谷歌中国要忍受产品很少的“批评”。面对媒体的批评,面对外在的质疑,我们只有像一个坚持己见却暂时没有票房的电影导演那样坚持自己的理想,我们就像一个沉默的剑客一样在聒噪的环境中专注修炼内功。
顶住压力,不要盲从,向来是成功者必须具备的重要素质之一。
修复中文搜索并不是一件简单的事情。其中可能有一万个细节需要工程师们一一进行认证。而这种修正不可能“跟着感觉走”,而是需要先研究中国用户的搜索习惯,然后再根据这些习惯提供用户喜欢的搜索。
在谷歌中文搜索2000年上线的时候,出现了一个严重的技术问题,谷歌中文总是把握不好“分词”的问题。有一天我看到一篇清华的分析,说在搜索引擎里面,谷歌的精确度还是不错的,甚至领先其他中文搜索网站,但是分词做得不够好,原因就在于投入不够。因为当时谷歌只有五位工作在美国的华人工程师,他们无法集中精力做好这件事情。
当系统无法准确分词时,就会闹出很多笑话。比如,用户输入“电脑”两个字,正常的情况是,页面左侧应出现“电脑”的搜索结果,右侧应该出现电脑产品广告,但因为分词的错误,可能会把“电脑”分成“电”和“脑”两个字,出现的结果和广告居然是关于“电话”和“脑白金”的,真令人啼笑皆非。
在搜索引擎领域,分词是中文特有的一个挑战,我们需要做的不是做一个符合语言学的分词,而是一个符合用户使用习惯的分词。比如说,除了要把常用词正确分开外,还应该分清最新的网上用词,比如“打酱油”、“芙蓉姐姐”等等。
而即使分词正确也仍可能造成匹配的问题。比如说,如果有一篇文章里面提到“清华大学”,但搜索“清华”,这篇文章就出不来了。但如果分词时把文章里的“清华大学”分成“清华/大学”,那么搜索“清华大学”又出不了结果了,谷歌对这个问题研究了很久。
做好搜索(3)
有一天,谷歌中国工程研究院副院长刘骏跑来兴奋地说:“开复,你的语音搜索论文可以用在分词上。如果我们把中文的字当做语音,然后用语音识别的方法和统计语言模式来识别出所有可能的分词方法,那么匹配正确时,‘清华’和‘清华大学’就可能同时出来。还有,我们有这么大的网络语料库,可以训练出一个非常巨大而精确的语言模型。”后来,他带领团队真的实现了这方面的突破。
在2006年下半年到2007年上半年,我们的工程师一一检查尝试各种领域的各种搜索词,并统计出所有不合理的搜索结果,然后再向美国的工程师学习如何在系统里进行修正。可以说,今天谷歌中文搜索的每一点进步都是在工程师付出的辛勤努力下得来的。
那时,每天都有很多有关提高搜索质量的会议在清华科技园大厦召开,谷歌内部的监测系统每天都在对各家搜索引擎作出比较,我们评估搜索相关度、网页索引大小、即时更新能力和对垃圾网站的识别性。为了衡量我们的进度,在我办公室外面就有一个大牌子,上面可以看到我们当天的四个指标表现如何,以及和竞争对手的差距又如何。
这是一项极其辛苦而回报率又相当低的工作。有时一个由五名工程师组成的团队努力半年,也只不过把某一个指标提升01%而已。但我总是苦口婆心地鼓励大家:这样的工作是积少成多的。五个人半年做出的成果有限,但一百个人做两年就会有巨大的变化。
为了增加中文搜索产品的亲和力,谷歌中国成立了一支用户体验团队,成员中不乏心理学博士和硕士。我们将一间办公室隔开,让一些普通网民像平时那样使用计算机。在隔壁的实验室里,我们通过安装在计算机上的特殊摄像头将用户使用互联网的习惯记录下来。这种记录非常精密,比如用户每一秒眼睛停留在哪里,鼠标停留在哪里等等。通过这样的实时监测,我们能够真切感受和精确了解中国互联网用户的使用习惯!
在研究用户体验的过程中,我们也发现了中美用户很多不一样的地方。比如,美国互联网用户搜索的目标都比较直接,他们以找到自己想要的信息为目标,一般只点击搜索结果的前三个,之后就离开页面。但中国用户的目光更多是四处浏览,他们愿意尝试更多的搜索结果,停留的时间也更长。中国用户把搜索当成一种探索,去点击网页上各种有趣的东西。
还有一个很有意思的现象,就是中国用户有时候在搜索框里并不完全键入所有的关键字,而是在键入之后直接拉到搜索页面的最下方去点击相关搜索。比如,一位用户想搜索“秦皇岛地图”,但他只输入了“秦皇岛”三个字,搜索结果页面出来后,他直接在最下方的相关搜索中点击秦皇岛地图。他说:“已经习惯使用相关搜索这个功能了。”
谷歌中国的工程师认为,造成这种差别的理由有以下几个:第一,中国用户使用搜索引擎进行探索的概率很高;第二,一些搜索引擎将前几个搜索结果出售为广告,用户因此习惯了不信任排名较前的结果;第三,中文的输入相对来说较慢,因此,中国的用户宁愿用鼠标多点击几次来完成搜索,而不是长时间敲打键盘。
用户的体验给了谷歌工程师们很多灵感,比如,为了满足中国用户的搜索习惯,谷歌在用户键入搜索内容的时候,就给予一系列的搜索提示,这样就省去了用户向下拉页面的麻烦。而我们也按照中国用户的习惯,改变了搜索摘要的长短、排版的版式、字体的大小,甚至字体的亮度。同时,我们还考虑了中国用户普遍使用的显示器规格,进而重新设置版面的安排。
做好搜索(4)
每天,我都和工程师们用巨大的投影屏幕,检测每一像素的排版、颜色、字体等等。我们对各种指标进行现场比较,然后研究决定如何改进我们的中文界面和用户体验。
但是,所有的改进都必须有数据的支持。比如,我们曾经针对互联网用户做过一项调查,问题如下:“如果使用搜索引擎,你是喜欢第一页搜索结果有10项,还是有20项?”结果90%的互联网用户都选择有20项结果,因为他们想象第一页结果多可以省时间。但事实却并非如此,在真实的网络环境测试中,我们却发现大部分用户喜欢第一页有10项搜索结果!这是因为,第一页呈现20个搜索结果要比呈现10个搜索结果慢015秒。在搜索过程中,不少用户恰恰因为这015秒带来的负面感觉,就无法忍受了。
我们在一遍遍地尝试和探索着。工程师们都沉浸在专注的努力中乐此不疲。对待员工一向宽容的我,在产品的研发方面有时候就没有那么放松了。我还是那个Mr。No;不支持做任何不对搜索有直接帮助的工作,同时要求团队仔细分析每一个细节,从字体、空格以及翻译,都绝对不能有一个错误存在。公司面临的困境以及我们心中的梦想都在激励着我们不断前进。
那一段日子,我睡觉、洗澡、吃饭的时间都想着如何把搜索做好。真的像走火入魔一般。就算去餐馆吃饭,我对服务员也不放过,总是问:“听说过谷歌吗?”如果得到肯定的回答,我就会进一步追问对我们的产品的感觉;如果得到否定的回答,我就会鼓励他们不妨去试试。
虽然我在过去的工作中曾经经历过无数次做产品的成功与喜悦、失败与挫折,但我对成功的渴望却从来没有如此强烈过。
这样艰苦努力一年之后,2006年10月的某一天,我在办公室外面的牌子上终于看到了我们的四个指标都已经胜出!2007年4月,我们评估了过去9个月对中文搜索的改进成果,发现中文精确度的提升速度超过了公司内部其他任何的语言。另外,中文的网络索引数量在过去一年也增加了一倍(2008年又增加了10倍);对于新网页敏感度也降低到几分钟(就是重要网站的新内容几分钟后就可能搜索到);作弊网站在网页出现的频率则下降到原来的1/40。
在搜索质量不断改善的同时,我们在2007年6月也终于获得了ICP牌照,谷歌把google。cn的服务器逐步搬入中国,然后把上google。的用户指向google。cn,断网的问题终于彻底得以解决。
可以说,在2006年这一年,谷歌中国的工作远远没有外界想象得那样有趣,与之相反,改善搜索引擎是最平淡、最不能带给市场惊喜的,但长期来看,它是一切竞争的根本,是谷歌中国的立足之本。在这一段时间里,摆在工程师面前更多的是改进,而不是创新;是对细节的不断改进,而不是炫酷产品的推出;是以辛勤耕耘一步步赢得中国用户的心,而不是耀眼的广告