Google强化搜索功能 云计算规划未来搜索

作者:网络 来源:佚名 更新时间:2010-12-25 19:40:53 点击:

  Google为改进搜索服务而搭建的巨大的世界级云计算基础设施平台如今催生了许多新型搜索服务。那么,五年后Google将创造一个什么样的世界呢?让我们来看一下Google所描绘的未来搜索。

  近期Google快速强化了网页搜索服务(表1)。仅今年以来就采取了超过15次的大大小小的强化举动。

  其中,改进力度最大的是实时搜索。一直以来在网上搜索到的信息大多是几天前发生的。如今已经可以搜索到1分钟前刚刚更新的信息了。

  Google之所以能够实现实时搜索要归功于2009年10月与Twitter建立的合作。这项合作使Google可以搜索到Twitter微博用户发布的信息。通过直接搜索Twitter的索引,比Google搜索系统遍历网页生成索引要快很多,从而可以搜索网页上实时更新的信息。同时在6月份,Google新增加了将Twitter上的信息显示在搜索结果中的功能。

  集网友力量充实地图

  包括实时搜索在内,Google近几年来一直致力于四大主题,即让每个人可以使用最佳选项的“个性化搜索”、获取现实世界信息的“非网上搜索”、以及基于外文自动翻译技术的“穿越语言壁垒的搜索”。

  实现个性化搜索的方法之一是运用社交圈子。社交圈子是指用户的网上交友信息。在一般的搜索结果中显示包括SNS(社会性网络服务)内好友所写的博客。例如,对搜索某种商品的评论信息来说,在搜索结果中所看到的自己好友所写的评论,对其他人来说或许无关紧要,但对自己来说是一个非常有意义的参考信息。

  非网上搜索的代表性服务包括拍摄实际道路的影像供搜索的“Street View”以及搜索Google所扫描书籍内容的“Google Books”等。Google驱动安装有摄像头的汽车在世界各地行驶,将庞大现实世界的信息组建成了网络。

  虽然Google为打造这一现实世界信息网络不惜成本,但仍有它的局限性。尤其是在亚洲,凸显出了许多问题。亚洲城市大多交通网非常复杂,人口密度较高,道路形状经常发生变化。例如,印度大多道路既没有标识,又没有街道名称,即使有名称也大多是当地语言的称呼。道路信息通常难以反映到网页上。

  因此,Google开始借助网上用户的力量搜集非网上信息。其中的一个方法是推出了称为“Map Maker”的地图编辑工具(图1)。该工具采用了与网上用户可编辑的在线百科事典“Wikipedia”同样的方法,网上用户可以用这一工具在地图上添加地名与建筑名。

  五年后穿越语言壁垒

  实现“穿越语言壁垒的搜索”的关键自然是自动翻译技术。目前,Google提供57个国家语言的自动翻译功能,共有3000多种互译的组合可供选择。

  Google计划结合文字翻译与语音识别等基础技术来充实搜索服务。例如,地图搜索服务“Google Maps”上也可以用汉语显示国外地名的功能已经从去年8月份开始提供,目前涵盖了60个国家和地区的80%的地名信息。

  Google是在后台处理系统上组合各种技术自动翻译成地名的。首先自动读取外文地名,转换成语音数据。然后用语音识别技术将语音数据转换成文字数据,然后再使用自动翻译功能翻译成汉语。尽管也实施人工核对,但是基本上都是自动化处理。

  视频共享服务“YouTube”的字幕功能也是采用同样方法实现的识别英语语音,转换成文字添加字幕。经过翻译,显示中文字幕。使得无字幕的视频也附有了字幕。

  这样的语言自动翻译之所以成为可能,是因为具有“云计算”这一巨大的系统平台。通过数千台电脑进行运算处理,打造了高速的翻译机器。当然,Google的自动翻译技术还远未达到人工翻译的准确度。但重要的是,每年翻译与语音识别的准确度都在大幅提升。未来五年,或许能够在手机上用汉语直接与说英语的国外朋友沟通。

  未来“没有搜索,胜似搜索”

  通过实时、个性化、非网上、跨语言等四大主题,最终Google将实现什么样的搜索呢?那就是“没有搜索,胜似搜索”。如今,用户要搜索必须进行一下操作。而未来,搜索引擎将读取用户的意图,直接提示出最佳结果。

  Google不断向其宏伟目标挺进。但也并非一帆风顺。例如,Street View不断被指责侵犯个人隐私。而今年5月,又因为拍摄影像数据的汽车在最近几年无意中收集了无线局域网发送的个人信息而被曝光。对此,Google表示在销毁数据的同时,停止对无线局域网信息的采集。此外,尽管如今已经有许多出版社表示参加检索书籍的Google Books服务,但是在1年前这项服务还备受指责。

  所谓“读取用户的意图”技术超过了搜索范畴而类似人工智能。方便是方便,但是将难免会引发与用户之间更多的冲突。