新搜索时代还有多远
- 来源:计算机世界 smarty:if $article.tag?>
- 关键字:搜索引擎,厂商,技术,用户 smarty:/if?>
- 发布时间:2011-05-12 16:18
想搜索一首歌曲,却只记得旋律?想寻找多年未见的朋友,却只有照片?想搜索视频中的演员,却只是脸熟?想搜索某个生僻字,却只记得读音?每当遇到这样的问题,你是否期待一种更便捷、更容易使用的搜索引擎,满足自己通过不同搜索方式、随时随地获得结果的需求?事实上,这也是搜索引擎厂商为搜索引擎描绘的未来。
最早的搜索引擎出现在1990年, 是由蒙特利尔大学学生AlanEmtage 发明的、以文件名查找文件的系统Archie,这一系统也是现代搜索引擎的祖先。经过20 余年的发展,目前的搜索引擎虽然搜索能力良莠不齐,但是大部分都已经解决了“如何搜索”这一问题,但这只是搜索的初级阶段。如果将搜索技术的发展比喻为一幅历史长卷,目前的搜索引擎只是打下了底稿。未来的搜索引擎不仅仅要与迅速增长的信息主体抗衡,而且要不断跟上用户行为和期望的转变。
为了达到这一目标,搜索引擎厂商都在不断地对自身技术进行调整,并陆续进行人脸识别搜索、语音搜索、视频搜索等新搜索方式的尝试。尤其是移动设备的升级和3G 网络的发展,使语音搜索得到搜索引擎相关厂商的特别重视。2010 年9 月,百度低调推出百度MP3 哼唱搜索(http://mp3.baidu.com/voice/s.html),该搜索方式的工作原理是:用户通过麦克风等音频输入设备哼唱歌曲并上传,百度将音频旋律与音乐库中的数据进行详细分析和比对,最后将最符合该旋律的歌曲信息提供给用户。遗憾的是,这一功能在上线不久即低调下线,百度方面也并未对这一项目是否夭折给予解释。
与此同时, 谷歌、微软、盛大等网络公司也在研究基于语音输入的搜索方式,盛大网络还曾宣布将对外开源哼唱搜索技术。手机厂商HTC 也于2010 年年底表示将会和SoundHound(音乐猎手)合作,在以后的Android新机中全线内置SoundHound 音乐哼唱搜索应用。然而, 时至今日,哼唱搜索还只处于尝试阶段,迟迟未能投入大规模使用。
虽然哼唱搜索的发展并非坦途,但分析人士依旧认为,哼唱搜索将成为互联网新搜索方式的序幕,作为哼唱搜索的基石,语音也成为公认的下一代搜索技术的竞争热点。为了应对在语音搜索领域的竞争,许多互联网公司都开始规模化招聘语音识别工程师,而厂商在语音搜索方面所进行的尝试和技术储备,也为未来搜索引擎进一步了解用户需求、提供真正的新搜索体验打下了基础。
搜索引擎分类
在这里,我们将为用户提供搜索查询服务的网站统称为搜索引擎。搜索引擎按工作方式可分为3 类,分别是全文搜索引擎(Full TextSearch Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
全文搜索引擎
全文搜索引擎通过从互联网上提取各个网站的信息,建立自己的搜索数据库。用户搜索关键词时,所有引擎通过检索数据库中与用户查询条件匹配的相关记录,按一定的排列顺序——通常根据网页中关键词的匹配程度,出现的位置、频率、链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。知名全文搜索引擎如国外的Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut 以及国内的百度。由于拥有独立的数据库,全文搜索引擎也被称为真正的搜索引擎。
全文搜索引擎按搜索结果来源可分为两种,一种是拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如Google 和百度;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos。
目录索引引擎
目录索引引擎依靠网站主动提交信息来建立自己的链接索引,虽然有搜索功能,但通常只提供按目录分类的网站链接列表。即使不使用关键字查询,用户也可以依靠分类目录找到需要的信息。早期的Yahoo 是最具代表性的目录索引引擎, Open Directory Project(DMOZ)、LookSmart、About 以及国内的搜狐、新浪、网易搜索都可以归为此类。严格来说,目录索引引擎并不是真正的搜索引擎。
当前,全文搜索引擎与目录索引多数已经相互融合,一些纯粹的全文搜索引擎也提供目录搜索,目录索引引擎也开始提供全文搜索服务。
元搜索引擎
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,有的则按自定的规则将结果重新排列组合,具有代表性的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。
其他搜索引擎
集合式搜索引擎
如HotBot在2002 年年底推出的引擎。该引擎类似META 搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4 个引擎当中选择。
门户搜索引擎
如AOL Search、MSN Search 等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库的搜索引擎,其搜索结果完全来自其他引擎。
免费链接列表
这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo 等目录索引来要小得多。
市场细分推动新搜索
搜索技术的发展,使新搜索引擎不断涌现,也引发着更加激烈的市场竞争。
市场调查机构StatCounter 的报告显示,截止2011 年2 月,Google的全球市场占有率为89.94%,Bing 以4.37% 的市场占有率击败仅占3.93% 的雅虎,成为全球第二大搜索引擎。而在美国本土,根据Experian Hitwise 的统计,截止2011年1 月,Google 的市场份额已由2010 年12 月的69.67% 下跌了2%,仅为67.95%, Yahoo 和 Bing 则分别占到14.62% 和12.81%;在搜索成功率方面,Bing 和Yahoo 以 81%的数据保持领先, Google 则以65%大幅落后。
在中国市场,CNZZ 数据中心最新发布的数据显示,3 月百度搜索引擎的中国市场占有率达到81.51%,位居国内第一, 第二名谷歌仅占9.40%。CNZZ 分析指出,百度在搜索结果总量、检索结果页面的打开速度、检索结果即时性等方面做得比较突出,但在检索结果竞价广告、检索结果下载效果、微博搜索、购物搜索等方面的控制却落后于谷歌。
市场占有率的极大不均衡导致搜索引擎厂商之间的纷争从未停止。2 月,谷歌控告微软搜索引擎Bing复制其网页搜索结果,法国搜索引擎公司1plusV 指控谷歌垄断;4 月,韩国互联网搜索公司NHN 和DaumCommunications 又指控Google 不正当竞争。 搜索引擎厂商在内容与市场领域的争夺不断进入白热化。
然而,在占据绝对优势的主流搜索引擎厂商激烈的竞争背后,一些原本不属于搜索阵营的互联网厂商开始另辟蹊径,结合自身优势进行专业化、行业化的细分搜索。
2010 年年底,购物网站亚马逊就宣布为“男鞋”和“女鞋”店推出了允许用户根据外观来搜索和浏览的新搜索功能,亚马逊A9 总裁比尔·斯达西亚说:“由于款式是通过图形来描述的,因此用户甚至无需了解所需款式的名称。”
在国内,大型网络购物平台淘宝也依托自身在网购领域的优势,以及对购物人群搜索需求的分析积累,推出了自有技术购物搜索引擎一淘,针对购物搜索结果进行优化,并将京东商城、凡客诚品、当当网等国内独立B2C 网站的同类商品及团购网站收录其中,按照时间、品牌、价格等多维角度进行公平排序,彻底打破了淘宝与非淘宝之间的限制。一淘网表示,自上线测试以来就一直把重点放在淘宝站外商品搜索上,并在上线初就宣布了其“开放平台”的战略,通过与站外B2C 商家合作及主动收录两种方式实现其“全网商品”的目标。
而阿里巴巴集团董事局主席马云在IT 领袖峰会上提出的“搜索应该坚持真实排名,只要对用户不公平的事就不应该做”的言论中,也隐约能够看出一淘对购物搜索领域市场的决心。
国内另一互联网巨头腾讯也加大了对自有搜索品牌搜搜的投入,通过与QQ 客户端的紧密结合,提供“ 大社区搜索”, 整合论坛、SNS 社区、微博等社区平台,提供社区化、个性化的搜索体验。目前,在搜搜的搜索框输入名人姓名即可在网页端直接浏览其最近微博内容,并可直接实现转播、收听等关系链操作。目前,腾讯平台覆盖了中国95% 以上的互联网用户,强大的用户基础和客户端优势,使搜搜的实力不容小觑。
新搜索方式探索
在早期,网络主要由文本文件组成, 因此,网络搜索的主要工作是有关网页文字扫描和关键字寻找。
现在的网络包含着海量信息,在过去的每一分钟,网络内容都在呈现指数级增长——每一天,网络增加的文件数都达到数十亿 。而与此同时,人们的期望值也在不断变化。人们希望通过视频、语音、图像等各种格式和语言搜索信息,同时还要迅速找到适合个人喜好的信息。
除了之前提到的语音搜索技术,目前,许多厂商也已经在提高搜索过程交互性、深入分析搜索内容,以及图片、视频内容匹配方面进行探索。
作为搜索技术的领导者之一,谷歌一直在寻找“关键字”以外的搜索方式,谷歌搜索产品及用户体验部门全球副总裁玛丽莎·梅耶尔表示,除了在语音搜索方面的尝试,谷歌实验室还在进行相似图片搜索、自动寻找相关性资料并且以表格方式呈现搜索结果等搜索应用的研发。
谷歌Instant 就是一次有效的尝试,谷歌表示:“我们一直努力寻求最优秀的用户体验产品,有些性能可以,有些则不能用,很高兴我们现在推出了Instant。设想一下未来的搜索模式,只需要提供部分搜索关键词,或者一些交互式的反馈就可以了,我们目前已经就这个理念完成了几个测试版产品。”谷歌Instant 在用户键入关键词后,会出现一个罗列了多个相关问题的下拉列表,用户可以快速选择最需要的搜索结果。这一搜索方式使用了Ajax 技术,谷歌在每次搜索时都会实行Ajax GET 询问,Instant 可以对其他的搜索内容进行预测,并在完成输入前以灰色状态显示,使得部分页面更新的同时,保持其他页面的现有状态。
工作流解决方案供应商LexisNexis 则推出一种被称为“brain”( 大脑) 的语义搜索技术,语义搜索是使用语言中的含义,进行科学计算,以提供具有高度相关性的结果的搜索方式, 这一技术可识别出一个单一查询词条中的多个概念的含义,以帮助用户以更快速度获得核心概念, 减少查询词条的调整次数。据悉,该技术将被用于LexisNexis 的专利搜索服务TotalPatent、自动化专利申请服务PatentOptimizer,以及 Lexis.com 网站中。“当用户体验与语义搜索相结合,会变成一款强大的工具,提供最精确、相关度最高的专利搜索结果。”
LexisNexis调研信息副总裁史蒂文·艾瑞克说。
目前比较稳定的图片搜索是由日立推出的新一代图像搜索引擎GazoPa, 该引擎拥有8000 余万张相似图片,通过提取颜色、形状等图像自身特征从互联网上搜索相似图像,而不是仅仅依靠传统意义的文字搜索,能够提供惊人的视觉搜索服务。用户可以通过本地上传图片、提供图片URL 地址、使用提供的画板画草图、关键词等方式提交图片,GazoPa 则会根据其特征搜索到相似图片。
搜索技术的未来
梅耶尔曾表示,未来搜索引擎有3 个发展趋势。首先是搜索情境多样化,比如说在车上进行搜索,或是移动式搜索;其次,搜索结果呈现方式也将以多媒体的形式出现,包括文字、图片和视频等;最后,个性化和社交网络也是非常重要的方向。
目前,谷歌正在进行这些方面的尝试,“谷歌正在建立一个智能化、个性化和互动的搜索引擎。我们正在深入了解查询和网页的信息,这样的话,无论你在框中键入什么,你都能找到正确的信息。” 谷歌搜索科学家Amit Singhal 说,真正个性化的搜索引擎能够帮助用户链接和自身有关的资料,并将这些资料以用户所使用的语言呈现出来,它关联着用户所处的位置(即使其位置随着行走而变化),并且,它是根据用户的兴趣而定制的搜索引擎。
“我们希望搜索成为一个互动的体验,所以我们正在赋予人们新的和动态的方式来连接和交互信息,无论它是一个新的搜索工具还是语音搜索。” Amit Singhal 说。而这需要考虑用户不同的搜索方式、希望得到的内容,以及所处的环境。尤其是移动互联的发展,使用户的搜索环境更加复杂,例如,用户通过手机上网搜索餐厅,那么用户希望得到的是附近的、容易到达并且能够获取路线的结果;而当用户在PC 上搜索图像时,希望能够迅速得到大量全尺寸和色彩的相关图像。
“人们不只是想坐在家里的电脑前寻找信息,他们出门在外买杂货时、每天从学校接孩子时,都会有问题要查询。我们要确保可以在任何时间、任何地点, 以及使用任何设备都能找到你要找的东西。” Amit Singhal 说,“未来的搜索引擎能全天候地帮助并指导我,告诉我下一步该做什么。它知道我的下一场会议是在市中心,同时还能看到那个地区正在断电,让我知道自己或许应该重新安排时间。它会提醒我两个星期后是太太的生日,告诉我她想要一个iPad,再建议我去跟曾做过iPad Wi-Fi 功能研究的朋友Matt 交流一下,然后把离我最近的专卖店的路线图发给我。”
这些听起来好像科幻小说的描述寄托了人们对搜索引擎未来的美好憧憬。Amit Singhal 认为, 最理想的搜索要能够了解用户想要什么,不单单是匹配搜索词,而是去匹配背后的意思。这并非谷歌自身的目标,而应该是所有搜索引擎厂商努力的方向。“当我们能够理解人们搜索背后的意义,同时理解网络上出现的各种信息时,我们才能够提供给人们更相关的搜索结果。”AmitSinghal 说。为了达到这一目标,搜索引擎厂商需要在搜索交互性等方面进行更多尝试。
……
最早的搜索引擎出现在1990年, 是由蒙特利尔大学学生AlanEmtage 发明的、以文件名查找文件的系统Archie,这一系统也是现代搜索引擎的祖先。经过20 余年的发展,目前的搜索引擎虽然搜索能力良莠不齐,但是大部分都已经解决了“如何搜索”这一问题,但这只是搜索的初级阶段。如果将搜索技术的发展比喻为一幅历史长卷,目前的搜索引擎只是打下了底稿。未来的搜索引擎不仅仅要与迅速增长的信息主体抗衡,而且要不断跟上用户行为和期望的转变。
为了达到这一目标,搜索引擎厂商都在不断地对自身技术进行调整,并陆续进行人脸识别搜索、语音搜索、视频搜索等新搜索方式的尝试。尤其是移动设备的升级和3G 网络的发展,使语音搜索得到搜索引擎相关厂商的特别重视。2010 年9 月,百度低调推出百度MP3 哼唱搜索(http://mp3.baidu.com/voice/s.html),该搜索方式的工作原理是:用户通过麦克风等音频输入设备哼唱歌曲并上传,百度将音频旋律与音乐库中的数据进行详细分析和比对,最后将最符合该旋律的歌曲信息提供给用户。遗憾的是,这一功能在上线不久即低调下线,百度方面也并未对这一项目是否夭折给予解释。
与此同时, 谷歌、微软、盛大等网络公司也在研究基于语音输入的搜索方式,盛大网络还曾宣布将对外开源哼唱搜索技术。手机厂商HTC 也于2010 年年底表示将会和SoundHound(音乐猎手)合作,在以后的Android新机中全线内置SoundHound 音乐哼唱搜索应用。然而, 时至今日,哼唱搜索还只处于尝试阶段,迟迟未能投入大规模使用。
虽然哼唱搜索的发展并非坦途,但分析人士依旧认为,哼唱搜索将成为互联网新搜索方式的序幕,作为哼唱搜索的基石,语音也成为公认的下一代搜索技术的竞争热点。为了应对在语音搜索领域的竞争,许多互联网公司都开始规模化招聘语音识别工程师,而厂商在语音搜索方面所进行的尝试和技术储备,也为未来搜索引擎进一步了解用户需求、提供真正的新搜索体验打下了基础。
搜索引擎分类
在这里,我们将为用户提供搜索查询服务的网站统称为搜索引擎。搜索引擎按工作方式可分为3 类,分别是全文搜索引擎(Full TextSearch Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
全文搜索引擎
全文搜索引擎通过从互联网上提取各个网站的信息,建立自己的搜索数据库。用户搜索关键词时,所有引擎通过检索数据库中与用户查询条件匹配的相关记录,按一定的排列顺序——通常根据网页中关键词的匹配程度,出现的位置、频率、链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。知名全文搜索引擎如国外的Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut 以及国内的百度。由于拥有独立的数据库,全文搜索引擎也被称为真正的搜索引擎。
全文搜索引擎按搜索结果来源可分为两种,一种是拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如Google 和百度;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos。
目录索引引擎
目录索引引擎依靠网站主动提交信息来建立自己的链接索引,虽然有搜索功能,但通常只提供按目录分类的网站链接列表。即使不使用关键字查询,用户也可以依靠分类目录找到需要的信息。早期的Yahoo 是最具代表性的目录索引引擎, Open Directory Project(DMOZ)、LookSmart、About 以及国内的搜狐、新浪、网易搜索都可以归为此类。严格来说,目录索引引擎并不是真正的搜索引擎。
当前,全文搜索引擎与目录索引多数已经相互融合,一些纯粹的全文搜索引擎也提供目录搜索,目录索引引擎也开始提供全文搜索服务。
元搜索引擎
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,有的则按自定的规则将结果重新排列组合,具有代表性的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。
其他搜索引擎
集合式搜索引擎
如HotBot在2002 年年底推出的引擎。该引擎类似META 搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4 个引擎当中选择。
门户搜索引擎
如AOL Search、MSN Search 等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库的搜索引擎,其搜索结果完全来自其他引擎。
免费链接列表
这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo 等目录索引来要小得多。
市场细分推动新搜索
搜索技术的发展,使新搜索引擎不断涌现,也引发着更加激烈的市场竞争。
市场调查机构StatCounter 的报告显示,截止2011 年2 月,Google的全球市场占有率为89.94%,Bing 以4.37% 的市场占有率击败仅占3.93% 的雅虎,成为全球第二大搜索引擎。而在美国本土,根据Experian Hitwise 的统计,截止2011年1 月,Google 的市场份额已由2010 年12 月的69.67% 下跌了2%,仅为67.95%, Yahoo 和 Bing 则分别占到14.62% 和12.81%;在搜索成功率方面,Bing 和Yahoo 以 81%的数据保持领先, Google 则以65%大幅落后。
在中国市场,CNZZ 数据中心最新发布的数据显示,3 月百度搜索引擎的中国市场占有率达到81.51%,位居国内第一, 第二名谷歌仅占9.40%。CNZZ 分析指出,百度在搜索结果总量、检索结果页面的打开速度、检索结果即时性等方面做得比较突出,但在检索结果竞价广告、检索结果下载效果、微博搜索、购物搜索等方面的控制却落后于谷歌。
市场占有率的极大不均衡导致搜索引擎厂商之间的纷争从未停止。2 月,谷歌控告微软搜索引擎Bing复制其网页搜索结果,法国搜索引擎公司1plusV 指控谷歌垄断;4 月,韩国互联网搜索公司NHN 和DaumCommunications 又指控Google 不正当竞争。 搜索引擎厂商在内容与市场领域的争夺不断进入白热化。
然而,在占据绝对优势的主流搜索引擎厂商激烈的竞争背后,一些原本不属于搜索阵营的互联网厂商开始另辟蹊径,结合自身优势进行专业化、行业化的细分搜索。
2010 年年底,购物网站亚马逊就宣布为“男鞋”和“女鞋”店推出了允许用户根据外观来搜索和浏览的新搜索功能,亚马逊A9 总裁比尔·斯达西亚说:“由于款式是通过图形来描述的,因此用户甚至无需了解所需款式的名称。”
在国内,大型网络购物平台淘宝也依托自身在网购领域的优势,以及对购物人群搜索需求的分析积累,推出了自有技术购物搜索引擎一淘,针对购物搜索结果进行优化,并将京东商城、凡客诚品、当当网等国内独立B2C 网站的同类商品及团购网站收录其中,按照时间、品牌、价格等多维角度进行公平排序,彻底打破了淘宝与非淘宝之间的限制。一淘网表示,自上线测试以来就一直把重点放在淘宝站外商品搜索上,并在上线初就宣布了其“开放平台”的战略,通过与站外B2C 商家合作及主动收录两种方式实现其“全网商品”的目标。
而阿里巴巴集团董事局主席马云在IT 领袖峰会上提出的“搜索应该坚持真实排名,只要对用户不公平的事就不应该做”的言论中,也隐约能够看出一淘对购物搜索领域市场的决心。
国内另一互联网巨头腾讯也加大了对自有搜索品牌搜搜的投入,通过与QQ 客户端的紧密结合,提供“ 大社区搜索”, 整合论坛、SNS 社区、微博等社区平台,提供社区化、个性化的搜索体验。目前,在搜搜的搜索框输入名人姓名即可在网页端直接浏览其最近微博内容,并可直接实现转播、收听等关系链操作。目前,腾讯平台覆盖了中国95% 以上的互联网用户,强大的用户基础和客户端优势,使搜搜的实力不容小觑。
新搜索方式探索
在早期,网络主要由文本文件组成, 因此,网络搜索的主要工作是有关网页文字扫描和关键字寻找。
现在的网络包含着海量信息,在过去的每一分钟,网络内容都在呈现指数级增长——每一天,网络增加的文件数都达到数十亿 。而与此同时,人们的期望值也在不断变化。人们希望通过视频、语音、图像等各种格式和语言搜索信息,同时还要迅速找到适合个人喜好的信息。
除了之前提到的语音搜索技术,目前,许多厂商也已经在提高搜索过程交互性、深入分析搜索内容,以及图片、视频内容匹配方面进行探索。
作为搜索技术的领导者之一,谷歌一直在寻找“关键字”以外的搜索方式,谷歌搜索产品及用户体验部门全球副总裁玛丽莎·梅耶尔表示,除了在语音搜索方面的尝试,谷歌实验室还在进行相似图片搜索、自动寻找相关性资料并且以表格方式呈现搜索结果等搜索应用的研发。
谷歌Instant 就是一次有效的尝试,谷歌表示:“我们一直努力寻求最优秀的用户体验产品,有些性能可以,有些则不能用,很高兴我们现在推出了Instant。设想一下未来的搜索模式,只需要提供部分搜索关键词,或者一些交互式的反馈就可以了,我们目前已经就这个理念完成了几个测试版产品。”谷歌Instant 在用户键入关键词后,会出现一个罗列了多个相关问题的下拉列表,用户可以快速选择最需要的搜索结果。这一搜索方式使用了Ajax 技术,谷歌在每次搜索时都会实行Ajax GET 询问,Instant 可以对其他的搜索内容进行预测,并在完成输入前以灰色状态显示,使得部分页面更新的同时,保持其他页面的现有状态。
工作流解决方案供应商LexisNexis 则推出一种被称为“brain”( 大脑) 的语义搜索技术,语义搜索是使用语言中的含义,进行科学计算,以提供具有高度相关性的结果的搜索方式, 这一技术可识别出一个单一查询词条中的多个概念的含义,以帮助用户以更快速度获得核心概念, 减少查询词条的调整次数。据悉,该技术将被用于LexisNexis 的专利搜索服务TotalPatent、自动化专利申请服务PatentOptimizer,以及 Lexis.com 网站中。“当用户体验与语义搜索相结合,会变成一款强大的工具,提供最精确、相关度最高的专利搜索结果。”
LexisNexis调研信息副总裁史蒂文·艾瑞克说。
目前比较稳定的图片搜索是由日立推出的新一代图像搜索引擎GazoPa, 该引擎拥有8000 余万张相似图片,通过提取颜色、形状等图像自身特征从互联网上搜索相似图像,而不是仅仅依靠传统意义的文字搜索,能够提供惊人的视觉搜索服务。用户可以通过本地上传图片、提供图片URL 地址、使用提供的画板画草图、关键词等方式提交图片,GazoPa 则会根据其特征搜索到相似图片。
搜索技术的未来
梅耶尔曾表示,未来搜索引擎有3 个发展趋势。首先是搜索情境多样化,比如说在车上进行搜索,或是移动式搜索;其次,搜索结果呈现方式也将以多媒体的形式出现,包括文字、图片和视频等;最后,个性化和社交网络也是非常重要的方向。
目前,谷歌正在进行这些方面的尝试,“谷歌正在建立一个智能化、个性化和互动的搜索引擎。我们正在深入了解查询和网页的信息,这样的话,无论你在框中键入什么,你都能找到正确的信息。” 谷歌搜索科学家Amit Singhal 说,真正个性化的搜索引擎能够帮助用户链接和自身有关的资料,并将这些资料以用户所使用的语言呈现出来,它关联着用户所处的位置(即使其位置随着行走而变化),并且,它是根据用户的兴趣而定制的搜索引擎。
“我们希望搜索成为一个互动的体验,所以我们正在赋予人们新的和动态的方式来连接和交互信息,无论它是一个新的搜索工具还是语音搜索。” Amit Singhal 说。而这需要考虑用户不同的搜索方式、希望得到的内容,以及所处的环境。尤其是移动互联的发展,使用户的搜索环境更加复杂,例如,用户通过手机上网搜索餐厅,那么用户希望得到的是附近的、容易到达并且能够获取路线的结果;而当用户在PC 上搜索图像时,希望能够迅速得到大量全尺寸和色彩的相关图像。
“人们不只是想坐在家里的电脑前寻找信息,他们出门在外买杂货时、每天从学校接孩子时,都会有问题要查询。我们要确保可以在任何时间、任何地点, 以及使用任何设备都能找到你要找的东西。” Amit Singhal 说,“未来的搜索引擎能全天候地帮助并指导我,告诉我下一步该做什么。它知道我的下一场会议是在市中心,同时还能看到那个地区正在断电,让我知道自己或许应该重新安排时间。它会提醒我两个星期后是太太的生日,告诉我她想要一个iPad,再建议我去跟曾做过iPad Wi-Fi 功能研究的朋友Matt 交流一下,然后把离我最近的专卖店的路线图发给我。”
这些听起来好像科幻小说的描述寄托了人们对搜索引擎未来的美好憧憬。Amit Singhal 认为, 最理想的搜索要能够了解用户想要什么,不单单是匹配搜索词,而是去匹配背后的意思。这并非谷歌自身的目标,而应该是所有搜索引擎厂商努力的方向。“当我们能够理解人们搜索背后的意义,同时理解网络上出现的各种信息时,我们才能够提供给人们更相关的搜索结果。”AmitSinghal 说。为了达到这一目标,搜索引擎厂商需要在搜索交互性等方面进行更多尝试。
