佛山E网工作室
www.gdasp.com
专业网站建设和推广 信心保证
热线电话:0757-6331 5297,158 1783 3537
      最新资讯
年中优惠,机不可失:标
手机网页设计指南
佛山永网(E网工作室)
百度收涨4.83% 股
Facebook陷入抄
京东商城陷入调整漩涡
唯品会周四跌5.32%
美国电商消费者满意度调
年底电商乱象:阿里20
传“开心农场”开发团队
杨元庆减持2900万联
张近东回应苏宁无电商基
新浪调整架构划分门户及
曹国伟邮件曝光新浪20
人大常委会今日表决加强
分析称新浪微博或将踏上
传阿里巴巴战略投资新浪
百度市值首次超越腾讯
CNNIC:中国网民规
谷歌地图升级新增250
         行业资讯 >> 少数派搜索引擎
少数派搜索引擎
发布人:管理员  发布时间:2008年10月12日  浏览 1980 次
分享 |

 

  KGB,这是克格勃的缩写,也是一家网络公司中的秘密代号,意思是杀掉Google和百度。

  搜索市场向来竞争激烈,Google看起来非常强大,但在全球市场,每一家公司都在努力扩大和稳固自己的地盘,韩国Naver想进入日本和中国市场,百度要进入日本市场,随着社区网站的兴起、Google手机平台的推出,搜索大战掀开新的一幕。

  搜索战争升级,交战形式不再是拼指标,不再动辄叫嚣自己能够搜索到多少亿网页,或者吹嘘自己能挖掘到1995年以前的多少老网页,而是智能化和移动性。升级中的搜索战争依旧是公司间的对抗,由于微软对于Facebook的收购,很有可能出现类似二次世界大战那样的战争联盟,但毋庸置疑的是,每个网民、每个手机用户注定将是这场战争中的一颗子弹。

  Naver:随时调用“邻居”的智慧

  “韩国人基本上不Google,他们Naver。”当搜索引擎最新的全球排名公布后,美国人开始以一种惊异的目光看待亚洲人的搜索习惯。中国的百度、韩国的Naver、俄国的Yandex,都在本地市场将Google甩在了后面。

  在韩国市场,Naver占据了77%的市场份额,居于第二位的也是韩国本土门户Daum,占10.8%,雅虎占4.4%,而Google只有1.7%。Google在这里遭遇的不是技术问题,而是文化问题,尤其是语言。

  韩国IT分析家Wayne Lee说:“无论Google的搜索引擎如何强大,它都是从既存的网络上搜索数据,但网络上根本没有足够可供搜索的韩文数据。”

  1999年,Naver刚推出时候,面临的问题与Google一样——互联网上的韩文网站不到5万个。那时Naver看上去就像一个杂货店,但大部分货架是空的,直到2002年推出“知识IN”,成了它成功突围的关键。

  今天来看Naver的“知识IN”,一点都不难理解,因为“百度知道”也在做同样的事情,而且相当成功。以中国的人海战术,才两年时间,“百度知道”解决的问题数量已经超过了2000万个。“因为有了‘百度知道’的功能,更多人觉得百度比Google更懂中文。在Google里搜索,如果‘百度知道’里有的,Google中的结果往往列在第一位,有很高的用户黏性。”一位分析家说。

  但在2002年,脱离Google只进行既存网页信息搜寻的模式,而凭空创造一个韩文数据库,依靠的又是无面目的大众,实在需要一点愚公移山的傻气和勇气。毕竟,那时Web 2.0还没出世呢。

  《纽约时报》上记载了一个关于Naver“知识IN”的小故事。7月4日,一个叫朴和然的女高中生,打算从釜山的巴士终点站去海鲜市场,她想知道最短的路线。她在Naver的“知识IN”上提问,很快就得到了答案:从哪里上车,在哪里转车,从哪个出站口出来,到海鲜市场大概需要多少时间,甚至还有一张手绘的简单地图。帮助她的是周英俊,一个素不相识的老伯,在海鲜市场附近卖彩票,那条路他已经走了几十年了。这位周老伯是Naver的“知识明星”之一,每天花3小时在Naver上回答别人的问题。3年来,他已经帮别人回答了2520个问题,大部分是关于釜山的交通路线。他的劳动没有为他带来任何收入,但他说,“帮人也会上瘾”。

  Naver在韩文中是“邻居”的意思。Naver之所以成为这个国家的搜索之王,就因为在3000多万韩国网民(占韩国人口70%,而且绝大部分使用宽带网络)之间营造了“天涯若比邻”的亲切感。对韩国人来说,Naver不只是一个搜索信息的工具,而是一种切实的生活工具。他们可以在这里问一切问题,橘子吃多了会不会脸色发黄,哪家整容店最擅长整鼻子,哪里能买到好的墙纸,哪家银行的房屋贷款利息最低,什么药物能治疗偏头疼,朝鲜是不是在造核武器??而且,他们基本上没有失望过。或许这也说明了韩国人在生活方式上的趋同,他们很少有特别的怪癖。

  据Naver官方表示,“知识IN”里的答案都具相当的水准,在准确性和自我监管上堪比维基百科。如果这话不属夸张,也许是因为韩国人天性里的认真劲,尤其是像周老伯那种“知识明星”,俨然以“意见领袖”自居,他们回答问题的态度非常严谨。

  成千上万的朴和然与周老伯,平均每天在“知识IN”上提出4.4万个问题,得到11万个答案。经过5年时间,一个庞大的韩文数据库——“知识IN”建成了,累积了4.9亿个条目,这些用户生产的海量数据成了Naver搜索引擎数据库的主要内容。

  比起Google高效率的机器算法,这种“人肉搜索”的方式固然原始,但一个人能解答另一个人的问题,这是数学方程式永远无法解决的。有时候,最笨的办法就是最聪明的办法。Yahoo就是在Naver之后开始在全球21个国家陆续推行“Q&A”服务的,包括英文版的Yahoo Answer。去年,Naver在本土最大的竞争对手Daum为了扩大市场份额,与韩国670万个“咖啡吧”合作。“咖啡吧”也是韩国互联网特色,并非物理意义上的网吧,而是以某种特殊兴趣联系在一起的网络社区,最大的“咖啡吧”有300多万会员。和“知识IN”一样,这些虚拟网吧累积了大量用户提供的韩文内容,使Daum的市场份额在两年内增加了30%。

  除了“知识IN”之外,Naver还与内容提供商合作,搭建包括报纸、图书、电影、音乐在内的各种数据库,并将这些数据库与“知识IN”整合。这样,当用户输入一个关键词后,会依序出现该关键词在字典、博客、知识IN、Caf(社群)、专门数据、影像、书籍、最新新闻、网站、网页、图片、地区情报等多个Naver数据库内的相关信息。Naver将这种搜索技术称为“整合搜索”,它的独特之处在于,在Google机器算法的基础上加入了对用户搜索习惯的分析,并利用人力来监控关键词的使用趋势,以此决定搜索结果的排列顺序。每个数据库的搜索结果会根据个人用户在该数据库中的行为经验而随时调整排列顺序。

  凭借“知识IN”与“整合搜索”两大法宝,Naver很快拿下了韩国搜索市场的半壁江山。之前,他们经过3年的辛苦挣扎,所得份额不过18.8%。《新闻周刊》报道说:“Naver是一个很好的案例,证明本土门户,尤其在非英语国家,利用本土文化与习惯,完全能够打败Google这样的巨人。”

  ChaCha、Mahalo、Wikia:老把戏还是新希望?

  “谁也不可能再造一个Google出来。除非另辟蹊径,在Google的弱点里做新文章。”这几乎是所有新搜索引擎的共识。像Naver的“知识IN”,就是利用了Google在少数语种数据库上的弱点。Google在俄国遭遇滑铁卢,只占9%的市场份额,据说很大程度上也是因为俄语复杂的语法特点,名词有3种性别,6个变格。

  开发者们还有另外一个共识: Google的IQ很高,但情商不够。它纯粹利用计算能力和机器算法,效率很高,而且愈发精确和广泛,但始终缺乏人味。更聪明的搜索引擎,应该像人一样,能准确理解每个关键词的意义,知道搜索者到底想要查什么,并迅速给出正确答案。

  也许是看到了维基百科、DIGG的“群体智慧”所爆发的惊人力量,很多风险投资开始重新估量“人”的作用。与天花乱坠的新搜索技术相比,他们更愿意将赌注压在混合型的搜索引擎研发上——利用人的智慧弥补机器算法的不足。这种搜索引擎有一个时髦的名字“社会型搜索”。ChaCha、Mahalo都是典型代表。

  ChaCha是M.I.T.人工智能实验室的科学家斯库特·琼斯(Scott Jones)创办的。ChaCha的名字源于中文“查查”与拉丁文“舞会”,主页上赫然写着“搜索+人脑”,它聘了3万个活人向导帮你搜索。如果常规的搜索找不到你想要的东西,只要打开网站上的即时聊天窗口,就可以免费向任何一个向导提问,就像我们的114咨询台一样。这些向导以大学生、退休人士、住家父母为多,他们每小时赚5到10美元,大部分很有礼貌,也能准确理解你的意图,但用处有限。试了几个词条,感觉他们的搜索能力只是比一般人稍强一点,没准他们也是用的Google。像库特·琼斯所描述的那种“神奇时刻”——搜到筋疲力尽时,蓦然回首,ChaCha送你一个梦想中的答案——并不多。ChaCha的搜索模式大概更适合老人和小孩。不过,这种真人对话的搜索方式感觉不错,就像打咨询电话时,听到的是活泼的人声,而不是沉闷的机器留言。

  Mahalo是夏威夷语,意思是“你好”。不少投资人和技术专家看好Mahalo,因为它的主人是Weblog的创始人贾森·卡拉卡尼斯(Jason Calacanis)。此人在硅谷很有些名气,又喜欢折腾。他把Weblog卖给AOL后,加入了AOL。他对搜索技术并不熟悉,但他发现AOL搜索引擎很有问题——在关键词与搜索结果之间有太多的“赞助链接”,虽然赚得一时的钱,但最终是自绝于用户。

  贾森关于搜索引擎的灵感来自于他的新婚妻子。她在给亲友的一封邮件里将婚礼的日程排列得井井有条,哪里玩、哪里住宿、做些什么??整洁而充实。他想,为什么搜索引擎不能这样排列信息呢?

  他的计划很取巧——他要创建一个人力搜索引擎,但只对30%最流行的关键词(约1.5万个)编排搜索结果。也就是说,Mahalo只会为“帕里斯·希尔顿”、“比尔·盖茨”、“iPod”提供“最人性化的”搜索结果,但不会为你搜索某个高中篮球队或者你的小学老师。他没兴趣做“长尾”,只对搜索市场中利润最丰厚的部分感兴趣。当然,如果有人非要在Mahalo搜索小众词,它会自动返回Google的搜索结果。贾森说,“这是利用Google来对付Google”。

  Google的背后有20万台服务器,1万名雇员。Mahalo目前只有20台服务器,60名员工。他们每天坐在电脑前一个一个关键词地编排搜索结果。做单个网页的链接索引可能就要好几个小时,如果这个关键词足够复杂。不同于ChaCha的业余向导,Mahalo的编辑们个个都是专业人员,不大得意的小说家、编剧、歌手、艺术家、演员,享受3.5万美元的年薪。“我不担心编辑成本,就像Google不担心服务器成本。”贾森计算过,Google每年每台服务器的维修费用在4000美元。维护几台服务器的钱,足够让一个人安心坐下来,每年编写500个关键词搜索结果,100人一年就是5万个,他计划在2008年做到2.5万个。

  Google的一位工程师嘲笑Mahalo根本连“搜索引擎”都算不上,充其量不过是个人工编绘的网页目录。10年前Ask jeeves的老把戏,ask.com早已弃之如敝屣。Yahoo的人工目录从来没能积累人气,微软也早已放弃了利用人力来编辑搜索结果。“何必搞什么Mahalo,直接去维基百科不就得了?”

  其实,维基百科的创始人吉米·威尔士(Jimmy Wales)何尝没有挑战Google的计划?他从3月初一直在鼓吹一款“开源搜索引擎”——Wikia,与维基百科一样采用“任何人可以编辑”的运作模式,计划由2000多个社区共同维护。他的观点也是“单纯依靠数学公式无法产生始终相关的搜索结果,人类的智慧将成为搜索的重要组成部分”。Wikia已经得到了1400万美元的融资,公开版本将在年底推出。

 




    (本站大部分文章来自网络收集和整理,如有侵权请联系我们,24小时内处理.)



佛山市红盾信息网
网络110报警