未来的搜索引擎探析

上传人:世*** 文档编号:178975257 上传时间:2021-04-07 格式:DOC 页数:5 大小:25KB
返回 下载 相关 举报
未来的搜索引擎探析_第1页
第1页 / 共5页
未来的搜索引擎探析_第2页
第2页 / 共5页
未来的搜索引擎探析_第3页
第3页 / 共5页
未来的搜索引擎探析_第4页
第4页 / 共5页
未来的搜索引擎探析_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《未来的搜索引擎探析》由会员分享,可在线阅读,更多相关《未来的搜索引擎探析(5页珍藏版)》请在金锄头文库上搜索。

1、 未来的搜索引擎探析网络搜索的介入变成决定了网民决定消费购买非常重要的环节:没搜索,不购买,这几乎成为许多网民的口头禅。中国网民对搜索引擎的使用依赖程度正达到史无前例的高度:从2003年的23%使用率,到2009年的98.7%的使用率,搜索引擎已经无可争议成为网络的杀手级应用。网民的购买行为也因网络社会的全面到来发生了重要变化,购买行为从最初的AIDMA模型(关注-兴趣-渴望-记忆-行动) 变成了AISAS模型(关注-兴趣-搜索-行动-分享),正当人肉搜索是否入刑法还在争论不休时,一款更囧(jing)更强大的搜索引擎人立方搜索惊现江湖,在瞬间为你理出一张“关系网”,是将恶搞进行到底,还是发挥其

2、独到的搜索功能,输入你的名字,就会出现你的社会关系,一场网络江湖的搜索大战拉开序幕。 “人肉搜索”是否需要立法监管的问题还在激烈讨论中,此时微软又推出一个“人立方”。近日,就有不少网友就“人立方”会否更有助于“人肉搜索”进行了激烈讨论。不少网友认为,“人立方”的推出,特别是“网状关系图”的推出,确实将有助于“人肉搜索”。“一般网友在网上进行人肉搜索的时候,还要花时间理清搜索得来的人物关系,现在人立方推出一个网状关系图,被搜索者的人脉关系能够一目了然,减轻了人肉搜索者的工作量,可能还会大大提高他们的工作效率,让他们人肉搜索到更多的东西。”一名网友在百度“人立方吧”中留言说。 2008年微软推出的

3、“人立方搜索”就是对超过十亿中文网页中的人名、地名、机构名以及中文短语进行过滤、整理和聚合,将所有与要搜索的关键词相关的信息按照网络流行度或关系亲密度进行排序,以获得更为垂直和精准的人与人之间的关系图景,揭示人的社会关系的动态进程。人立方关系搜索从超过十亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并且通过算法自动的计算出它们之间存在关系的可能性;同时,人立方关系搜索还索引了支持它们之间关系的网页文字。此外,人立方关系搜索还自动的找出人名之间最可能的关系描述词、与人名最可能相关的称呼、作品等词条等。人立方关系搜索从这些中文网页中自动的辨别出人名所对应的人物简介文字,并且按照这些文字

4、是人物简介的可能性进行排序。 当用户给定任意搜索关键词,它能够找出与关键词最可能相关的人名、地名和机构名,并且根据它们与关键词之间的相关度排序。除此之外,人立方关系搜索还提供基于人名的新闻浏览功能,可视化关系搜索功能等。 简单地说,人立方的原理是通过搜索网页,通过特定技术自动截取出名字,同多特定事件将相关人物之间联系在一起,当关于某人的新闻越多,他能找到的双关人物就越多。慢慢累积,形成一个“人立方”。 基于个体信息创造的整个网际的信息协作已经成为今天宏大网络信息工程的主流建造方式。“这一技术的创造、发展与完善,必将有效地帮助人们认知互联网世界所记录的现实社会中人与人的关系,认知人与人之间的关系

5、所决定的社会运行的主流动态,认知人自身在社会普遍联系结构中的位置,认知整个社会联系与运动的过程对人的自身利益与命运的影响。”(高钢绘制人的社会关系信息图景的尝试与意义,国际新闻界,2009年第5期)“人立方搜索”、谷歌地球等技术,“使人类文明第一次拥有了两个存在形态,一个是现实空间的文明形态,一个是数字空间的文明形态。两个文明形态互相依存,进行着复杂的能量交换”。(同上)这种网络信息数据是对人与人之间关系和人与自然之间关系的观察与描绘、解释与分析。 今天,搜索引擎所承载的信息采集技术、信息导航技术、信息整合技术,信息诠释技术将把每个社会成员与人类的数字世界连接起来,从而推进每一个生命的能量与整

6、个人类文明能量之间的沟通与交互。(高钢绘制人的社会关系信息图景的尝试与意义,国际新闻界,2009年第5期)而基于社交网络的搜索技术利用庞大的人际网络提供更精确的搜索结果,并实现个人的定制搜索。该技术的基本思想在于将不同的人根据不同兴趣划分为不同社区,对于某个特定的社区,他们所关注的东西是类似的,因此可以根据社区对搜索结果进行定制。例如,一个汽车爱好者的社区对汽车的相关内容更感兴趣,关注度也会更高,因此这些内容的优先级会更高。另外,同一个社区的成员之间会相互影响,所以对于某个搜索结果,该搜索记录了社区内成员的具体选择,当有同个社区的成员进行类似的搜索时,该技术就能给出更加精确的结果。未来Web3

7、.0将应用Mashup技术对用户生成的内容信息进行整合,使得内容信息的特征性更加明显,提高信息描述的精确度,便于互联网用户的搜索与整理。同时,对于UGC(User Generated Content)的筛选性过滤也将成为Web3.0不同于Web2.0的主要特征之一。对于互联网用户的发布权限经过长期的认证,对其发布的信息做不同可信度的分离,可信度高的信息将会被推到互联网信息检索的首项,同时提供信息的互联网用户的可信度也会得到相应的提高。()在聂再清看来,未来的搜索不仅仅只给用户提供一个结果,而是应该不断的帮助用户发现更多的与他所提供的关键词相关的东西。无论是人、地点还是机构,用户都不用再一个网页

8、一个网页的查找有价值的信息,这种更加丰富和便捷的互联网体验无疑会大大提高用户的粘着度。(“人立方”关系搜索很囧很强大 将恶搞进行到底 http:/ http:/ 2008-09-11 08:48 来源: 广州日报)作为国内搜索引擎巨头,人脉搜索也可能是百度未来发展的方向之一,同时,B2B电子商务巨头阿里巴巴的人脉通也在早先推出。而人脉库作为基于人脉搜索的商务SNS,用户可以根据自己的需求在站内搜索任意自己需要的产品和服务,人脉库根据之前用户注册时对于自己需求和供给的描述,将供求互补的企业和个人自动匹配,当用户基数足够大时,每个人都能在人脉库这个庞大的数据库里,上找到自己需要的最优产品和服务,并

9、且物尽其用。百度公司推出的“框计算”功能正在极大地改变网络世界的搜索功能:通过框计算背后的语义分析网民行为分析等复杂的功能运算,搜索引擎能够智能地识别网民在简单搜索背后的复杂行为心理,为网民精准地提供最具效用的搜索结果。而谷歌则针对手机上网时代的到来,推出基于手机搜索的应用软件,并将谷歌地图、谷歌地球等热门应用软件嵌入其中,为搜索创造一种随身行的便利。搜索引擎的智能化。 Web3.0时代的网络是智能网络,这是一个以整个互联网为基础,聚合了所有知识的智能平台。在这样的平台上,用户可用自然语言表达自己的查询意图,搜索引擎能够对查询进行解析,提取相关概念,组合查询表达式,从而返回准确的结果;甚至,用

10、户可以提出完整的问题,通过搜索获得一些问题的解决方案。垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。 垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。 整个过程中,数据由非结构

11、化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。 用户使用google,baidu等通用搜索引擎的方式是通过关键字的方式实现的,是语义上的搜索,返回的结果倾向于知识成果,比如文章,论文,新闻等;垂直搜索也是提供关键字来进行搜索的,但被放到了一个行业知识的上下文中,返回的结果更倾向于信息,消息,条目等。对买房的人讲,他希望找的房子供求信息和文章,新闻等不同。这个特性是他们各自的的技术特点决定的。打个比方,如果google搜索引擎是一个正金字塔型,那么垂直搜索引擎就是个倒金字塔型,两者是互补的。 我认为:垂直搜索的本质是对垂直门户信息提供方式的一次简化性的整合。

12、 搜索领域有句明言:就是用户无法描述道他要找什么,除非让他看到想找的东西,这个过程有点像找对象,碰运气是用户搜索行为的最大的特征。而垂直搜索引擎就是提高为用户提供更好的运气。 垂直搜索是服务于某项功能的,比如:用户搜索租房,买房信息就是一种垂直搜索。对信息的再加工处理是非常关键的,不管是结构化的数据,还是非结构化的数据。垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。 举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽

13、取,抽取出商品名称、价格、简介甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。 垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。 垂直搜索引擎能否赢得市场?垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是

14、范围极为缩小、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。 垂直搜索引擎概念的提出,就是针对性的为某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。可以简单的说成是搜索引擎领域的行业化分工。众多专业性网站、行业网站独立服务于互联网的成功,恰恰证明了互联网的格局应该是多方面的。通用搜索引擎的性质,决定了其不能满足特殊领域、特殊人群的精准化信息需求服务。市场需求多元化决定了搜索引擎的服务模式必将出现细分,针对不同行业提供更加精确的行业服务模式。可以说通用搜索引擎的发展为垂直搜索引擎的出现提供了良好的市场空间,势必将出现垂

15、直搜索引擎在互联网中占据部分市场的趋势,也是搜索引擎行业细分化的必然趋势。搜索引擎市场“烽烟四起”http:/中国新闻传播学评论(CJR) 2010年11月01日 来源: 人民日报 作者: 余建斌 一向只有几家巨头相斗,市场份额看似波澜不惊的搜索引擎市场,终于迎来了新的竞争者,而且为数不少。阿里巴巴联合微软新推出一淘(Etao)商品搜索的测试版,此前,人民网人民搜索测试版也上线运行,再早,已拥有一些市场份额的搜狐搜狗和微软必应搜索,都在努力拓展更大空间。往日相对平静的搜索引擎领域,让人顿生“烽烟四起”之感。众多竞争者实质性地进入搜索引擎领域,势必要改变市场格局。新来者都会将目标指向目前国内搜索

16、引擎老大百度,从一家独大的市场中分一杯羹。但绝大部分市场份额被一家搜索引擎占据,并不意味着“切蛋糕”会更容易些。对用户来说,一旦习惯依赖一种搜索工具,忠诚度将极高,也意味着搜索引擎作为其互联网入口的粘度极强。对后来者而言,挑战难度不小。而此前百度在与技术和资金都十分雄厚的谷歌中国角逐中,已积累了很多核心技术和经验。对于百度的新老对手们,最好的途径还应是开发满足用户需求的新技术,扩大在挖掘用户新需求、更加方便快捷等特性方面与其他搜索引擎的差异性。目前来看,大概有这样可预见的趋势:更实时、更精准,以及更富粘性。在发展中,搜索引擎将越来越满足人的精细体验和深层次需求。这一切,不仅适用于传统互联网,也适用于移动互联网,在用户需求面前,这两种平

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号