搜索引擎技术.doc

上传人:人*** 文档编号:562342619 上传时间:2023-12-12 格式:DOC 页数:4 大小:39.01KB
返回 下载 相关 举报
搜索引擎技术.doc_第1页
第1页 / 共4页
搜索引擎技术.doc_第2页
第2页 / 共4页
搜索引擎技术.doc_第3页
第3页 / 共4页
搜索引擎技术.doc_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《搜索引擎技术.doc》由会员分享,可在线阅读,更多相关《搜索引擎技术.doc(4页珍藏版)》请在金锄头文库上搜索。

1、浩如烟海的Internet上,特别是其上的Web(World Wide Web万维网)上,不会搜索,就不会上网。网虫朋友们,你了解搜索引擎吗?它们是怎么工作的?你都使用哪些搜索引擎?今天我就和大家聊聊搜索引擎的话题。一、搜索引擎的分类获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(FullText Search Engine)和分类目录Directory)。全文搜索引擎的数据库是依靠一个叫“网络机器人(Spider)”或叫“网络蜘蛛(crawlers)”的软件,通过网络上的各种链接自动获取大量网页信息内

2、容,并按以定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”(http:/ Search Engine)。这类搜索引擎一般都没有自己网络机器人及数据库,它们的搜索结果是通过调用、控制和优化其它多个独立搜索引擎的搜索结果并以统一的格式在同一界面集中显示。元搜索引擎虽没有“网络机器人”或“网络蜘蛛”,也无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术

3、。比如“metaFisher元搜索引擎”(http:/ Search Page)。集成搜索引擎是通过网络技术,在一个网页上链接很多个独立搜索引擎,查询时,点选或指定搜索引擎,一次输入,多个搜索引擎同时查询,搜索结果由各搜索引擎分别以不同页面显示,比如“网际瑞士军刀”(http:/ Search Engine)是将用户提交的检索请求发送到多个独立的搜索引擎上去搜索,并将检索结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处理搜索结果、个性化搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。4.热词搜索,当前移动互联网时

4、代,更适合手机,平板电脑使用移动互联网时代,越来越多人用手机,平板电脑,android,ipad横行,屏幕小,触屏操作的方式对旧的搜索使用方式带来了挑战,热词它以最简洁的形式来展现,更适合触屏年代的操作。四、主要的搜索引擎介绍这里介绍的是在国内外影响比较大的主要的一些搜索引擎和分类目录站点,由于现在的站点一般都同时提供全文搜索和分类目录两种服务,所以我们按照其自有的技术进行分类和介绍。Google(http:/ .HitHot热词搜索(http:/www.hithot.cc ).新兴的热词搜索服务商,它收录了当前网络上的热词,通过语义搜索来聚合,以HTML5的形式来展现,词与词之间的关联度也以

5、颜色,字体大小形式来区分。热词搜索适合当前移动互联网使用习惯,触屏,手指点击热词更方便。五.站内搜索除了有影响力的搜索引擎网站外,各个网站自己也需要建立自己的站内搜索,尤其是资讯量超大,电子商务网站竞争激烈的现在,站内搜索可以用baidu,google的免费站内搜索,但二者无法客制化,需要开发所有页面让爬虫抓取,带来速度慢,安全的问题.另外也可以自己独立开发站内搜索,用开源的lucen,也可以采用成熟的站内搜索产品,如Wise站内搜索(http:/),,该产品可以快速的导入到已有的网站里,做到安全,快速,高效。 完全独立的站内搜索技术,才能让网站面支持更大的数据量时代。未来的网络肯定会带来更多智能化的搜索技术。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号