《搜索引擎发展综述》由会员分享,可在线阅读,更多相关《搜索引擎发展综述(14页珍藏版)》请在金锄头文库上搜索。
1、搜索引擎发展综述,指导教师:王轩 报 告 人:延霞,主要内容,搜索引擎的产生、发展过程搜索引擎的分类及原理搜索引擎分类与检索技术的分析和展望,搜索引擎发展史,产生:1990年Archie蒙特利尔大学的Alan Emtage开发的ftp搜索系统。1993年10月,ALIWEB系统:网站自己提交索引信息。(yahoo)1993年底,基于spider的搜索引擎出现,1994年4月,yahoo:自附简介信息,效率高WebCrawler:支持全文检索1994年7月,Lycos:网页自动摘要1995年,元搜索引擎Metacrawler1995年12月,Altavista:自然语言搜索,高级搜索语法(AND
2、、NOT、OR),1997年,天网:教育网优势、ftp搜索、主题搜索1998年,google:pagerank、动态摘要、网页快照等。1999年,Fast/AllTheWeb:利用ODP自动分类2001年,Teoma:类似自动分类的refineBaidu:最大的中文数据库,搜索引擎分类,严格意义上的搜索引擎目录索引元搜索引擎,基于目录索引的搜索引擎原理,实际上是按目录分类的网站链接列表网站所有者向搜索引擎提交网站,并人工填写网站简介信息,手工操作超级目录索引。 例如:yahoo,标准的搜索引擎工作原理,从互联网抓取网页,建立索引数据库,检索排序,自动信息收集功能,定期搜索,派出spider程序
3、对一定范围内的网站进行检索,发现新的或更新后的网站会自动提取网站信息加入数据库。网站所有者主动向搜索引擎提交网址,然后搜索引擎在一定时间内派出spider程序搜集有关信息加入数据库。(天网),检索与排序技术,索引信息检索 全文检索 超链分析技术,超链分析技术,除了分析网页本身内容,还分析所有指向该网页的链接的url、文本甚至链接周围的文字。,松花湖风 光介绍,A . 湖泊 ,B . 湖泊 ,C . 湖泊 ,D . 湖泊 ,E . 湖泊 ,Google的PageRank技术,链接1 链接2,100,53,链接1 链接2 链接3,9,50,3,3,检索结果排序的新技术,网页权值随关键词的变化而改变WiseNut,网页InfoText InfoText 链接 InfoText,网页检索中的P2P技术应用 对等搜索,通过共享所有硬盘上的文件、目录乃至整个硬盘,用户搜索时无需通过Web、不受信息文档格式的限制。,