第三章网络信息资源检索

上传人:bin****86 文档编号:54845155 上传时间:2018-09-20 格式:PPT 页数:105 大小:11.10MB
返回 下载 相关 举报
第三章网络信息资源检索_第1页
第1页 / 共105页
第三章网络信息资源检索_第2页
第2页 / 共105页
第三章网络信息资源检索_第3页
第3页 / 共105页
第三章网络信息资源检索_第4页
第4页 / 共105页
第三章网络信息资源检索_第5页
第5页 / 共105页
点击查看更多>>
资源描述

《第三章网络信息资源检索》由会员分享,可在线阅读,更多相关《第三章网络信息资源检索(105页珍藏版)》请在金锄头文库上搜索。

1、第三章 网络信息资源检索,网络社会,在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是终身学习的需要,也是个人信息素养中的重要内容。相对与本馆纸质文献信息资源和数字资源的检索利用,其对人的影响更为深远。所以在章中不仅仅介绍网络信息资源及其利用,还对网络融入生活、网络融入学习等方面的内容做了介绍。,本章内容,3.1 网络信息资源概述 3.2 搜索引擎 3.3 网络开放存取资源,3.1 网络信息资源概述,3.1.1 网络信息资源的特点 3.1.2 网络信息资源的类型 3.1.3 网络信息检索的一般方法,3.1.1 网络信息资源的特点,1.概

2、念:网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。,3.1.1 网络信息资源的特点,2.特点:(1)内容角度:数据海量类型多样更新高频化(2)形式角度:数字化存储、传递动态性开放性(3)效用角度:共享性时效性交互性,3.1.2 网络信息资源的类型,(1)按照信息交流的方式划分:正式出版 半正式出版 非正式出版 (2)按照信息格式划分:网络文献格式有HTML、TXT、DOC、PDF、RM、MP3等等。,(3)按信息内容的表现形式和内容划分可分为 全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院

3、的各类教材,政府出版物,标准全文等; 事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; 实时型信息资源:各类投资行情和分析、娱乐、聊天、网络新闻组讨论、BBS、网上购物等。 数值型信息:主要是指各种统计数据; 其它型信息资源是指图片、动画、音乐、影视、广告等。,3.1.2 网络信息资源的类型,(4)按所采用的网络传输协议可分为 WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。 FTP信息资源:它使用ftp协议,该协议主要用于连网计算机之间传输文件。F

4、TP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。 TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。 用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。,4.1.2 网络信息资源的类型,建院FTP,搜狐BBS,水木清华BBS,建院百度贴吧,BLOG新浪博客,博客,3.1.3 网络信息检索的一般方法,1.漫游法(浏览式检索)所见即所得,通过网页链接,顺着链接浏览。包

5、括偶然发现、顺“链”而行、网址查询。 2.网络资源指南法指通过网络资源指南来查找信息网络资源目录式搜索引擎,或网络资源目录。 3.搜索引擎法通过搜索引擎进行文献查询,是最常用的信息查询的方法,通过输入一定的关键词进行关联检索。,浏览式检索,网络地址法,搜索引擎法,3.2 搜索引擎,3.2.1 搜索引擎概述 3.2.2 搜索引擎的使用技巧 3.2.3 综合性搜索引擎 3.2.4 专业性搜索引擎,1.搜索引擎的发展 搜索引擎 是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。 从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框

6、输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。,3.2.1 搜索引擎概述,【搜索引擎的起源】,1990年,加拿大麦吉尔大学计算机学院的师生开发出Archie。当时,万维网还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引

7、擎的鼻祖。,2.搜索引擎的分类,按信息搜集方法和服务提供方式 目录搜索引擎(如雅虎、搜狐) 全文搜索引擎(如Google、百度) 元搜索引擎(如搜魅网),(1)目录索引引擎,以人工方式或半自动方式搜索信息,由编辑员查看信息后,人工形成信息摘要,并将信息置于事先确定的分类框架中,提供按目录分类的网站链接列表。 优点:信息准确、导航质量高。 缺点:人工介入、维护量大、信息更新不及时。,目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的

8、Yahoo、新浪分类目录搜索。,雅虎的分类目录,新浪分类目录,(2)全文搜索引擎通过从互联网上提取各个网站的信息,建立数据库,从中检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。 优点:信息量大、更新及时。 缺点:返回信息过多,有很多无关信息,必须从结果中进行筛选。,全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序,俗称“蜘蛛”程序或“机器人”程序

9、,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。,(3)元搜索引擎,元搜索引擎(matesearch)又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问一次搜索多个搜索引擎,并将结果返回给用户。有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合。 优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。 缺点:因为有时候并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。,搜魅网,h

10、ttp:/ “山寨搜索” 】,随着搜索市场竞争的白热化,搜索引擎不仅开始深挖自己的战壕,还开始打起了口水战,而山寨搜索引擎在高举着“整合”的大旗,开始大摇大摆地进入这个本来只有巨头垄断的市场。国人充分发挥着其无比的想象力,准备让国内的互联网“步入搜索新时代”。山寨搜索引擎代表。“百google度”- 最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨搜索引擎的模式,而且访问量很高,但功能简单,而且让用户需要不停的两边拖拉才能看到完整的结果。“百谷虎”- 由于某家新闻媒体的报道,最近声名大振,高举着“山寨”大旗,让国人开始了解什么是山寨搜索引擎,名字极富创意。可惜由于搜索结果被并排挤在一起,似乎

11、没有什么实际使用价值。,搜索引擎为什么没有收录我的网站?,网站没有被收录主要有几方面的原因: 1、网站的设计上存在问题; 2、上线时间较短,搜索引擎还没有来的及收录; 3、网站因某种原因被搜索引擎惩罚。,3.2.2搜索引擎的使用技巧,1.选择合适的搜索引擎 2.选用准确的关键词 3.使用高级搜索 4.检索结果的处理(只阅读搜索结果的前几条信息、缩小搜索范围、搜索不到网页时要检查拼,查看关键词是否矛盾等、仍找不到可以链接相近的网页。),搜索引擎高级检索功能,高级检索命令:(1)将搜索范围限定在网页标题中 intitle: (2)将搜索范围限定在特定站点中 site: (3)将搜索范围限定在URL

12、链接中 inurl: (4)将搜索范围限定在网页部分中 intext: (5)限定搜索的文献类型 filetype:,intitle:举例,相关结果约5,550,000,相关结果约152,000个,site:举例,仅一条,相关结果约2,500,000个,相关结果约23,500,000,Inurl:举例,URL统一资源定位符 也被称为网页地址。 URL由三部分组成:协议类型,主机名和路径及文件名。,filetype:举例,3.2.3 综合性搜索引擎,,http:/ Google,谷歌 Google,Google成立的第一步始于 Google 创始人 Larry Page 和 Sergey Bri

13、n 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。Google 目前被公认为全球规模最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间得到相关的搜索结果。,谷歌 Google,Google公司选用“Google”一词用来代表在互联网上可以获得的海量的资源。 “Google”一词源于单词“Googol” ,据说是因拼错而产生的。“Googol“ 指的是10的100次幂,写出的形式为数字1后跟100个零。Google公司采用这个词显示了公司想征服网上无穷无尽资料的雄心。Google公司没有采用Googol可能是因为版权的问题,而且当他们注册G的时候,

14、G已经被注册。 Google词义的另一种解释:G意义为手,OO为多个范围,L意为长,E意为出,把它们合一起,意义为:我们GOOGLE无论在哪里都能为您找出很长的一大堆您想要的。,谷歌 Google(高级搜索),谷歌 Google(搜索帮助),谷歌 Google(搜索帮助),谷歌 Google(产品大全),Google地图,Google地图,百度 baidu,百度 baidu,其网址为http:/,每天处理来自超过138个国家超过数亿次的搜索请求。是全球最大的中文搜索引擎,百度公司于1999年底成立于美国硅谷,它的创建者是在美国硅谷有多年成功经验的李彦宏及徐勇。2000年1月,百度公司在中国成立

15、了它的全资子公司百度网络技术(北京)有限公司致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的青玉案诗句:“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。,百度 baidu,高级搜索,百度 baidu(高级搜索),百度快照,雅虎 Yahoo!,雅虎(Yahoo!)是美国著名的互联网门户网站,20世纪末互联网奇迹的创造者之一。 雅虎在全球共有24个网站,12种语言版本,其服务包括搜索引擎、电邮、新闻等,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。同时也是是一家全球性的因特网通讯、商贸及媒体公司。其中雅虎中国网站()于199

16、9年9月正式开通,它是雅虎在全球的第20个网站。 雅虎中国网站()为用户提供了强大的搜索功能,通过其14类简单易用、手工分类的简体中文网站目录及强大的搜索引擎,用户可以轻松搜索到政治、经济、文化、科技、房地产、教育、艺术、娱乐、体育等各方面的信息。,雅虎 Yahoo!,AllTheWeb,AllTheWeb,新浪科技讯 北京时间2011年3月19日早间消息,雅虎今日宣布,将于4月4日关闭旗下搜索引擎AllTheWeb。AllTheWeb是雅虎2003年从Overture收购的。这是去年12月以来第二个遭此命运的雅虎旗下网站。上个月,雅虎宣布将于5月24日关闭博客社交网站MyBlogLog。社交书签网站Delicious也在关闭名单之列,周四有消息人士透露,雅虎计划以100万至200万美元的价格将其出售。雅虎还从Overture交易中获得了搜索引擎AltaVista,该网站在去年12月登上了关闭名单,但雅虎尚未公布关闭这项服务的具体日期。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号