12-网络信息资源-1剖析

上传人:今*** 文档编号:107034353 上传时间:2019-10-17 格式:PPT 页数:120 大小:15.19MB
返回 下载 相关 举报
12-网络信息资源-1剖析_第1页
第1页 / 共120页
12-网络信息资源-1剖析_第2页
第2页 / 共120页
12-网络信息资源-1剖析_第3页
第3页 / 共120页
12-网络信息资源-1剖析_第4页
第4页 / 共120页
12-网络信息资源-1剖析_第5页
第5页 / 共120页
点击查看更多>>
资源描述

《12-网络信息资源-1剖析》由会员分享,可在线阅读,更多相关《12-网络信息资源-1剖析(120页珍藏版)》请在金锄头文库上搜索。

1、网络信息资源,图书馆文献检索教研检室 王春晓,网络信息资源 是指以电子数据的形式存储在光、 磁等非印刷型的载体中,并通过网络、 计算机或终端方式再现出来的文字、 图像、声音、动画等多媒体信息资源。,引言,网络信息资源检索 是利用网络信息资源进行的检索。,引言,网络信息资源大致可以分为两类: 一类是来自正式文献信息源的信息,内容可靠,质量高,一般都有检索平台。,引言,另一类是各类网站上的信息,这些信息包罗万象,良莠不齐,一般用搜索引擎等网络工具进行检索。,网络信息资源检索方法: 浏览,引言,顺“链”而行,网络信息资源检索方法: 输入网址直接访问,引言,网络信息资源检索方法: 利用搜索引擎 通过搜

2、索引擎来查找自己想要的网址或信息是最快捷,也是最佳的检索途径。,引言,50%,主要内容,一、搜索引擎 二、医学网站 三、文献传递,一、搜索引擎,(一)搜索引擎概述 (二)常用搜索引擎介绍 (三)医学专业搜索引擎,1.概念,搜索引擎(Search Engine)又称检索引擎,广义上是指一种基于Internet上的信息查询系统,包括信息存取、信息组织和信息检索;狭义上指一种为搜索Internet上的网页而设计的检索软件(系统)。,(一)搜索引擎概述,1.概念,搜索引擎是一个为用户提供网上信息检索服务的网站,它使用某些程序把国际互联网上的信息归类、标引,以帮助人们在茫茫网海中搜寻到所需要的信息。,检

3、索工具(网络),(一)搜索引擎概述,2.组成部分,(1)搜索器 (2)索引器 (3)检索器 (4)用户接口,(一)搜索引擎概述,2.组成部分,(1)搜索器 从一个起始URL(网页地址)集合开始,顺着这些URL中的超链循环地在因特网中扫描与搜索网页信息。它常常是一个计算机程序,日夜不停的运行。由于因特网上的信息更新很快,除了搜索新信息外,还要定期更新已经搜集过的旧信息,以避免死链接和无效链接。,(一)搜索引擎概述,2.组成部分,(一)搜索引擎概述,(2)索引器 分析处理搜索器所搜索的信息,从中抽取出客观索引项(如作者名、URL、更新时间、编码类型、长度等)和内容索引项(如关键词及其权重、短语、单

4、字等),建立网页索引表。,2.组成部分,(一)搜索引擎概述,(3)检索器 根据用户的查询在索引列表中快速检出网页信息,对查询结果进行相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。,2.组成部分,(一)搜索引擎概述,(4)用户接口 用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制,主要目的是方便用户使用搜索引擎,高效率、多方式的从搜索引擎中得到有效、及时的信息。,信息采集,数据标引,数据组织,检索功能,从互联网上抓取网页,建立索引数据库,在索引数据库中搜索排序,3.工作原理,(一)搜索引擎概述,3.工作原理,信息采集,利用网络自动搜索软件,如机器人(rob

5、ot)、蜘蛛(spider)、爬虫(crawler)等去网上定期抓取各个网站、网页的信息。,(一)搜索引擎概述,3.工作原理,数据标引,由分析索引系统程序对收集回来的网页进行分析,提取网页信息,根据一定的相关度算法进行计算,形成网页索引数据库。为提高标引的准确性,有的搜索引擎同时采用人工标引,如Yahoo中的分类标引。,(一)搜索引擎概述,3.工作原理,搜索引擎的一条记录对应于一个网页(Web page)或一个网站(Web site)。不同的Web检索工具有不同的记录格式,常见的记录内容有:网站(页)标题、描述网站(页)内容的摘要或关键词、网址(URL)等。,数据组织,(一)搜索引擎概述,3.

6、工作原理,常用的运算符号和提供的检索功能有:布尔算符、+ -、词组检索、自然语言检索、分类浏览、检索限定、语种翻译等。为了让用户先阅读到那些最相关的网页,不少搜索引擎还具有自动排序功能,即把与输入关键词相关程度高的网页排列在前(如Google)。,检索功能,(一)搜索引擎概述,4.类型,(1)全文搜索引擎 (2)目录式搜索引擎 (3)元搜索引擎,(一)搜索引擎概述,4.类型,(1)全文搜索引擎 主要采用机器人技术,通过“机器人”、“蜘蛛”、“爬虫”等去网上抓取各个网站、网页信息,还可实现自动分类、自动标引、自动文摘等。数据量大,关键词检索功能强。查全率高,查准率低。 如:Google、百度等,

7、(一)搜索引擎概述,4.类型,(2)目录式搜索引擎 主要是指由人工发现、抓取、辨别网上信息,依靠编目、标引人员的知识,按照图书分类、学科分类或其它分类依据,建立主题树分层目录,并将采集、筛选后的信息分门别类地放入各大类或子类下面。,(一)搜索引擎概述,4.类型,(2)目录式搜索引擎 适合主题浏览,查准率高,查全率有限,分类依据具有科学性和标准性。 如:雅虎、新浪、搜狐、网易等,(一)搜索引擎概述,4.类型,(3)元搜索引擎 被称为是搜索引擎之上的搜索引擎,是一个要调用其它搜索引擎的搜索引擎。通过统一的用户界面,可同时查询多个Web检索工具。 如:Dogpile 、WebCrawler 、搜霸天

8、下等,(一)搜索引擎概述,(3)元搜索引擎,Dogpile Dogpile是一个著名的元搜索引擎,诞生于1996年1月2日,是目前性能较好的统一检索入口式元搜索引擎之一。每一条搜索结果都综合自数个搜索引擎,包括Google, Yahoo!, Ask Jeeves, About, FindWhat, LookSmart,Live等。Dogpile提出的口号是“Good Dog,Great Results“。,(一)搜索引擎概述,(3)元搜索引擎,WebCrawler 是一款元搜索引擎,整合了 Google、Yahoo!、Bing Search、A、 A、MIVA、LookSmart以及其它流行搜

9、索引擎中靠前的搜索结果。WebCrawler同时也为用户提供图片、音频、视频、 新闻等搜索。,(一)搜索引擎概述,全文搜索引擎,目录式搜索引擎,界限渐趋模糊 两者合二为一 常统称为搜索引擎,一、搜索引擎,(一)搜索引擎概述 (二)常用搜索引擎介绍 (三)医学专业搜索引擎,Google:http:/ 百 度:http:/ Yahoo:http:/ 新浪网: http:/ 网 易: http:/ 搜 狐: http:/,(二)常用搜索引擎介绍,百度是全球最大的中文搜索引擎、最大的中文网站。2000年1月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。 “百度”二字源于中国

10、宋朝词人辛弃疾的青玉案元夕词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。,1.百度简介,1.百度简介,“熊掌”图标的想法来源于“猎人巡迹熊爪”的刺激,与李彦宏博士的“分析搜索技术”非常相似,从而构成百度的搜索概念,也最终成为了百度的图标形象。在这之后,由于在搜索引擎中,大都有动物形象来形象,如SOHU的狐,如GOOGLE的狗,而百度也便顺理成章称做了熊。百度熊也便成了百度公司的形象物。,(1)基本搜索 (2)高级搜索 (3)其他搜索,2.百度检索方法,(1)基本搜索,(1)基本搜索,检索规则说明: 用空格链接多个检索词,系统默认检索词间的逻辑关系为AND。,使用“A | B”

11、来搜索“或者包含关键词A,或者包含关键词B”的网页,相当于OR。,(1)基本搜索,检索规则说明: 支持“-”功能,相当于not,用于有目的地删除某些无关网页,但减号之前必须留一空格。,(2)高级搜索,(3)其他搜索,百度识图,基本检索,高级检索,一、搜索引擎,(一)搜索引擎概述 (二)常用搜索引擎介绍 (三)医学专业搜索引擎,(三)医学专业搜索引擎,1. Medical Matrix 2. Medscape 3. Word Wide Science,1.Medical Matrix,http:/www.medmatrix.org,是由美国医学信息学会主办的,经过分级和专家评价,是一个重要的医学

12、专业搜索引擎。它包含一个Internet临床医学数据库,提供关键词检索和分类目录检索,最适合临床医师使用。,Medical Matrix对所收录的每个网站都作了简要介绍、归类、评价,分为5个星级。,1.Medical Matrix,基本检索,1.Medical Matrix,Exact Phrase 精确词组或完整句子 All Words 全部单词 Any Words 含有任何一个或多个单词,1.Medical Matrix,选择检索资源范围:新闻资源、病例或临床影像资源、X线影像资源、病人教育资源、继续医学教育资源和药物类目。,1.Medical Matrix,高级检索,检索框,同时检索检索

13、词的同义词,选择资源类型和性质,1.Medical Matrix,分类检索,专业,疾病种类,临床应用,文献,教育,健康和职业,医学和计算机,市场,2.Medscape,http:/,Medscape是最早的优秀的医学专业门户之一,主要为临床医生和其他医学工作者提供高质量的及时的专业医学信息。,设有多个栏目,提供关键词检索服务,也可按学科专业查询。,免费注册,并根据用户注册的专业和身份提供不同的个性化主页。,基本检索,按专业分类浏览,药物/疾病,注册,3.Word Wide Science,http:/worldwidescience.org,由美国能源部和英国图书馆推出的一个跨库、跨语言、一站

14、式的全球科学信息平台,其科学信息来自70多个国家的76个科学数据库。由于其来源数据包含有较多生命科学资源,故可以用于检索生物医学信息。,实现了跨语言搜索,支持阿拉伯语、汉语、英语、德语、日语等10种语言进行检索。,基本检索,可进行多语种翻译搜索,高级检索,主要内容,一、搜索引擎 二、医学网站 三、文献传递,二、医学网站,(一)政府机构网站 (二)医药学(协)会、组织网站 (三)医药综合信息网站 (四)国家科技图书文献中心,中华人民共和国卫生部() 中国疾病预防控制中心 () 世界卫生组织(http:/www.who.int) 美国国立卫生研究院(http:/www.nih.gov) 美国国家医

15、学图书馆(http:/www.nlm.nih.gov) 英国国家卫生图书馆(http:/www.library.nhs.uk),(一)政府机构网站,() 美国医学会(http:/www.ama-assn.org) 美国药理学与实验治疗学学会ASPET (http:/www.aspet.org) 美国生物化学与分子生物学会ASBMB (http:/www.asbmb.org),(二)医药学(协)会、组织网站,中国生物信息网(http:/www.biosino.org) 中国医药信息网() 美国国立生物技术信息中心(www.ncbi.nlm.nih.gov) 欧洲生物信息学研究所(http:/ww

16、w.ebi.ac.uk) 日本国立遗传学研究所(http:/www.nig.ac.jp/),(三)医药综合信息网站,国家科技图书文献中心是根据国务院领导的批示于2000年6月12日组建的一个虚拟的科技文献信息服务机构,由中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆组成。,(四)国家科技图书文献中心(NSTL),该中心收藏有中外文期刊、图书、会议资料、科技报告、学位论文等各种类型、各种载体的科技文献信息资源,其主要任务是面向全国提供文献检索、原文提供、期刊浏览、引文检索等服务。 文献检索是面向所有用户免费开放的,而原文提供则是向注册用户提供的全文传递服务。 网址:,(四)国家科技图书文献中心(NSTL),1.查找浏览你感兴趣的某

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号