第七章网络信息检索 (2)

上传人:宝路 文档编号:48603796 上传时间:2018-07-18 格式:PPT 页数:119 大小:9.87MB
返回 下载 相关 举报
第七章网络信息检索 (2)_第1页
第1页 / 共119页
第七章网络信息检索 (2)_第2页
第2页 / 共119页
第七章网络信息检索 (2)_第3页
第3页 / 共119页
第七章网络信息检索 (2)_第4页
第4页 / 共119页
第七章网络信息检索 (2)_第5页
第5页 / 共119页
点击查看更多>>
资源描述

《第七章网络信息检索 (2)》由会员分享,可在线阅读,更多相关《第七章网络信息检索 (2)(119页珍藏版)》请在金锄头文库上搜索。

1、第七章 网络信息检索广州中医药大学图书馆网络信息获取与管理课程雷蕾第三节 开放存取4.第二节 搜索引擎3.第一节 网络信息资源1.主要内容 什么是网络资源 网络信息资源的类型 网络信息资源的特点第一节 网络信息资源第一节 网络信息资源 什么是网络资源- 也称“电子信息资源”、“数字资源”、“因特网信息资源”等。- 以电子数据的形式将文字、图像、声音、动画等形式的信息存放在光碟等非印刷纸质的载体中,并通过网络通信,计算机或者终端等方式再现出来的信息资源。 网络信息资源的类型- 按付费情况分- 按所对应的非网络信息资源划分第一节 网络信息资源 网络信息资源的特点- 信息量大,信息来源广泛- 信息层

2、次众多,品种多样- 信息内容广泛,质量不一- 信息资源分散无序- 资源的时效性强,变化迅速- 交互性强- 信息检索快捷、方便第一节 网络信息资源第三节 开放存取4.第二节 搜索引擎3.第一节 网络信息资源1.主要内容什么是搜索引擎搜索引擎的工作原理搜索引擎的分类通用搜索引擎Google其他医学搜索引擎第二节 搜索引擎 什么是搜索引擎- 定义:搜索引擎是广泛收集网络信息,对采集来的信息进行标引、组织建立索引库,并提供检索的工具。第二节 搜索引擎 搜索引擎的工作原理- 从互联网上抓取网页- 建立索引数据库- 在索引数据库中搜索排序第二节 搜索引擎 搜索引擎分类- 全文搜索引擎- 目录索引类搜索引擎

3、- 元搜索引擎第二节 搜索引擎12全文搜索引擎是名副其实的搜索引擎,它们都是通过从互联网上提 取的各个网站的信息(以网页文字为主)而建立的数据库中,检索 与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返 回给用户。 国外具代表性的有Google,国内著名的有百度Baidu。全文搜索引擎13目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅 仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词查询 ,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的是Yahoo,国内的搜狐、新浪、网易搜索也都属 于这一类。 目录索引类搜索引擎14元搜索引擎亦称为“集成搜索引擎

4、”,在一个网页上链接若干个独立的搜索引擎,检索式需点选或者指定搜索引擎,一次检索输入,多引擎 同时搜索,搜索结果由各搜索引擎分别以不同页面提交,其实 质是利用网站链接技术形成的搜索引擎的集合,而并非真正意义上的搜索引擎。典型的集成搜索引擎有搜索之家、国际瑞士军刀、生物谷等多引擎搜索系统。 15 GoogleGooglehttp:/ http:/ BaiduBaidu http:/http:/ Yahoo Yahoo http:/ http:/ http:/ http:/通用搜索引擎h http:/ttp:/.hkGoogle通用中英文搜索引擎Google创建于 1998 年 9 月,创始人为

5、Larry Page(拉里佩奇)和 Sergey Brin(谢尔盖布林) ,他们开发的 Google 搜索引擎屡获殊荣 ,是一个用来在互联网上搜索信息的简单快捷的工具。 作为目前互联网上功能最强大的搜索引擎之一, Google 的索引目录中 已经储存有近百亿个网页。用户可以使用多种语言文字进行搜索。现在 , Google 平均每天接受的搜索次数达2 亿人次, 几乎占全球所有搜索 量的1/3, 而且这一数字还在不断上升。Google18Google的特色最大的搜索引擎(收录的网页最多)可检内容丰富: 网页、图像、网上论坛排序技术最好的(按相关度高低排列)支持多语种检索功能强大个性化设置随着节庆更

6、换图标Google检索技巧 支持布尔逻辑运算。将空格默认为支持布尔逻辑运算。将空格默认为“与与”,大写,大写“OR”OR”表示表示“或或” ,用,用“-”-”减去无关资料(如:减去无关资料(如:bass bass 贝司);贝司); 支持截词符支持截词符“*“*”(如:阿兹海默(如:阿兹海默* *) 同义词检索同义词检索“ ”(如:(如: 蛀牙蛀牙) 数字范围搜索,在搜索关键词后添加两个数字,并且将两个数字用数字范围搜索,在搜索关键词后添加两个数字,并且将两个数字用 两个英文句号分开。(如:英语六级考试试题两个英文句号分开。(如:英语六级考试试题 2005201120052011) 字典定义字典

7、定义“definedefine”。如(。如(definedefine:高血压):高血压) 用双引号限定词组检索用双引号限定词组检索Google一般检索功能 网页搜索网页搜索 视频搜索视频搜索 图片搜索图片搜索 购物搜索购物搜索 地图搜索地图搜索 音乐搜索音乐搜索 翻译翻译23Google 特殊检索功能检索指定类型的文献(filetype) 搜索搜索URLURL链接中含有指定关键词的(链接中含有指定关键词的(inurlinurl) 搜索的关键词包含在网页标题中(搜索的关键词包含在网页标题中(intitleintitle) 在指定的网站范围搜索(在指定的网站范围搜索(sitesite) 搜索有哪些

8、链接到某个网址的网页(搜索有哪些链接到某个网址的网页(linklink)24Google 特殊检索功能 检索指定类型的文献(filetype)a)可检索的类型包括:PPT、PDF、DOC、XLS、SWF、RTF、JPG、GIFb b) 格式:filetype:文件类型 关键词或:关键词 filetype:文件类型c)选择“网页”搜索模式,其中JPG、GIF选择在“图片”搜索模式。例如:搜索关于“肺癌”的PDF文件、关于肺癌的JPG图片在“网页”搜索模式,搜索框中输入:filetype:pdf 肺癌在“图片”搜索模式,搜索框中输入:filetype:JPG 肺癌 搜索搜索URLURL链接中含有指

9、定关键词的(链接中含有指定关键词的(inurlinurl)格式:格式:inurlinurl: :关键词关键词例如:例如:inurl:libraryinurl:library 搜索图书馆的网页搜索图书馆的网页inurl:eduinurl:edu 搜索教育网网页搜索教育网网页inurl:govinurl:gov 搜索政府部门的网页搜索政府部门的网页Google 特殊检索功能29 搜索的关键词包含在网页标题中(搜索的关键词包含在网页标题中(intitleintitle)格式格式: :intitleintitle: :关键词关键词例如:例如:intitleintitle: :广州中医药大学广州中医药大

10、学intitleintitle: :广州中医药大学图书馆广州中医药大学图书馆Google 特殊检索功能32 在指定的网站范围搜索(在指定的网站范围搜索(sitesite)格式格式:site:site:网址 关键词 例如:例如:site:site: 邓铁涛site:site: 会议Google 特殊检索功能 搜索有哪些链接到某个网址的网页(搜索有哪些链接到某个网址的网页(linklink)格式格式:link:link:网址网址 例如:例如:link:link:Google 特殊检索功能 如何用如何用GoogleGoogle查找查找 “ “肺癌肺癌”的有关信息?的有关信息?Google 检索示例3

11、839 检索策略调整技巧检索策略调整技巧- - 1. 1. 限定语种:所有中文限定语种:所有中文- - 2. 2. 选择更专业的提问词:肺癌选择更专业的提问词:肺癌肺肿瘤肺肿瘤- - 3. 3. 利用搜索引擎的高级检索模式利用搜索引擎的高级检索模式限定提问词在限定提问词在“搜索结果搜索结果”中出现的形式;指定检索以某一语言中出现的形式;指定检索以某一语言编写的网页;限定要查询的网页更新的日期;指定查询字词位置;限定搜编写的网页;限定要查询的网页更新的日期;指定查询字词位置;限定搜 索某一网域的网页索某一网域的网页( (govgov、eduedu、com)com);“类似网页类似网页”:自动搜索

12、某一网页:自动搜索某一网页 的类似网页;的类似网页;“链连链连”:搜索与某一网址建立了链接的网页。:搜索与某一网址建立了链接的网页。Google 检索示例41Google高级检索模式42 检索策略调整技巧检索策略调整技巧- -4.4.增加查询条件增加查询条件查找泰素治疗肺癌的网页文章查找泰素治疗肺癌的网页文章泰素治疗肺癌:泰素治疗肺癌:122122,000000- -5.5.使用双引号,实现精确短语匹配使用双引号,实现精确短语匹配“ “泰素治疗肺癌泰素治疗肺癌”:4 4,900900- -6.6.查找英文网页查找英文网页taxol lung cancer taxol lung cancer:1

13、35135,000000Google 检索示例43 检索策略调整技巧检索策略调整技巧- - 7.7.利用利用GoogleGoogle高级检索语法高级检索语法1 1)将文献类型限定为)将文献类型限定为“pdfpdf”, ”, 可获取免费全文可获取免费全文“ “filetype:pdffiletype:pdf 肺癌肺癌”( (结果结果3434,400)400)或或“ “ filetype:pdf taxol lung cancer ”filetype:pdf taxol lung cancer ”(结果(结果1515,900900)2 2)将文献类型限定为)将文献类型限定为“doc”,doc”,获

14、取获取WORDWORD文档文档“ “filetype:docfiletype:doc 肺癌肺癌”(7 7,330330)Google 检索示例44获取PDF全文45获取PDF全文46获取PDF全文推出时间:2004年11月口号:站在巨人的肩膀上Stand on the shoulders of giants服务对象:主要是科学家和各类从事学术研究的人士搜索范围:涵盖几乎所有知识领域的高质量学术研究资料,包括 论文、专业书籍以及技术报告等网址:http:/.hk/界面类似于普通搜索引擎,但返还的结果是学术性较强的论文和 图书Google scholar 简单检索 高级检索- 查找文章- 作者-

15、出版物(名称)- (文献出版)日期Google scholar检索方法简单检索返回结果的内容包括:题名、作者、发表出 处、提供文献信息的单位、摘要、被引情况 、相关文章、所有版本。2004年,Google启动“Google Print”项目。Google这样介绍自己的Print计划:“Google的使命是将世界上所有 信息都组织起来,但很多信息并不存在于网络上。Google Print的目 标就是将那些存在于书本上的内容,让你以最容易的方式看到也 就是出现在Google搜索结果中。” Google Print包含两个子项目:Publisher Program(出版商计划)和Library Projec

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号