因特网信息资源检索.ppt

上传人:飞*** 文档编号:48783419 上传时间:2018-07-20 格式:PPT 页数:86 大小:3.82MB
返回 下载 相关 举报
因特网信息资源检索.ppt_第1页
第1页 / 共86页
因特网信息资源检索.ppt_第2页
第2页 / 共86页
因特网信息资源检索.ppt_第3页
第3页 / 共86页
因特网信息资源检索.ppt_第4页
第4页 / 共86页
因特网信息资源检索.ppt_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《因特网信息资源检索.ppt》由会员分享,可在线阅读,更多相关《因特网信息资源检索.ppt(86页珍藏版)》请在金锄头文库上搜索。

1、 第七章 因特网信息资源检索2004-10-28第一节 Internet概述v 计算机网络是一个数据通信系统,是将物理位置相对分 散的计算机及其外部设备通过通信媒介互相连接起来,在网 络软件的支持下,构成资源共享和数据交换的一个系统。v 因特网(Internet)又称国际互联网,是全球计算机和 计算机网络通过统一的TCPIP协议(传输控制协议互联协 议)连接在一起的集合,这些网上计算机用户能够共享信息 资源,交换各种信息。v 因特网依靠TCP/IP协议,在全球范围内实现不同硬 件结构、不同操作系统、不同网络系统的互联,进行数据通 讯。vInternet上每部主机被赋予一个世界唯一的IP地址,用

2、于与该主机有关的全部通信。v如:重庆文理学院 218.194.176.5 因为IP地址不易记忆,就引入了方便记忆的域名,通过 域名管理系统(Domain Name System,DNS),可以把我们输入的具有助记性的主机域名转换为要访问的服务器的 IP地址。如:重庆文理学院 常用域名与机构性质对照表域名机构性质质域名机构性质质com公司、商业业机构edu 教育界ac学术术机构gov政府部门门net网络络机构mil军军事部门门org非赢赢利组织组织常用域名与地理位置对照表 域名地理位置域名地理位置cn中国hk中国香港 tw中国台湾us美国 ca加拿大uk英国 jp日本de德国 fr法国it意大利

3、ru俄罗罗斯kr韩韩国Internet网络信息资源 v网络信息资源(Network Information Resource)是指以电子数据的形式将文字、图像、声音、动画 等多种形式的信息存放在光磁等非印刷型的载体中 ,并通过网络通信、计算机或终端等方式再现出来 的信息资源。 网络信息资源特点1)数量巨大,增长迅速。 2)内容丰富,形式多样。 3)信息发布自由,信息资源良莠不齐。 4)传播范围广泛。 5)网络信息具有一定的交互性。网络信息资源检索途径 v1、漫游法:在网上通过网络浏览器,从某一个网页上通过感兴趣的条目链接到另一网页上,在整个Internet上无固定目的进行浏览。 v2、网络地址

4、法:用户已知要查信息可能存在的地址信息,利用网络浏览器直接连到该网址的主页上进行浏览查找。v3、搜索引擎法:Internet网络上的信息检索系统。搜索引擎一般都提供有分类途径和关键词途径检索。 v4、其它方法:如FTP文件传输、Telnet远程登陆、EMail电子邮件、Internet Meeting网络会议等。l 因特网的迅猛发展使其信息量剧增,形成一个无 限、无序、浩瀚无边的信息空间,如何快速查找并 获取所需要的信息已成为人们的最迫切的需求。网 络信息检索工具搜索引擎便应运而生,成为我 们打开因特网这座信息宝库的一把万能钥匙.第二节 搜索引擎v1. 搜索引擎的定义v搜索引擎(Search

5、Engine)是指一种 利用网络自动搜索技术,对因特网各 种信息资源进行标引,并为检索者提 供检索的工具。 什么是搜索引擎?v搜索引擎其实也是一个网站,只不过该网站 专门为你提供信息“检索”服务,它使用特 有的程序把因特网上的所有信息归类以帮助 人们在浩如烟海的信息海洋中搜寻到自己所 需要的信息。 v搜索引擎是一种工具,通过它你可以从 茫茫网海中找到自己想要的信息。v常见搜索引擎:2. 搜索引擎工作原理vv(1 1)信息搜集)信息搜集vv(2 2)信息索引)信息索引vv(3 3)信息查询)信息查询vv(4 4)检索结果的相关性处理)检索结果的相关性处理搜索引擎的工作原理搜索引擎的工作原理v概率

6、法是根据关键词在文中出现的频率来判定的,出现的次 数越多,认定其与查询的相关程度越高;v位置法是根据关键词在文中出现的位置来判定,位置越靠前 ,文件的相关程度越高;v分类或聚类方法是指搜索引擎采用分类或聚类技术,自动把 查询结果归入到不同的类别中。检索结果排序3. 搜索引擎的类型搜索引擎按其工作方式主要可分为三种,分别是:全文搜索引擎(Full Text Search Engine)分类目录型搜索引擎(Search Index/Directory)元搜索引擎(Meta Search Engine)v全文搜索引擎(又称为关键词搜索引擎)它提供对关键词、主题词、或自然语言的查询。用 户在搜索框中输

7、入检索词或检索表达式,搜索引擎 会自动排查相关词,并按相关词的相关程度的高低 排序加以链接。用户查到的是与你输入的关键词相 关的一个个网页的地址和一小段文字。如GOOGLE、百度就是这类搜索引擎v适用于查找目的明确,并具备一定检索知识的用户 。v分类目录型搜索引擎v它是基于人工建立的搜索索引,提供一种可供检索和查询的等 级式主题目录。信息收集时,利用大量人力浏览INTERNET页面 ,以超文本链接方式将不同学科、专业、行业和区域的信息按 照分类或主题的方式组织起来,形成分类目录式的树状结构。 这类引擎提供了一份由人工按类别编排的网站目录,下面排列 着属于这一类别的网站的站名和网址链接,再记录一

8、些摘要信 息。目前国外的YAHOO,国内搜狐、新浪、常青藤等都用这种 搜索方式。v用户必须清楚信息所属的类别,查准率高,但查全率低。v目前,全文搜索引擎与分类目录搜索引擎有相互融 合渗透的趋势。v原来一些纯粹的全文搜索引擎现在也提供目录搜索 ,如Google就借用Open Directory目录提供分类查询。v而一些目录索引则通过与Google、百度等搜索引擎合作扩大搜索范围,向综合搜索发展,如 Yahoo! 国内的国内搜狐、新浪、网易等 。l元搜索引擎:(Meta search Engine)又称为集合式搜索引擎。l它将多个搜索引擎集成在一起,提供一个统一的检索 界面。元搜索引擎在接受用户查

9、询请求时,同时在其 他多个引擎上进行搜索,并将结果返回给用户。l其最大优点就是:省时。不用就同一提问一次次地访 问所选定的搜索引擎。且检索的是多个数据库,检索 的综合、全面性也有所提高。l著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo 等。l中文元搜索引擎搜星。4. 搜索引擎检索技巧v1. 布尔逻辑符号:布尔逻辑操作符几乎在所有的搜索引擎中, 都将布尔逻辑操作符作为最基本的语法规则。一般布尔逻辑操 作符包括NOT、AND、ORNOT的使用:NOT表示逻辑“非”,可用符号“-”来表示。使 用NOT寻找包含NOT前的关键字但排除NOT后的关键字的文档 。例如:新闻not体育

10、,其查询结果为包含“新闻”但排除其 中有“体育”这个词语的文档。vAND的使用:AND表示逻辑“与”,可用符号“v 将“u”字母加在关键字前,搜索引擎仅 会查询网址。v最后需要指出的是,以上的语法规则大多是在 各种搜索引擎之间通用的,具体到每一个搜索 引擎,则有不同的功能和特点。因此,用户应 仔细阅读有关的使用说明,结合实际情况灵活 加以运用。5. 搜索策略v关于搜索的一些思想不是互联网上所有的信息都被搜索引擎搜集。大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,但也只 能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠 率一般在70%以下。动手前多动脑。不要盲目信任

11、搜索得到的信息。不要期望一次搜索解决问题。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内 容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们 无法用搜索引擎搜索到的。基本搜索步骤知道你想搜索什么,网上会不会有?什么 地方会有?选择合适的搜索方法和工具。输入搜索关键字进行搜索,对结果进行评 价并确定下一个搜索关键字。知道你能搜索什么v网络上没有的资源: 一些带有版权的资料,比如Windows的源代 码。 一些保密的信息,比如银行卡的密码。 一些还没有或者不能被电子化的东西。 一些过时的资料。选择合适的手段和工具v学会对症下药是搜索重要的一课下载周杰伦刚出的“夜曲”

12、:v考虑到这个歌曲刚刚推出,而搜索引擎的更新 速度有限,所以应该去他的fans论坛看看,一 般会有。v通过一些P2P的下载软件可以从别人电脑里下载搜索中英文资料选择不同的搜索引擎。通过一个相关网站的链接查找。细化搜索条件细化搜索条件v搜索条件越具体,搜索引擎返回的结果就越 精确,有时多输入一两个关键词效果就完全 不同,这是搜索的基本技巧之一。v 如:要了解中国戏剧中京剧的脸谱知识 ,搜索条件可为“京剧”、“脸谱”。 提炼搜索关键词提炼搜索关键词v学会从复杂搜索意图中提炼出最具代表性和 指示性的关键词,对提高信息查询效率至关 重要,这方面的技巧是搜索技巧的基础。v 如:搜索与秦朝历史文化有关的资

13、料, 可提炼关键词:“秦始皇”、“兵马俑”。v搜索技巧是一个长期锻炼的结果,所以希望 大家在今后的搜索中多留心,多思考,才能 真正成为搜索高手!第二节 常用搜索引擎介绍v搜索引擎的基本用法是搜索引擎站点中都提供一个可 以输入关键词的文本输入框和一个“搜索”的按钮,用 户可以在输入框中键入关键词,然后按“搜索”按钮,搜索引擎就会自动地在其内部的数据库中进行检索, 最后把与关键词相符合的或者是与关键词相近的网站 显示在结果页中,接着用户只需通过搜索引擎提供的 链接地址,就可以访问到相关信息。这种查询方法的 关键之处在于关键词的选择和表达上。 v如果关键词选择不当,搜索的结果会返回大量无用的 垃圾信

14、息;或者有用的信息被淹没在大量的冗余的页 面之中。v目前的搜索引擎并不能很好的处理自然语言。因此, 在提交搜索请求时,您最好把自己的想法,提炼成简 单的,使用希望找到的信息内容主题关联的查询词, 从而迅速找到自己所需要的信息。v如:所得税会计处理问题探讨常见搜索引擎的网址常见搜索引擎的网址 vGooglev百度v搜狐v新浪v网易v雅虎Google是由2位斯坦福大学的博士生Larry Page和 Sergey Brin在1998年创立的。Sergey Brin Larry Pagev 多种机构评测:目前在网络搜索引擎服务中, Google排名全球第一。因此可以说它是目前世界范围 内人气最旺的搜索

15、引擎。v目前最优秀的支持多语种的搜索引擎之一,约搜索约80 亿张网页。提供网站、图像、新闻组等多种资源的查 询。包括中文简体、繁体、英语等35个国家和地区的 语言的资源。1 简单检索输入检索主题词,选 择网站类型,然后点 击搜索Google的检索规则v逻辑“与” :空格如:计算机 信息检索(表示“计算机”与“信息检索”)v逻辑“非”:减号“-”如:coldweatherv逻辑“或” :大写的“OR”或者“ | ”如:计算机OR电脑v用*来替代单个词如,“使用*模式”,可以搜索到:使用飞行模式、使用弹性模式、使用 设计模式、使用手机模式、使用了模式、使用该模式。 v用短语做关键字,必须加引号(中

16、英文均可)如“计算机病毒”vGoogle不区分大小写的搜索Java、JAVA、java是完全一样的。v检索式技巧默认逻辑与,如 飞机发动机“飞机发动机”与“飞机 发动机”检索结果一样输入:飞机发动机 与 “飞机发动机” 检索结果 不一样v查找某一类型文件v “filetype:” 是一个实用的搜索语法。Google已经能检索的文档xls、 ppt、doc,rtf,pdf,swf等。例:“水污染治理 filetype:doc OR filetype:pdf”查找特定网站上的信息:要在某个特定的域或站点中进行搜索 时可输入“* site:*.com”。如在新浪网中搜索“新闻”可输入“ 新闻 site:”精确搜索范围v搜索实例五:以“环糊精”为关键词搜索,得到 共297,000个结果。v如果仅需查找“环糊精生长厂家”v输入“环糊精 生产厂家”减少输出结果筛选

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号