网络信息利用原理

上传人:子 文档编号:51664412 上传时间:2018-08-15 格式:PPT 页数:21 大小:411KB
返回 下载 相关 举报
网络信息利用原理_第1页
第1页 / 共21页
网络信息利用原理_第2页
第2页 / 共21页
网络信息利用原理_第3页
第3页 / 共21页
网络信息利用原理_第4页
第4页 / 共21页
网络信息利用原理_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《网络信息利用原理》由会员分享,可在线阅读,更多相关《网络信息利用原理(21页珍藏版)》请在金锄头文库上搜索。

1、网络信息利用原理 1.网络信息资源 2.网络信息检索工具和检索方法 3.学术网站的评价方法1.1网络信息资源的定义 广义上说,网络信息资源是在网上一各种 方式存在并传播的信息集合。 具体表现为网上计算机中的无数信息、网 上的各种信息工具以及网络通信渠道。网上信息包括:计算机中的数据库、电子 出版物、王业、软件以及各种格式文件所 包含的信息;信息工具包括FTP,Telnet, e-mail, www浏览器和搜索引擎等;网络 通信渠道是指网络提供的信息交流渠道。1.1网络信息资源的定义 狭义上说,网络信息资源通常指指公网上 的信息资源,即访问不受任何限制的信息 资源,它不包含使用权受IP、用户名及

2、其 密码限制的资源。商业性数据库因可以通 过网络加以使用,将它们归入网络信息资 源是可以的,但由于这些数据库的使用或 者受IP限制,或者要求用户名和密码,是 不能归入公网信息资源范畴的。1.2网络信息资源的特点 1.数量庞大,增长迅速(200年网上每天增加200 万张网页) 2.整体武训,局部有序(五统一管理机构,但是各 引擎和站点收集信息,并有序分类。) 3.更新频繁,变化无常(2001年地网页平局寿命仅 仅44天,更新很快。) 4.多为现实,交互方便(多种载体,包括图像声音 ,视频等) 5.良莠混杂,参差不一(有的是精髓信息,有的却 是无根据的错误信息甚至是不健康信息。)1.3网络学术信息

3、资源的类型 按照内容区分,网络学术信息主要有四类: 网上传播的学术机构信息,包括学会,协会, 研究所等有关信息; 学术人物信息,包括学科专家、学术间就倒头 人的有关信息; 研究信息,包括科研课题、科研项目的立项, 申报,课题(项目)的进展、结题报告等信息 ; 可以称信息,包括发表的论文、出版的著作、 课题报告等信息。1.3网络学术信息资源的类型 按照出版类型区分,网上学术信息资源有 着和纸质性出版物类似的对应关系。 按照是否具有原创性,网上学术信息资源 又一次资源和二次资源的区分。一次资源 是指首次发表的原创性信息,二次资源是 专在已有的信息后者是从原创信息中提取 的部分信息。1.3网络学术信

4、息资源的类型 按照是否经过审核,网上学术信息资源可 分为正式出版物和非正式出版物两种。 按照是否属于搜索引擎检索范围,可分为 不可见资源和可见资源。网上的不可见资 源数量远远超过可见资源数量。有人估计 ,网上的不课件资源和可见资源之比超过 400:1。网络学术信息资源网上商用数据库网上公开资源一次资源二次资源一次资源二次资源全 文 期 刊 数 据 库全 文 图 书 数 据 库其 他 全 文 数 据 库期 刊 文 摘 数 据 库会 议 文 摘 数 据 库其 他 文 摘 数 据 库学 术 机 构 网 站个 人 学 术 网 站其 他 学 术 网 站i P A C 数 据 库搜 索 引 擎 数 据 库

5、虚 拟 图 书 馆 网 络 导 航其 他 网 络 二 次 资 源网上商用数据库1.4人文社会科学学术网络 1.网页、网站和竹叶的概念网页的学名是Html文件,是一种可以在互联网上传输,并 被浏览器认识、翻译成页面显示出来的文件。 2.人文社会科学学术网站的类型 按照信息内容特征区分。可分为综合性(如华东师大史 学理论与史学史教研室创办的“知识学术网”),专科性 社会科学学术网站(社会学人类学中国网)。 按照网站的主办机构区分。可分为:个人网站(如张军 经济学网站)、杂志社网站(如民族研究在线网) 和科研机构网站(如中国社会科学网)。 按照网站功能区分。可分为:学科门户(如中国经济学 教育科研网

6、),学科资源(如法律帝国网)和论坛博客 (如传播学论坛)。1.4人文社会科学学术网络 3.学术网站的判断方法 网站和网页的区别,主要依据显示网页的 结构和内容。 学术和非学术网站的区别主要依据网站本 身的主旨介绍。 4.人文社会科学常用的网上资源 参见书上P114的网站一览表2.1网络信息检索的相关概念1.IP地址和域名 因特网协议地址,通称IP地址。它有四段数字足协横, 中间用圆点隔开。 域名一般由代表通信协议、主机名、机构性质域名和国 家地区域名四段字母构成。域名并非每台上网计算机所 必需,只有作为服务器的计算机才需要。 所以,就服务器而言,域名和IP地址之间有着对应的互 换关系。 2.网

7、址 它又称统一资源定位器,代表网上一切资源,包括上网 计算机及其 各种文件的地址。 3.网上常见文件的格式和后缀名 如TXT表示纯文本,bmp表示windows位图等。2.2搜索引擎的基本概念1.搜索引擎的定义搜索引擎是网上信息搜索工具的通称。它可以使一个独 立的门户网站,如谷歌,雅虎,也可以是辅助其他类型 网站或主页上的一个搜索工具。 2.搜索引擎的类型 按照工作方式区分,可分为主题引擎、目录引擎和多元 引擎。 主题引擎一般由搜索软件(spider、robot、crawler), 索引软件(它的任务是建立索引)和检索软件三部分组 成。它的优点是信息量大、更新及时、无需人工干预, 缺点是返回信

8、息中常有很多无关信息,身子有一定比例 的死链接,用户必须从结果中进行筛选。2.2搜索引擎的基本概念 目录引擎又称目录指南性搜索引擎。这种引擎的信息收 集和处理有人工干预过程,信息处理的层席位网站,检 索所得结果的网页中不一定含有检索词。 目录引擎的用户界面基本上都为分级结构。 它与主题引擎的主要区别是由于目录引擎旨在数据库保 存的编辑人员对站点的描述中进行搜索,因此站点本身 的动态变化不会反映到搜索结果中来。 多元引擎又称圆搜索引擎。它本身没有存放网页信息的 数据库,当用户查询一个关键词是,它把请求转换成其 他数个搜索引擎能够接受的命令格式,并行地活着有选 择性的访问这些搜索引擎并查询这个关键

9、词,处理这些 搜索引擎返回的结果,然后再返回给用户。多元引擎的 服务方式为面向网页的检索。但是严格来说,它只算是 一个用户代理。2.2搜索引擎的基本概念 按照工作语种区分,可分为中文搜索引擎和外 文搜索引擎。 按照搜索内容区分,可分为门户索索引擎和垂 直搜索引擎。提供综合性信息服务的搜索引擎 称之为门户搜索引擎(如搜狐),而垂直引擎 目前最普遍的是博客引擎。 它们的主要区别是一是门户引擎内容信息范围 要比处置引擎的来得广;二是门户网站信息内 容的实效性相对新一些;三是垂直引擎在信息 的深度上往往比门户引擎优越一些。2.3几个重要的引擎的使用方法1.百度 输入的检索词可以使研究的主题、网站、新闻

10、等任何内容,形式可 以使中文英文,数字或者中英数字的混合体;并且它不区分字母大 小写;它没有模糊检索和截词检索功能。 它可以使用两个以上检索词的检索逻辑。 字段检索。 标题检索。 在url中搜索。 特色功能:百度快照,相关检索,专门内容检索。2.3几个重要的引擎的使用方法2.谷歌(Google) 它是优点是网址数量大,检索语种多,响应速度快,它 页提供“网页快照”功能,但是这只限国外站点,点击 Cached链接即可。 谷歌检索文本框中可以任意输入中英文检索词,故宫不 支持借此福,但有默认的截词功能。 检索与反方面,检索多个检索词时。 3.Dogpile 它是个多元引擎,而且是目前性能比较好的一

11、个并行式 元搜索引擎。它可同时调用25个网页引擎、新闻组引擎 和ftp引擎等。 它的输入框下方可选查Web,Usenet,ftp等。 特色: A.采用独特的并行和串行相结合的查询方式。 B.可使用布尔算符合模糊查询。2.4使用搜索引擎学院注意的问题和 搜索引擎检索策略实例 1.选择适合的检索词 切分检索提问。 检索提问具体化。 使用搜索引擎要注意不能写错别字,还应该尽量使用比 较常用的词语。 避免使用禁用词作为检索词。 2.小时网页和网站信息的获取方法有时由于网站整理、文件被重新命名引起的,有时是 由于更换服务器引起的“404-Not Found”的错误信息。此 时,我们可以用网址回溯法,还可

12、以用字段检索法,或 者服务器缓存法。 3.检索策略的调整,即增减检索同义词、近义词等,或 者使用逻辑与或者字段限制等策略。2.5虚拟图书馆和网络资源导航 虚拟图书馆的出现时为了减少信息选择的 难度。 较早提出该概念的人是美国人卡耶( Gapen D Kaye)。 何时使用虚拟图书馆: 当时间短促,不允许浏览有搜索引擎查得 的巨量的信息时; 当希望看到比较可靠的网络信息; 当希望对某个领域有个整体的、较全面的 了解时、3.1客观评价方法 1.网站排名法网站排名法是以客观方法评价一个常用方法。 某些排名网站通过定期自动统计网站的访问量 ,分析网站的状态和地位。Alexa是当前拥有排名网址数量较大、

13、信息发布 较详细的一个排名网站。 2.链接分析法它是利用某些搜索引擎提供的Link命令,检查评 价对象网站的被他人连接的情况也是评价网站 的一个常用的客观方法。 3.专家分析法它是指利用网站组织的专家或者资源人员对网 站做出的人工评价结果来评价网站。3.2主观评价方法 1.内容评价法从内容角度对网站提供的信息进行的判断,主要 考虑的标准有可靠性、权威性、唯一性、完整 性和全面性。 2.网址评价法主要有网址回溯法和网址成分分析法。 3.形势评价法主要从网站的界面和结构方面,包括对网站可访 问性、帮助信息的质量和使用技术的恰当性三 方面。 4.稳定性评价法它包括系统稳定性,网站稳定性和信息稳定性。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号