internet网络信息检索及其特点

上传人:繁星 文档编号:88250407 上传时间:2019-04-22 格式:PPT 页数:58 大小:148KB
返回 下载 相关 举报
internet网络信息检索及其特点_第1页
第1页 / 共58页
internet网络信息检索及其特点_第2页
第2页 / 共58页
internet网络信息检索及其特点_第3页
第3页 / 共58页
internet网络信息检索及其特点_第4页
第4页 / 共58页
internet网络信息检索及其特点_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《internet网络信息检索及其特点》由会员分享,可在线阅读,更多相关《internet网络信息检索及其特点(58页珍藏版)》请在金锄头文库上搜索。

1、搜索引擎,INTERNET信息资源检索,什么是INTERNET,INTERNET:通常称之为因特网。 是一个以TCP、IP网络协议联接全球 计算机网络的数据通信网。 是一个集各个领域、各个机构的信息资源为一体,供上网用户共享的信息资源网。 是全世界靠TCP/IP协议连接起来的所有计算机及其各级网络的统称。 是一个供全人类共享的信息平台。它提供了创建、浏览、访问、搜索、阅读、交流信息等各种信息服务。内容涉及的广泛,包括自然科学、社会科学、体育、娱乐等各个方面。,INTERNET的形成和发展,1968年美国国防部成立高级研究计划署ARPA, 与其它军事部门合作开发军用实验网络ARPANET。旨在实

2、现以政府机构、科研、军事等内容为主的网上资源共离,研究一种可行的与设备无关、独立于电话线路之外的全国性数据通信技术。 1969年,ARPANET开始投入运行。 1970年,ARPA研究出NCP协议,奠定了 TCP/IP协议的基础。,INTERNET的形成与发展,1975年ARPA从实验性网络转入应用性网络。并由美国国防部通讯署进行管理。ARPA改名为DARPA。 1976年,ARPANET通过卫星联到欧州,向社会扩展。 1979年,DARPA成立了一个正式的INTERNET控制和通讯委员会(ICCB) 在此同时,日本国家的DDX-1网络,英国的EPSS网络,法国CYCLADES网络纷纷成立。

3、1980年TCP/IP正式问世。,INTERNET的开成与发展,1978年-1994年,中国与INTERNET开始接触。主要是通过拔号方式使用INTERNET的EMAIL服务。 1986年,北京计算机应用技术研究所与德国尔斯鲁厄大学合作开发CANET。 1990-94年,中国大规模与INTERNET连接。相继完成了四个大型的广域网: 中科院的中科院网 教育系统的中国教育科研网 邮电部的中国公用网 电子部的金桥网,INTERNET上的信息资源,按INTERNET提供的服务模式分: 1、以网页模式存在的资源:各类新闻动态、会议信息、产品介绍、技术规范等 2、以EMAIL方式订阅或发布的各类电子期刊

4、、技术通报、软件更新、专业讨论、广告等。 3、各类经过专业分类处理后INTERNET 公从开放的专业数据库或综合数据库。,INTERNET上的信息资源,4、以电子出版方式在网上定期出版的各类电子期刊。 5、可以远程阅读电子图书的虚拟图书馆或电子图书馆。 6、供免费下载的软件资源。,INTERNET上的信息资源,按资源的功能特性来分: 1、商业类资源: 2、专业技术类资源 3、管理类资源,信息资源的特性,1、信息显示多媒体化。 2、信息处理数字化。 3、信息检索超媒体化。 4、信息来源全球性。 5、信息传递即时性。 6、信息共享开放性。,如何上INTERNET,上网必备条件 1、硬件条件:PC机

5、,MODEM 2、软件条件: 操作系统 INTERNET工具软件和应用软件 3、接入的方式 : 普通电话上网、ISDN上网、ADSL上网、宽带上网、DDN专线上网、无线上网 不同的方式代表不同的技术,也需配务不同的MODEM(调制解调器)。,网络基本知识,IP地址:是INTERNET主机的一种数字型 标识。由32位二进制数表示,每八 位为一组,共四组。 INTERNET委员会将IP地址为分五类:A、B、C、D、E,IP地址,A类:地址的最高端二进制位为O,第一个字节组表示网络标识,后三个字节组表示主机标识。共有126个网络。每个网络大约1700万台主机。 地址范围:1.0.0.1-126.25

6、5.255.254 主要用于拥有大量主机的网络,它的特点是网络数目少,而拥有主机数量多。,IP地址,B类:地址的最高端前两个二进制们为10,前两个字节组表示网络标识,后两个字节组为主机标识,共有16384个网络,每个网络大 约有65000台主机。 地址范围:128.0.0.1 - 191.255.255.254 主要用于中等规模的网络,它的特点是网络数与主机数大致相同,IP地址,C类:地址最高端 前三个二进制位为110,前三个字节组表示网络标识,后一个字节组为主机标识。共有200万个网络,每个网络有254台主机。 地址范围:192.0.0.1-223.255.255.254 主要用于小型局域网

7、,它的特点是网络数多,而主机少。,IP地址,D类:高端前四个二进制位为1110,其余用于识别相应主机。 通常用于已知的多点传递或者组的寻址。,IP地址,E类地址:高端前四个二进制位为1111。主要用于实验用。,IP地址,目前IP地址资源比较紧张,亚太区的分配权在APNIC(亚太地区网络信息中心,设在日本东京)手中。 我国申请到的IP地址大多是C类地址。,如何判断IP地址,看IP地 第一个字节组的十进制数: 若为1126,则为A类。 若为128191,则为B类 若为192223,则为C类 若为224239,则为D类 若为240254,则为E类,子网,子网是一个多网络环境中的网络。 将一个网络划分

8、成多个子网,要求每个子网使用不同的网络标识IP。,子网掩码,子网掩码是一个32位的地址,它用于屏蔽IP地址的一部分,区别IP地址中哪些位表示逻辑的网络/子网数,并说明IP地址是在本地网上还是在远程网上。 表示方法: 凡是IP地址的网络和子网标识部分,用二进制1表示。 凡是IP地址的主机标识部分,用二进制数0表示。 用点和十进制数书写。,网络基本知识,DN(域名):是INTERNET主机的一种 字符型标识。,网络基本知识,DNS(域名系统):将DN翻译成IP地址。,网络基本知识,TCP/IP:传输控制协议和网际协议。 TCP:传输层协议 IP:网络层协议,网络检测工具,PING:IP地址或主机名

9、 IPCONFIG:查看本机相关信息(IP、子网掩码、网关等),并且可以修改。 WINIPCFG:显示用户所在主机内部的IP协议的配置信息,只用于WINDOWS95/98/2000 NETSTAT:了解自已的主机是怎样与因特网相连接的,适用于WINDOWS98/95/2000/NT NSLOOKUP:查看对方主的IP地址和主机名称。,DHCP,动态IP地址配置协议。,INTERNET主要功能,INTERNET的功能主要有: 传递信息和检索信息两个主面。 功能具体表现为: 一、WWW 二、EMAIL 三、NEWS GROUP 四、FTP 五、TELNET 六、BBS 七、QQ,获取INTERNE

10、T电子信息资源的方式,通过浏览器访问INTERNET:WWW IE 通过EMAIL获取信息 以网络交流的方式获取电子信息资源: 实时交谈 网络电话和网络视频会议系统 网络寻呼 电子公告版、电子新闻、电子报刊、电子论坛,搜索引擎,面对浩如烟海的网站、电子邮件、FTP文件、QQ信息等网上资源,如何组织好这些信息,并能将它们检索出来加以利用,成了衡量一个国家信息化水平的一个标志。 网络信息的组织和检索工具:搜索引擎,搜索引擎的分类,搜索引擎按其工作方式主要可分为三种,分别是: 全文搜索引擎(Full Text Search Engine)、 目录索引类搜索引擎(Search Index/Direct

11、ory) 元搜索引擎(Meta Search Engine)。,全文搜索引擎,全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。 从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)

12、程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos,目录索引,目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。,元搜索引擎,元搜索引擎在接受用户查询请求时,同时在

13、其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。,搜索引擎,除上述三大类引擎外,还有以下几种非主流形式: 1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。 2、门户搜索引擎:如AOL Search、MSN S

14、earch等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。 3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。 由于上述网站都为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎。,搜索引擎的检索方式,1、分类目录检索 2、关键词检索(全文检索),分类目录检索,将信息按内容等特征进行分门别类,利用超文本超媒体的技术进行检索。 这种检索非常简单,用户只要用鼠标进行点击即可得到所需的网页。 但是这种检索结果粗糙,查准率很低。,

15、关键词检索,它是一种基于网页的全文检索技术。只要网页中出现了检索词或符合表达式要求的情况即算检索出结果。 它充分利用了关键词的属性。,网络信息检索策略,1、了解网络信息资源 2、选择恰当的网络检索工具 3、使用相应的检索方式,搜索引擎的选择,1、搜索速度 2、返回的信息量 3、信息相关度 4、易用性 5、稳定性 6、搜索范围:地域范围;语言范围;网站类型范围;专业范围,搜索引擎的检索技术,1、确定好关键词: 搜索引擎一般用自由词作为检索用关键词。目标专题的相关术语、关键词,专业研究机构的名称、地理位置、作者姓名、产品名称、专利编号等都可以作为关键词。 好的引擎允许直接采用自然语言中的字(检索到

16、字)、词或整个句子作提问式检索。,搜索引擎的检索技术,2、逻辑运算: 逻辑与: 逻辑或: 逻辑非: 位置算符:。如;搜索引擎中要求两检索词必须距离在个词以内。 通配符: 附:位置算符和通配符一般用于英文检索系统,搜索引擎的检索技术,引号:将向个词作为一个词组进行检索。所有词均有检索意义。 忽略词:一些常用的词,在检索中不具有检索意义。要求它具有检索意义时,须用引号引起来。,搜索引擎分类,一、中文搜索引擎 二、外文搜索引擎,常用的中文搜索引擎,中文搜索引擎用于查找中文资料。 GOOGLE中文版 搜狐 雅虎中国 北极星 新浪网 网易 百度 悠游,常用的外文搜索引擎,外文搜索引擎用于查找外文资料。 YAHOO EXCITE LYCOS HOTBOT,GOOGLE,网址:. 简介: 检索技术: 支持分类检索和关键词检索。 关键词检索支持逻辑检索。,搜狐,URL:http:/ 简介:是爱特信公司创办的大型中文网络系统。1998年2 月创立。 检索技术: 支持分类检索(目录索引)和关键词检索(

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号