Internet网络信息检索ppt课件

上传人:我*** 文档编号:145246649 上传时间:2020-09-18 格式:PPT 页数:94 大小:4.10MB
返回 下载 相关 举报
Internet网络信息检索ppt课件_第1页
第1页 / 共94页
Internet网络信息检索ppt课件_第2页
第2页 / 共94页
Internet网络信息检索ppt课件_第3页
第3页 / 共94页
Internet网络信息检索ppt课件_第4页
第4页 / 共94页
Internet网络信息检索ppt课件_第5页
第5页 / 共94页
点击查看更多>>
资源描述

《Internet网络信息检索ppt课件》由会员分享,可在线阅读,更多相关《Internet网络信息检索ppt课件(94页珍藏版)》请在金锄头文库上搜索。

1、第五章 网络信息检索第一节 Internet基础知识,一、Internet概述: 1、计算机网络:是利用通信线路将地理位置分散的、具有独立功能的许多计算机系统连接起来,按照某种协议进行数据通信,以实现资源共享的信息系统。 从网络节点分布看分为: 局域网(Local Area Network,LAN) 广域网 (Wide Area Network,WAN) 城域网(Metropolitan Area Network,MAN),2、Internet的定义,Internet(英特网):又称“网间网”、“互联网”或“国际互联网”是一个计算机交互网络。,3、Internet常用术语,1)TCP/IP协议

2、 TCP(Transfer Control Protocol)传输控制协议 IP(Internet Protocol)互联网协议,网间协议 2)IP地址,为了在网络环境下实现计算机之间的通信,网络中的每台计算机都必须有一个不允许重复的地址,称为IP地址,由网络管理机构分配给入网主机。,Internet常用术语,3)域名(Domain Name),为了便于记忆的一种字符型标识。 常见国际域名后缀 com(用于商业公司) net(用于网络服务) org(用于组织协会等) gov(用于政府部门) edu(用于教育机构) mil(用于军事领域) int(用于国际组织),4)统一资源定位器,统一资源定位

3、器(Uniform Resource Location,URL)用以描述具体资源在网络中的位置。 5)网页和主页 网页(Web Page)是存放在Web服务器上供客户机用户浏览的页面。 主页(Homepage)是指登录某一WWW服务器首先看到的页面。 6)超文本(Hypertext)是一种文本,它和书上的文本是一样的。但与传统的文本相比,它们之间的主要差别是,传统文本是以线性方式组织的,而超文本是以非线性方式组织的。,7)超链接(Hyperlink),也称为热链接(hotlink),或者称为超文本链接(Hypertextlink),是指文本中的词、短语、符号、图像、声音剪辑或影视剪辑之间的链接

4、,或与其他文件、超文本文件之间的链接。 8)超媒体(Hypermedia) 是超文本(Hypertext)和多媒体在信息浏览环境下的结合。与超文本的不同之处是,超文本主要是以文字的形式表示信息,建立的链接关系主要是文句之间的链接关系。超媒体除了使用文字外,还使用图形、图像、声音、动画和影视片段等媒体之间的链接关系。,9)超文本标记语言,超文本标记语言(Hyper Text Mark-up language ,HTML)是一种用来制作超文本文档的简单标记语言,是WWW的描述语言。 10)超文本传输协议 超文本传输协议(Hypertext transfer protocol, HTTP)是一种最基

5、本的客户机/服务器的访问协议。 11)客户机/服务器 客户机/服务器(client/server,C/S)是Internet上很多服务所采取的模式。客户机是提出请求服务的机器方;服务器是响应服请求的机器方。 12)浏览器 浏览器(Browser)是专用于查看网页的软件工具,从技术上看是运行在用户计算机上一个客户程序。,二、Internet的特点: 1.TCP/IP协议是Internet的核心 2.Internet实现了与公用电话交换网的互联 3.Internet是一个用户自己的网络,三、Internet的发展史 Internet来源于ARPAnet网,现代计算机网络的许多概念和方法都来源于它。

6、,数据显示,截止2012年,我国网民人数达5.64亿,互联网普及率攀升至42.1%,超过世界平均水平(21.9% )。手机用户9.2 亿,其中手机网民 达3.18 亿。,四、中国Internet的发展1994年我国全面开通了Internet服务,建立了四大网络体系。,中国科技网CSTnet1994年该网实现了与Internet网的联接。CSTnet主要是提供科学数据库服务、网络信息服务及超级计算服务等,其服务是非商业性的。 中国科技网网的网址是: ,其主页如下图:,中国教育科研网CERNET,中国教育科研网的全称是China Education and Research Network,它是国

7、家教委主持的国家重点工业性研究项目。于1994年启动,1995年12月正式开通运行,并实现与Internet的全方位连接。 CERNET网分为主干网、地区网、和校园网三个层次。中国教育科研网的网址是:,其主页如下图:,CERNET当前的拓扑结构如下图:,中国公用计算机互联网CHINANET中国公用计算机互联网是我国第一个全国性商业网,它由中国信息产业部经营管理,于1994年开始启动。CHINANET为社会提供方便的网络服务,开办代理业务,发展网络用户,建立中文信息站点为网络用户提供多种信息服务,包括电子文件、商业信息、天气预报、娱乐休闲、旅游指南等。 中国公用计算机互联网的网址是: ,中国金桥

8、信息网中国金桥信息网CHINAGBN是三金工程(金桥工程、金关工程、金卡工程)之一, 也称中国经济网,于1996年开始建设,它是国家经济信息通信网,提供Internet网络商业服务。中国金桥信息网的网址是:,其主页如下图:,五、Internet信息检索,(一)WWW与信息检索 1.WWW的概念 环球信息网WWW(World Wide Web)也称Web或万维网,它是一个基于超文本(hypertext)方式的信息检索查询工具。,2.什么是超文本与超媒体,3.WWW的构架 (1)HTML是Hyper Text Markup Language的缩写。 (2)主页(homepage) (3)HTTP

9、(4)URL,4.WWW浏览器 5.www采用的是客户机/服务器结构,第二节 搜索引擎,一、搜索引擎(Search engines)的概念 二、搜索引擎的发展历史 三、搜索引擎工作原理,四、搜索引擎的特点,五、搜索引擎的检索结果 1.标题:网页的标题。 2. URL :该网页对应的“访问地址”。 3.摘要:网页内容的摘要。,搜索引擎基本结构,六、搜索引擎的检索技术,1.布尔逻辑检索 (1)逻辑“与” (2)逻辑“或” (3)逻辑“非”,逻辑与,逻辑或,逻辑非,在许多搜索引擎中用空格、逗号、括号、 “”、“”、“”表示布尔逻辑符。空格、“”的作用与逻辑“与”(and)相同,比如google自动使

10、用“and”进行查询。逗号(,)、“”的作用类似于逻辑“或”(or)。,2.位置算符(proximity search) 位置算符检索用诸如“w”、“n”的符号表示词与词之间的位置关系,如information n system表示system出现在information之后,information n system表示与前后关系无关。,3.截词检索(truncation/wildcats) 截词方式主要有右截断、左截断、左右截断、中间截断(中间屏蔽)四种。搜索引擎中的截词符通常采用“*”和“?”。,4.字段限制检索(field limiting) Title:、ubject:、Keyword

11、:、Summary:、Image:、text:、Applet:、host:、anchor:、domain:、site:、url:、from:等。,5.精确检索(exact search) 精确检索又称之为字符串检索、短语检索。 几乎所有的搜索引擎读支持精确检索,并且都采用“ ”来表示。,6.模糊检索(fuzzy search) 7.自然语言检索(natural language search),8.区分大小写的检索(case-sensitive) 又称为大小写敏感检索,这主要针对检索词中含有人名、地名等专有名词而言的。,9.加权检索(term weighting)、 连接符有加号(+)和减号(

12、)。即在检索词前置加/减(/)号,作用相当于AND/NOT运算。,10.多语言检索(multilingual search),11.相关性排序 检索结果通常是根据相关程度按从大到小的顺序降序排列。几乎所有的搜索引擎都提供了“对检索结果按其相关性大小排序的功能。”,七、搜索引擎使用方法 1.基本使用方法 (1)分类法 目录式搜索引擎最简单的搜索方法就是掌握它的目录分类原则,确定要查找的内容或网站应该在哪个分类,然后逐级单击寻找。 (2)关键词 这是搜索引擎必备的功能。直接在输入框输入关键词即可进行的检索。,2.使用技巧 (1)选择合适的搜索工具 每种搜索引擎都有不同的特点,只有选择合适的搜索工具

13、才能得到最佳的结果。 (2)使用正确的搜索词 就目前而言,多数搜索引擎不支持容错查询。所以,一定要注意不写错别字。 (3)正确使用布尔检索 正确使用布尔检索方式可以减少搜索结果的返回数。,八、搜索引擎的分类 1.按搜索机制分类 (1)目录型搜索引擎 (2)关键词型搜索引擎 (3)混合型搜索引擎,2.按搜索引擎提供的搜索内容来划分 (1)综合型搜索引擎 (2)专业型搜索引擎,(3)特殊型搜索引擎,3.按搜索引擎在采集信息的方法及对外提供的服务方式划分 (1)机器人搜索引擎 (2)目录搜索引擎 (3)元搜索引擎,一、Google (一)概述,第三节 著名搜索引擎介绍,(二)Google的基本知识

14、1.网页标题 2.网页快照 3.手气不错 4.类似网页 5.中英文字典,1.数量庞大 Google目前发展为搜索80亿网页;10亿图片;10亿Usenet信息。,(三)Google的特点,2.Google支持多达132种语言,包括简体中文和繁体中文。 3.Google速度极快,它每秒钟能够回应几千次查询,而回应每项查询,Google都要走过30多亿个网页。,4.Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果。,(四) Google搜索引擎的功能 1.基本检索 2.高级检索,(五)Google Scholar学术搜索引擎,2004年11月24日Google推出了世界上

15、第一个针对学术期刊、论文、著作、摘要的免费学术搜索引擎一一Google Scholar;2006年1月l1日,Google推出了面向中文用户的中文版Google学术搜索。,1.Google Scholar的特点 (1)学科覆盖广泛全面,学科专业性强,生物学、生命科学、环境科学(Biology,Life Sciences,and Environmental Science);商业、管理、金融与经济(Business,Administration,Finance,and Economies);化学与材料科学(Chemistry and Materials Science);工程、计算机科学和数学(

16、Engineering,computer Science,and Mathematics);医学、药学和兽医学(Medicine,Pharmacology,and Veterinary Science);,(2)检索功能强大,搜索服务实行一站式,物理学、天文学、天体科学(Physics,Astronomy,and Planetary Science);社会科学、艺术和人文科学(Social Sciences,Arts,and Humanities)。,2. Google Scholar检索方法 (1)基本检索 (2)高级检索,高级检索界面,3.检索结果,检索结果中每条信息内容都包含:文献的题名、著者、出版物、出版年月、摘要、被引用次数、网页搜索等。,学术搜索使用偏好,二、百度(一)概述 “百度”二字源于中国宋朝词人辛弃疾的青玉案诗句:“众里寻他千百度”。 (二)百度的基本功能 1.百度快照2. MP3搜索 3.“ 超链分析” 技术4.高级搜索,百度空间,更多,(三)百度的检索技术,百度支持“与”、“或”、“非”。在关键词之间插入“空格”、“| ”、“ - ”,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号