《Internet网络信息检索课件》由会员分享,可在线阅读,更多相关《Internet网络信息检索课件(95页珍藏版)》请在金锄头文库上搜索。
1、第五章第五章 Internet信息资源及其检索信息资源及其检索第一节Internet网络信息资源概述一、Internet的定义:1.从网络互联的角度来看2.从网络通信的角度来看3.从提供信息资源的角度来看4.从网络管理的角度来看二、Internet的特点:1.TCP/IP协议是Internet的核心2.Internet实现了与公用电话交换网的互联3.Internet是一个用户自己的网络三、Internet的发展史Internet来源于ARPAnet网,现代计算机网络的许多概念和方法都来源于它。数据显示,截止2007年12月31日,我国网民总人数达到2.1亿人(截止1998年12月,我国上网用户
2、超过210万),目前中国网民仅以500万人之差次于美国(据Nielsen/NetRatings公司公布数据显示,2007年底美国的网民为2.16亿),居世界第二,CNNIC预计在2008年初中国将成为全球网民规模最大的国家。尽管网民数的增长使得互联网普及率提高至16%,但仍低于19.1%的全球平均水平。四、中国Internet的发展1994年我国全面开通了Internet服务,建立了四大网络体系。中国科技网CSTnet1994年该网实现了与Internet网的联接。CSTnet主要是提供科学数据库服务、网络信息服务及超级计算服务等,其服务是非商业性的。中国科技网网的网址是:http:/,其主页
3、如下图:中国教育科研网CERNET中国教育科研网的全称是ChinaEducationandResearchNetwork,它是国家教委主持的国家重点工业性研究项目。于1994年启动,1995年12月正式开通运行,并实现与Internet的全方位连接。CERNET网分为主干网、地区网、和校园网三个层次。中国教育科研网的网址是:http:/,其主页如下图:CERNET当前的拓扑结构如下图:中国公用计算机互联网CHINANET中国公用计算机互联网是我国第一个全国性商业网,它由中国信息产业部经营管理,于1994年开始启动。CHINANET为社会提供方便的网络服务,开办代理业务,发展网络用户,建立中文信
4、息站点为网络用户提供多种信息服务,包括电子文件、商业信息、天气预报、娱乐休闲、旅游指南等。中国公用计算机互联网的网址是:http:/ 搜索引擎搜索引擎一、搜索引擎(Searchengines)的概念二、搜索引擎的发展历史三、搜索引擎工作原理四、搜索引擎的特点五、搜索引擎的检索结果1.标题:网页的标题。2.URL:该网页对应的“访问地址”。3.摘要:网页内容的摘要。搜索引擎基本结构六、搜索引擎的检索技术1.布尔逻辑检索(1)逻辑“与”(2)逻辑“或”(3)逻辑“非”逻辑与逻辑或逻辑非在许多搜索引擎中用空格、逗号、括号、“”、“”、“”表示布尔逻辑符。空格、“”的作用与逻辑“与”(and)相同,比
5、如google自动使用“and”进行查询。逗号(,)、“”的作用类似于逻辑“或”(or)。2.位置算符(proximitysearch)位置算符检索用诸如“w”、“n”的符号表示词与词之间的位置关系,如informationnsystem表示system出现在information之后,informationnsystem表示与前后关系无关。3.截词检索(truncation/wildcats)截词方式主要有右截断、左截断、左右截断、中间截断(中间屏蔽)四种。搜索引擎中的截词符通常采用“*”和“?”。4.字段限制检索(fieldlimiting)Title:、ubject:、Keyword:、
6、Summary:、Image:、text:、Applet:、host:、anchor:、domain:、site:、url:、from:等。5.精确检索(exactsearch)精确检索又称之为字符串检索、短语检索。几乎所有的搜索引擎读支持精确检索,并且都采用“”来表示。6.模糊检索(fuzzysearch)7.自然语言检索(naturallanguagesearch)8.区分大小写的检索(case-sensitive)又称为大小写敏感检索,这主要针对检索词中含有人名、地名等专有名词而言的。9.加权检索(termweighting)、连接符有加号(+)和减号()。即在检索词前置加/减(/)号,
7、作用相当于AND/NOT运算。10.多语言检索(multilingualsearch)11.相关性排序检索结果通常是根据相关程度按从大到小的顺序降序排列。几乎所有的搜索引擎都提供了“对检索结果按其相关性大小排序的功能。”七、搜索引擎使用方法1.基本使用方法(1)分类法目录式搜索引擎最简单的搜索方法就是掌握它的目录分类原则,确定要查找的内容或网站应该在哪个分类,然后逐级单击寻找。(2)关键词这是搜索引擎必备的功能。直接在输入框输入关键词即可进行的检索。2.使用技巧(1)选择合适的搜索工具每种搜索引擎都有不同的特点,只有选择合适的搜索工具才能得到最佳的结果。(2)使用正确的搜索词就目前而言,多数搜
8、索引擎不支持容错查询。所以,一定要注意不写错别字。(3)正确使用布尔检索正确使用布尔检索方式可以减少搜索结果的返回数。八、搜索引擎的分类1.按搜索机制分类(1)目录型搜索引擎(2)关键词型搜索引擎(3)混合型搜索引擎2.按搜索引擎提供的搜索内容来划分(1)综合型搜索引擎(2)专业型搜索引擎(3)特殊型搜索引擎3.按搜索引擎在采集信息的方法及对外提供的服务方式划分(1)机器人搜索引擎(2)目录搜索引擎(3)元搜索引擎(一)Google九、著名搜索引擎介绍九、著名搜索引擎介绍Google的基本知识1.网页标题2.网页快照3.手气不错4.类似网页5.中英文字典数量庞大Google目前发展为搜索80亿
9、网页;10亿图片;10亿Usenet信息。Google的特点Google支持多达132种语言,包括简体中文和繁体中文。Google速度极快,它每秒钟能够回应几千次查询,而回应每项查询,Google都要走过30多亿个网页。Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果。Google搜索引擎的功能基本检索高级检索GoogleScholar学术搜索引擎2004年11月24日Google推出了世界上第一个针对学术期刊、论文、著作、摘要的免费学术搜索引擎一一GoogleScholar;2006年1月l1日,Google推出了面向中文用户的中文版Google学术搜索。1.Goo
10、gleScholar的特点(1)学科覆盖广泛全面,学科专业性强生物学、生命科学、环境科学(Biology,LifeSciences,andEnvironmentalScience);商业、管理、金融与经济(Business,Administration,Finance,andEconomies);化学与材料科学(ChemistryandMaterialsScience);工程、计算机科学和数学(Engineering,computerScience,andMathematics);医学、药学和兽医学(Medicine,Pharmacology,andVeterinaryScience);(2)
11、检索功能强大,搜索服务实行一站式物理学、天文学、天体科学(Physics,Astronomy,andPlanetaryScience);社会科学、艺术和人文科学(SocialSciences,Arts,andHumanities)。2.GoogleScholar检索方法(1)基本检索(2)高级检索高级检索界面3.检索结果检索结果中每条信息内容都包含:文献的题名、著者、出版物、出版年月、摘要、被引用次数、网页搜索等。 学术搜索使用偏好(二)百度“百度”二字源于中国宋朝词人辛弃疾的青玉案诗句:“众里寻他千百度”。百度的基本功能1.百度快照2.MP3搜索3.“ 超链分析” 技术4.高级搜索 白度空间
12、更多(三)百度的检索技术百度支持“与”、“或”、“非”。在关键词之间插入“空格”、“|”、“-”,可指定查询串中各关键词间“与”、“或”、“非”的关系。百度不支持AND”、“+”等符号的使用。(三)雅虎(http:/)雅虎()是全球第一门户搜索网站,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。1999年9月,中国雅虎网站开通。2005年8月,中国雅虎由阿里巴巴集团全资收购。中国雅虎()将全球领先的互联网技术与中国本地运营相结合,成为中国互联网界位居前列的搜索引擎社区与资讯服务提供商。为亿万中文用户带来最大价值的生活体验,成为中国互联网的“生活引擎”。1.分类目录检索
13、(http:/ 空格+减号,帮我们去掉无用信息。 在搜索结果页下方的搜索框中,重新输入一个查询词,然后点击“在结果中找”来缩小搜索范围。 不必担心英文的大小写 (四)搜狐(http:/www.S)1.简介搜狗是搜狐公司于2004年8月3日推出的全球首个第三代互动式中文搜索引擎,域名为。搜狗的产品线包括了网页应用和桌面应用两大部分。网页应用以网页搜索为核心,在音乐、图片、新闻、地图领域提供垂直搜索服务;桌面应用则旨在提升用户的使用体验:搜狗工具条、拼音输入法、PXP加速引擎。直通车高级检索基本搜索进一步的搜索搜索不区分大小写检索技术使用双引号进行精确查找使用多个词语搜索减除无关资料在指定网站内搜
14、索:其格式:查询词+空格+site:网址文档搜索:搜索语法:查询词+空格+Filetype:格式2.检索方法(五)网易(http:/或http:/ Press是提供是提供免费全文免费全文的、全球最大的的、全球最大的学术文献出版商之一,于学术文献出版商之一,于1995年由美国斯坦福大年由美国斯坦福大学图书馆创立。最初,仅出版著名的周刊学图书馆创立。最初,仅出版著名的周刊“Journal of Biological Chemistry”,目前已收目前已收录电子录电子期刊期刊340多种多种,文章总数已达,文章总数已达130多万篇,多万篇,其中超过其中超过58万篇文章可免费获得全文万篇文章可免费获得全
15、文;这些数据;这些数据仍在不断增加。通过该界面还可以检索仍在不断增加。通过该界面还可以检索Medline收录的收录的4500余种期刊中的余种期刊中的1200多万篇文章,可看多万篇文章,可看到文摘题录。到文摘题录。HighWire Press收录的期刊覆盖以收录的期刊覆盖以下学科:生命科学、医学、物理学、社会科学、下学科:生命科学、医学、物理学、社会科学、生态、环境科学等。生态、环境科学等。 进入主页进入主页:http:/intl.highwire.org/实习三、利用INTERNET的搜索引擎获取信息一、目的与要求:学习掌握Internet的基本知识和功能,熟悉Internet信息资源及搜索引擎,并利用搜索引擎获取在线的相关数字信息,尽可能使用多种搜索引擎。通过学习做出有关搜索引擎的学习课件,课件不少于二十章。二、题目题目与专业相关的免费资源或数据库健康、快乐,进步,幸福!真诚祝愿同学们:真诚祝愿同学们: