网上技术与信息检索

上传人:mg****85 文档编号:56665349 上传时间:2018-10-14 格式:PPT 页数:37 大小:1.10MB
返回 下载 相关 举报
网上技术与信息检索_第1页
第1页 / 共37页
网上技术与信息检索_第2页
第2页 / 共37页
网上技术与信息检索_第3页
第3页 / 共37页
网上技术与信息检索_第4页
第4页 / 共37页
网上技术与信息检索_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《网上技术与信息检索》由会员分享,可在线阅读,更多相关《网上技术与信息检索(37页珍藏版)》请在金锄头文库上搜索。

1、网上技术与信息检索,一.互联网基础知识 二.搜索引擎,一. 互联网基础知识,我国互联网的发展,CNNIC最新统计:(2008/12/31) 2.98亿网民,居世界第一 (半年内用过互联网的6周岁及以上中国公民) 博客用户数达1.62亿 手机上网网民达到1.176亿,互联网的互联原理,TCP/IP协议通信的保证机制 IP地址地址的标识技术 客户机/服务器系统运作的基本模式,地址的标识技术IP地址,识别主机的身份证,唯一性 域名(DN):即字符型的IP地址,域名的地址格式为: lib. shmu. edu. cn 主机名 机构名 网络类型 最高域名注 需申请注册,常用网络类型代码,com 商业机构

2、 org 非营利组织 edu 教育机构 gov 政府部门 net 网管组织 int 国际组织 mil 军事部门 info 信息机构 其他:.museum .coop .aero .pro 可用于限定信息来源出处,鉴别信息可靠性 鉴别信息可靠性时,不能仅以网络类型代码为标准,需进一步根据网站主办机构、性质等来判别。,互联网提供的主要服务,环球网(WWW/Web) 电子邮件(E-Mail) 远程登录(Telnet) 文件传输(FTP) 网格等,环球网(World Wide Web),统一资源定位器(URL,网址) 是信息在网上的地址,用来定位和检索WWW上的文档。 由三部分组成 web服务器域名、

3、文件路径、文件名 例如:http:/ (2)信息索引 (3)信息查询 (4)检索结果的相关性处理,搜索引擎的分类,(1)关键词搜索引擎 (2)主题分类搜索引擎 (3)综合搜索引擎,(1)关键词搜索引擎,界面提供输入框,用户通过输入框提交查询请求(关键词),搜索引擎将检索结果反馈给用户。适用于查找目的明确,并具备一定检索知识的用户。,(2)主题分类搜索引擎,依据某种分类方式(如学科分类),建立主题树状层浏览体系;搜索程序搜索来的信息被标引后放入浏览体系的大类或子类下面,呈现错落有致的上下位关系。查准率高,但查全率低。,(3)综合搜索引擎,此类搜索引擎既可以搜索网站也可搜索全文,用户输入关键词后,

4、可以选择是搜索网站还是网页,不同的选择返回不同的结果,国内的搜狐(Sohu)就是此类搜索引擎查全率高,但查准率低。,主要搜索引擎,检索技巧,与:输入多个词,而不需要加AND,谷歌默认多个词之间关系为与,中间要留空格。 或:大写OR 非:之前加上了“-”符号的词都会自动地排除在搜索结果之外。在“-”符号之前要留一个空格符。 bass -fish 同义词:在想要搜索的词之前加上“”符号,Google就会搜索所有包括这个词以及合适的近义词的页面。 elderly 搜索特定的词组 :将整个词组放在一个引号内 。 Google会自动地将这些在你输入的搜索要求中的不重要的、普通的词忽略掉。这些被称作是“忽

5、略的单词”,包括“and”、“the,”、“where”、“how”、“what”、“or”(所有字母皆为小写,还有其它一些类似的词包括一些单独的数字或单独的字母(例如 “a”)。,搜索技巧,与:多词之间留空格。 或:使用“A | B”来搜索“或者包含关键词A,或者包含关键词B的网页” 。 非:百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一空格,语法是“A -B”。 在指定网站内搜索 :在一个网址前加“site:”,可以限制只搜索某个具体网站、网站频道、或某域名内的网页。 电话 site: 表示在网站内搜索和“电话”相关的资料。 在标题中搜索 :在一个或几个关键词前加“i

6、ntitle:”,可以限制只搜索网页标题中含有这些关键词的网页。 例如, intitle:南瓜饼 表示搜索标题中含有关键词“南瓜饼”的网页。,中国搜索,(原慧聪搜索)是国内领先的搜索引擎公司。自2002年正式进入中文搜索引擎市场以来,中国搜索(原慧聪搜索)取得了一系列令人瞩目的成绩。在一年多的时间里,发展成为全球领先的中文搜索引擎公司,先后为新浪、搜狐、网易、TOM等知名门户网站以及中国搜索联盟上千家各地区、各行业的优秀中文网站提供搜索引擎技术。目前,每天有数千万次的中文搜索请求是通过中国搜索实现的,中国搜索也被公认为第三代智能搜索引擎的代表。,搜狗 http:/ http:/,“爱问”搜索引

7、擎产品由全球最大的中文网络门户新浪汇集技术精英、 耗时一年多完全自主研发完成,为首款中文智慧型互动搜索引擎,新浪搜索引擎突破了由GOOGLE、百度为代表的算法致胜的搜索模式。它在保留了传统算法技术在常规网页搜索的强大功能外,以一个独有的互动问答平台弥补了传统算法技术在搜索界面上的智慧性和互动性的先天不足。通过调动网民参与提问与回答,新浪搜索引擎能汇集千万网民的智慧,让用户彼此分享知识与经验。,天网中文搜索引擎,北大天网 http:/ PharmWeb () 是1994年第一个在Internet上提供药学信息服务的机构。PharmWeb由国际专门组织利用最新的Internet技术向患者和保健专家

8、提供高质量的信息服务。现已拥有100多个国家的用户,主要是患者、保健专家和科学家。PharmWeb提供的服务范围很广,如网络空间、页面设计与写作、域区注册等项目。PharmWeb网页上有药学方面重要的网点,其索引按字顺列出了有关药学、生物学、化学、教育、杂志、医学、制药公司、世界各国的药学网、出版物、药学院校等167个与药学有关的网点,用户可根据需要很方便的就可连接上,检索所需信息。此外,其网页上还设有检索框,可用关键词进行检索。,医药搜索引擎,2. BioMedNet ( http:/ Discovery 、Infectiuos disease 、pharmacology 等12 个生物医学

9、数据库; 含有70多种专业期刊提供文摘, 部分提供免费全文。它还可直接进行medline 简单检索或有限制条件的检索, 使用方便。,医药搜索引擎,3.HealthAtoZ () 是一个免费全文医学信息资源搜索引擎,提供了5 万多个Internet 上的健康和医学相关网址。可根据主题词或疾病的首字母进行检索, 也可按学科分类及关键词检索。免费注册后可进一步获得全文。,医药搜索引擎,4. Med Engine (http:/ 是由美国Goldberger & Associates公司在网上建立的生物医学信息资源的专业搜索引擎。它提供分类目录浏览和网站检索的功能。收录范围是全球网站的医学信息资源,是网上生物医学资源搜索引擎的引擎或导航系统。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号