传播技术第3章+检索原理和搜索引擎+2学时.ppt

上传人:xh****66 文档编号:61711518 上传时间:2018-12-10 格式:PPT 页数:106 大小:7.32MB
返回 下载 相关 举报
传播技术第3章+检索原理和搜索引擎+2学时.ppt_第1页
第1页 / 共106页
传播技术第3章+检索原理和搜索引擎+2学时.ppt_第2页
第2页 / 共106页
传播技术第3章+检索原理和搜索引擎+2学时.ppt_第3页
第3页 / 共106页
传播技术第3章+检索原理和搜索引擎+2学时.ppt_第4页
第4页 / 共106页
传播技术第3章+检索原理和搜索引擎+2学时.ppt_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《传播技术第3章+检索原理和搜索引擎+2学时.ppt》由会员分享,可在线阅读,更多相关《传播技术第3章+检索原理和搜索引擎+2学时.ppt(106页珍藏版)》请在金锄头文库上搜索。

1、农业传播技术 张胜光制作,1,农业传播技术 张胜光制作,2,第三章 检索原理和 搜索引擎,农业传播技术与应用,农业传播技术 张胜光制作,3,本章内容,农业传播技术 张胜光制作,4,第一节 信息检索原理: 关键词匹配原则,农业传播技术 张胜光制作,5,1、从“图灵实验”说起,大家都知道,计算机发展史上有一个重要人物图灵,他在上世纪50年代曾经提出了一个假想的实验,认为计算机可以具有人类的思维能力,被称为“图灵实验”。他并且预言,在20世纪末,具有人工智能的计算机将会出现。但时至今日,仍未有任何一台计算机能通过“图灵实验”。,农业传播技术 张胜光制作,6,2、计算机检索的奥妙:关键词匹配,计算机既

2、然如此“无能”,连三岁小孩的智能都不具有,那么为什么人们要在网上查找信息,却总要通过计算机帮忙呢?计算机检索的奥妙在哪里呢? 原来,计算机实现检索的奥妙,就在于它能把你输入的检索词,与它后台数据库中存储的文件关键词进行比对,如果能够匹配,就认为这条信息是你需要的,立刻输出给你。,农业传播技术 张胜光制作,7,存 储,检 索,原始文献,加工整理,数据库,提 问,检 索,输 出,“爱因斯坦论文”,“论文”,“爱因斯坦”,“论文”,“爱因斯坦”,农业传播技术 张胜光制作,8,4、信息检索原理,检索 提问式,信息 的选 择与 收集,信息 特征,标 识 语 言,检索工具 匹配,检 索 结 果,信 息 源

3、,用 户,信 息 需 求,检索 提问,数据库,农业传播技术 张胜光制作,9,What? Where? How?,5、信息检索的要领,农业传播技术 张胜光制作,10,6、信息检索类型,依信息存储和检索的方式 手工检索(Manual Retrieval) 也叫传统信息检索,是利用各种印刷型检索工具来查找文献的一种方法。 计算机检索(Camputer-based Retrieval) 也叫现代信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。,农业传播技术 张胜光制作,11,7、主要计算机检索系统类型,检索系统由一定的检索设备(计算机)和经过加工整理并存储在相应载体上的信息集合及其他设备

4、共同构成的具有存储和检索功能的信息服务系统。 联机检索(online search) 脱机检索(offline search) 光盘检索(CD search) 网络检索(Internet/Web search) 全球数字图书馆系统(digital global system),农业传播技术 张胜光制作,12,8、“关键词原则”是信息检索的根本原则,四次文献,三大系列中文网站,两类搜索引擎,Keyword原则,农业传播技术 张胜光制作,13,第二节 搜索引擎的原理 和发展概况,农业传播技术 张胜光制作,14,1、网络信息资源种类,WWW信息资源:web网页 FTP信息资源:远程计算机上的文件夹

5、Blog信息资源:博客、播客等等信息资源 Telenet信息资源:直接调用远程主机 BBS 、新闻组信息资源:相当于论坛信息 P2P信息资源:私人计算机上的信息资源 数据库和收费网站:如三大库三大馆,农业传播技术 张胜光制作,15,2、网络信息资源的特点,信息量大、传播广泛 信息类型多样、内容丰富 信息时效性强、变化频繁 信息分散无序、但关联程度高 信息缺乏管理、良莠不齐 所以在网络信息检索中,我们常常要借助于搜索引擎来帮助我们“大海里捞针”。,农业传播技术 张胜光制作,16,搜索引擎 Search Engine Internet网络信息检索工具,3、搜索引擎的概念,农业传播技术 张胜光制作,

6、17,4、搜索引擎的发展历史,农业传播技术 张胜光制作,18,搜索引擎发展历史,第三代搜索 网页搜索,农业传播技术 张胜光制作,19,搜索引擎的起源Archie,所有搜索引擎的祖先,是1990年由蒙特利尔的McGill University三名学生发明的Archie(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件

7、。,农业传播技术 张胜光制作,20,1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和David Filo共同创办了Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。Yahoo!-几乎成为20世纪90年代的因特网的代名词。,第二代搜索:目录式搜索 Yahoo!,农业传播技术 张胜光制作,21,第三代搜索:网页搜索,它们都属于网页自动搜索引擎,有的还带有智能分析或FTP、P2P搜索功能,农业传播技术

8、 张胜光制作,22,5、搜索引擎的工作原理,农业传播技术 张胜光制作,23,农业传播技术 张胜光制作,24,搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎至少由三部分组成: 爬行器(即机器人、蜘蛛等搜索程序) 索引生成器(即网页索引数据库) 查询检索器(即用户检索界面) 随着搜索引擎的发展,许多搜索引擎在此基础上增加特色功能。如百度增加了监控程序。,农业传播技术 张胜光制作,25,搜索引擎的工作原理就像超市,索引生成器 (网页数据库),爬行器 (蜘蛛),查询检索器 (用户查询),因特网,农业传播技术 张胜光制作,26,农业传播技术 张胜光制作,27,农业传播

9、技术 张胜光制作,28,第三节 两类搜索引擎及 网页搜索引擎,农业传播技术 张胜光制作,29,两类搜索引擎的代表,百度、Google、Yahoo等,迅雷、天网Maze等,农业传播技术 张胜光制作,30,第一类搜索引擎: 网页搜索引擎 以谷歌和百度为代表,农业传播技术 张胜光制作,31,1、Google搜索引擎,Google搜索引擎诞生于斯坦福大学的一个学生宿舍里,然后迅速传播到全球的信息搜索者。 Google 目前被公认为万维网上最大的搜索引擎,它提供了简单易用的免费服务,使用户能够访问一个包含超过 80 亿个网址的索引。 “Google”来自于数学名词“Googol”, Googol表示一个

10、 1 后面跟着 100 个零。Google Int.使用这一术语体现了公司整合网上海量信息的远大目标。地址: http:/ 张胜光制作,32,Google 简介:,Larry Page,创始人之一,主管产品 的总裁。密西根安娜堡大学的荣誉毕 业生,拥有理工科学士学位。他还因 其出色的领导才能获得过多项荣誉,以奖励他对工学院 的贡献。他曾担任密西根大学 Eta Kappa Nu 荣誉学会 的会长。目前他暂时从斯坦福大学计算机研究所博士班 休学,其指导教授是 Terry Winograd 博士。Google 就是由Page在斯坦福大学发起的研究项目转变而来的。,农业传播技术 张胜光制作,33,Go

11、ogle 简介:,Sergey Brin,创始人之一,主管技术的总裁。出生于莫斯科,是马里兰大学校本部的荣誉毕业生,拥有数学专业和计算机专业的理学士学位。已取得斯坦福大学计算机专业硕士学位,目前暂时从博士班休学。29 岁的 Sergey 是美国国家科学基金会的奖学金得主。他在斯坦福 遇到了 Larry Page 并参与了后来成为 Google 的研究项目。他们于1998年 共同创立了 Google。,农业传播技术 张胜光制作,34,注意用“ ”与*功能,农业传播技术 张胜光制作,35,农业传播技术 张胜光制作,36,谷歌其他功能,农业传播技术 张胜光制作,37,2、百度(baidu),全球最大

12、中文搜索引擎。提供网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、百度搜霸、搜索援助中心。 地址: http:/ 张胜光制作,38,http:/,农业传播技术 张胜光制作,39,一、概况 百度(B,Inc)于1999年底 成立于美国硅谷,2000年,落户中国。 2001年8月,发布B搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式。 2001年10月22日正式发布Baidu搜索引擎。 2005年8月5日,百度在美国纳斯达克上市。,李彦宏,农业传播技术 张胜光制作,40,“百度”二字取自辛弃疾的青玉案 “众

13、里寻她千百度” 。 现在百度已成为世界上最大的中文搜索引擎。用户能够访问超过6亿的中文网页,5000多万张图片、500多万首中文mp3及各种格式的音乐。,农业传播技术 张胜光制作,41,农业传播技术 张胜光制作,42,3、其它中文搜索引擎,新浪:http:/ 搜狐:http:/ 网易:http:/ 雅虎中国:http:/ 一搜: http:/www.yahoo- 搜狗:http:/ 网格之窗: 张胜光制作,43, 北京正望咨询有限公司,农业传播技术 张胜光制作,44,百度 VS Google,农业传播技术 张胜光制作,45,目标信息一定含有的关键字:用双引号连起来 目标信息不能含有的关键字:用

14、“ - ”去掉 目标信息可能含有的关键字:用“OR”或空格连起来,重要提示,农业传播技术 张胜光制作,46,关于搜索的一些思想,不是互联网上所有的信息都能被搜索引擎搜集。 动手前多动脑。 不要盲目信任搜索得到的信息。 不要期望一次搜索解决问题。,互联网上并没有所有的东西!,农业传播技术 张胜光制作,47,用搜索引擎查英文一次文献,有时会碰到查不到的英文文献,而这些文献的数据库我们所在研究所或大学又没有买,怎么办?可以通过以下几个途径来得到文献。 1首先在Google学术搜索里进行搜索,里面一般会搜出来你要找的文献,在Google学术搜索里通常情况会出现“每组几个”等字样,然后进入后,分别点击,

15、里面的其中一个就有可能会下到全文,当然这只是碰运气,不是万能的,因为我常常碰到这种情况,所以也算是得到全文文献的一条途径吧。可以试一下。,农业传播技术 张胜光制作,48,2如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索,用作者的名字来搜索,是因为我发现很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(home page)上,这样可能也是为了让别的研究者更加了解自己的学术领域,顺便推销自己吧。这样你就有可能下到你想要的文献的全文了。甚至可以下到那个作者相近的内容的其它文章。,农业传播技术 张胜光制作,49,如果文献是由多个作者写的,第一作者查不到个人主页,就按上面的方法查第二作者,以此类推。用文章的title来搜索,是因为在国外有的网站上,例如有的国外大学的图书馆可能会把本校一年或近几年的学术成果的Publication的PDF全文献挂在网上,或者在这个大学的ftp上也有可能会有这样类似的全文.这样就很可能会免费下到你想要的全文了.,农业传播技术 张胜光制作,50,3如果上面两个方法都没有查到你要的文献,那你就直接写邮件向

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号