计算机信息检索概论参考PPT

上传人:日度 文档编号:150661982 上传时间:2020-11-08 格式:PPT 页数:55 大小:270.50KB
返回 下载 相关 举报
计算机信息检索概论参考PPT_第1页
第1页 / 共55页
计算机信息检索概论参考PPT_第2页
第2页 / 共55页
计算机信息检索概论参考PPT_第3页
第3页 / 共55页
计算机信息检索概论参考PPT_第4页
第4页 / 共55页
计算机信息检索概论参考PPT_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《计算机信息检索概论参考PPT》由会员分享,可在线阅读,更多相关《计算机信息检索概论参考PPT(55页珍藏版)》请在金锄头文库上搜索。

1、1,计算机文献检索,材料科学与工程学院 主讲人 陈国华,2,一、课程的地位、性质和任务,本课程是材料科学与工程专业、材料学等专业的专业基础必修课。它是培养宽口径、厚基础材料专业学生的重要基础课程, 其任务是: 通过本课程的学习,使学生掌握计算机信息检索的基础知识、基本方法,文献信息资源概况、网络学术信息资源类型和检索方法,熟练掌握获得中文科技文献的能力,具备初步的获得外文文献的能力,为后续专业课程和毕业论文服务。,3,本课程着重学习国内外重要的期刊数据库、二次资源数据库和专利文献库的检索利用及使用技巧。,4,二、 课程教学的基本要求,牢固掌握计算机检索的基本知识。 熟练掌握中文数据库的检索方法

2、。 掌握外文二次资源数据库和全文数据库的检索方法。 掌握引文数据库的检索方法。 学会使用特种文献数据库。 学会查阅和使用专利数据库,5,三、理论教学内容与学时分配,1、计算机信息检索概论(2学时) 2、信息检索的方法和技术(2学时) 3、中文数据库(2学时) 4、外文数据库(4学时) 5、美国化学文摘(CA)、专利文献检索 (4学时) 6、其它数据库如专利、特种文献数据库等(2学时) 7、机动、总结(2学时),6,三、考核方式及成绩构成,考核方式:闭卷 考试时间为90分钟,具体考试时间提前一周通知学生。 总评成绩10%平时成绩+40%实验成绩+50%期末成绩,7,四、教材与参考书目 推荐教材:

3、符绍宏主编.信息检索,高等教育出版社,2004.7 参考书目: 1、潘家祯主编.科技文献检索手册,化学工业出版社,2001.1 2、郄少青主编. 信息检索.西南交通大学出版社,2004,8,第一章 计算机信息检索概论,1.1 信息检索 1.1.1 信息检索的概念 1.1.2 信息检索的类型 1.2 信息资源 1.2.1 信息资源的概念 1.2.2 信息资源的分类 1.2.3 文献信息资源,1.3 信息检索需求 1.3.1 信息检索的现实需求 1.3.2 信息检索需求的类型,9,1.1信息检索,1.1.1信息检索的概念 表述: 信息检索(Information Retrieval)就是信息用户为

4、处理解决各种问题而查找、识别、获取相关的事实、数据、知识的过程及活动。 研究的主要内容: 信息检索理论、信息检索语言、信息检索工具或信息检索系统的构建、信息检索技术与方法。,10,信息检索的不同解释,1.从通讯的角度认识信息检索 1950年莫尔斯(Calvin N. Mooers) 发表了把信息检索看做是时间性的通讯的文章。观点旨在说明信息传递是一种特殊的通讯形式。 信息发送者是时间性通讯的被动一方,信息接受者是主动一方。突出了用户需求的重要性。,11,2.从信息处理的角度认识信息检索 关键问题在于如何处理信息和信息的结构。这种认识偏重于信息管理领域。认为信息不仅局限于传统“文献”,图像、声音

5、和数据等也能反映信息。,12,3、从信息检索过程的角度认识信息检索 认为信息检索就是查找出含有用户所需信息的文献的过程。这是一种主流观点,支持者居多。美国信息检索专家卡斯特的经典表述是“信息检索系统并不检索信息”。因为信息是无形的,必须依附于文献而存在。,13,4.全息检索 我国的王永成教授认为,全息检索就是“可以从任意角度、从存储的多种形式的信息中高速度准确地查找,并可以任意要求的形式和组织方式输出,也可以仅输出人们所需要的一切相关信息的电脑活动”。体现了“以人为本”的理念。,14,5.概念信息检索 Chank等专家认为,概念信息检索是基于自然语言处理中对知识在语义层次上的析取,并由此形成知

6、识库,再根据对用户提问的理解来检索其中的相关信息。 与传统的关键词文献检索不同,可以防止误检和漏捡。,15,信息检索有广义和狭义两种含义。 广义包括“存”和“取”两个环节;而狭义仅指“取”一个环节。,图11信息检索过程示意图,用户需求,用户提问,相关匹配,信息获取,命中,特征化表示,检索工具或检索系统,信息源,收集、表音、描述、组织,16,1.1.2 信息检索的类型,1.按检索对象的内容分 2.按检索方式区分 3. 按检索要求分 4.按检索的时间跨度区分 5. 按检索对象分 6. 按检索对象的信息组织方式区分 7. 按照检索途径的特点区分,17,1.按检索对象的内容分(三种),文献检索(Doc

7、ument Retrieval) 以文献检索作为检索对象,查找含有用户所需信息内容的文献,是一种相关性检索而非确定性检索。 WHY HOW WHERE WHAT 文献检索主要是利用二次文献进行 ,是信息检索中最基本、最重要的类型。 例:系统收集有关“普通机床电火花加工附加装置”,18,数据检索 是指查找用户所需特定数据的检索。 (需要事先存储数据)。 各种词典、手册、百科全书、年鉴、等参考工具书进行,也可以利用专门的数据库进行检索。 例: 1)我国第四次人口普查中全国少数民族的人数。 2)熔点、电阻系数,计算公式、数据图表,化学分子式等。 例如,2002年中国经济增长率是多少?,19,事实检索

8、 是指以特定的事实为检索对象的一种检索。 百科全书、手册、年鉴、名录及相关数据库等参考工具进行检索。 例: 1)我国加入WTO后于2002年1月所停止使用的法律 2)文革时期的“张生交白卷事件”,20,练习(判断何种检索类型),1、世界上有多少篇关于“飞机材料疲劳断裂问题的研究”的文章等。 2、某种型号飞机的体积、机动性能如何? 3、某高速公路有多长? 4、“ INFROMATION ”的中文含义是什么?,21,2.按检索方式区分(两种),手工信息检索 利用工具书手工进行信息检索。优点是直观、灵活、准确性高;缺点是检索速度慢、工作量大。,22,机器信息检索 主要是指计算机信息检索,是通过对 已

9、经数字化的信息,按照设计好得的程序进行查找和输出的过程。有脱机检索和联机检索;光盘检索和网络检索处理方式。计算机检索是在手工信息检索的基础上发展而来的。,23,3 按检索要求分(三种),强相关检索 强调检索的准确性,只要检索得到的文献信息能够满足用户的需求即可。一般对检索的数量不做要求。 弱相关检索 强调检索的全面性,向用户提供系统完整的信息的检索,也称为族性检索。例如检索出某一段时间内有关特定主题的所有信息。 实际上更多的时候,用户对于检索的要求介于上述两者之间。,24,4 按检索的时间跨度区分(两种),定题检索 查找有关特定主题最新信息的检索。特点是只检索最新的信息,时间跨度小。适用于文献

10、更新时用。非常适合于信息跟踪,便于即使了解有关主题领域的最新发展动态。 回溯检索 查找一段时期内有关特定主题信息的检索。特点是可以查找过去某一段时间的特定主题信息,也可以查找最近的特定主题信息。,25,5 按检索对象分(两种),文本检索 至今在信息检索中仍占据着主要位置 多媒体检索 声音、图像、图形和文字多种功能组合在一起,26,6 按检索对象的信息组织方式区分(三种),全文检索 (Full Text Retrieval) 超文本检索 (Hyper Text Retrieval 超媒体检索 (Hyper Media Retrieval),27,7. 按照检索途径的特点区分(三种),常用法 利用

11、检索工具或系统中常设的检索入口(如主题、分类、著者、号码等)查找文献信息的方法。具体操作分为顺查、倒查、抽查三种。 回溯法 也叫引文法,是利用文献末尾所附的参考文献或引文为检索入口来查找更多来源文献的方法。一般要使用引文数据库。,28,循环法 也称分段法。是综合常用法和回溯法的检索方法。既利用一般的检索途径,又利用原始文献后所附的参考引用文献作为检索入口,分阶段按周期的交替使用两种方法。,29,1.2 信息资源,1.2.1 信息资源的概念 当代信息社会的三大资源: 能源资源 物质资源 信息资源 战后日本经济的崛起突出显示了信息资源的重要作用。 何谓信息及信息资源?有广义信息资源和狭义信息资源之

12、分。,30,1.2.2 信息资源的分类,1.按信息资源所依附的载体划分 体裁信息资源 指以人体为载体并能为他人识别的信息资源。按其表述方式又分口语信息资源和体语信息资源。前者如授课、谈话、讲演、讨论、唱歌等;后者如表情、手势、姿态、舞蹈等。,31,实物信息资源 以实物为载体的信息资源。又分天然实物信息资源和人工实物信息资源。例如产品、样本、样机、模型和雕塑等。 文献信息资源 以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源(人们用的最多的信息资源)。 网络信息资源 指以网络为纽带链接起来的信息资源和以网络为主要交流、传递、存储的手段和形式的信息资源(因特网Internet

13、信息资源)。,32,2.按照信息资源传递的范围划分,公开信息资源 又称共享信息资源或白色信息资源。指公开发行、流通和传递的信息资源。 半公开信息资源 又称灰色信息资源。如内部的刊物、技术报告、会议资料等。 非公开信息资源 又称黑色信息资源。指人们未破译或未被辨识的,也指处于保密状态的信息。如未解密的政府文件,内部档案,个人日记,四人信件等。,33,风景欣赏1,34,风景欣赏2,35,风景欣赏3,36,风景欣赏4,37,风景欣赏5,38,风景欣赏6,39,3. 按照信息资源的加工程度划分,零次信息资源 是一种零星的、分散的和无规则的最原始信息资源,如书信、手稿、实验记录、会议记录等。特征是原始性

14、、新颖性、分散性和非检索性。 一次信息资源 指经过初步加工的原始信息资源,如期刊论文、学位论文、技术报告、会议论文、专利说明书等。 特征是新颖性、创造性和较系统性,40,二次信息资源 指对大量一次信息资源进行加工、整理、标引、著录、浓缩,并予以有序化编排而形成的结果。主要指各种目录、索引、题录、文摘等。 事实上,文献信息检索就是利用这些二次信息资源作为钥匙,打开原始信息资源之门,获取用户所需的信息。 三次信息资源 通过二次信息资源提供的线索,对某范围的一次信息资源进行分析、研究、加工而成的信息资源。如综述、述评、专题研究报告、百科全书、年鉴、指南、手册和词典等。,41,总之,从一次文献到二次文

15、献、三次文献的过程,是对知识信息进行的一次加工(创造性)、二次加工(有序化)和三次加工(高度浓缩、提炼、创造)的过程。,42,练习(判断为何种文献类型),、L. D. andau and E. M. Lifschitz, Quantum Mechanics, Pergamon Press, Inc.,Elmsford NY 1962. 、WESE, Digital computer monitored and operated system or process Patent No. US 4889-706 21.06.83 、M. S. Pater and M. N. Wegman, Lin

16、er Unification, J. Comput. Syst. Sci. P15-18(1978). 、蔡云良 平行光多重全息测位移 测控技术 1993, 4 P20-23,43,、R. J. Lomax, Application of the Finite-Element Method To Semiconductor Modeling,Technical Report No. UM-EPL-014289*-TI, NTIS Accession No. PB-287729, PB-215783 、 K. A. Chen, The Chip Layout Problem: An Automatic Wiring Procedure, Proceedings of the 14th Design Automation Conference, 1977, PP289-302 、Mechanical Testing of steel Products ,S

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号