数字图书馆重点

上传人:共*** 文档编号:49898624 上传时间:2018-08-04 格式:DOC 页数:6 大小:60KB
返回 下载 相关 举报
数字图书馆重点_第1页
第1页 / 共6页
数字图书馆重点_第2页
第2页 / 共6页
数字图书馆重点_第3页
第3页 / 共6页
数字图书馆重点_第4页
第4页 / 共6页
数字图书馆重点_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《数字图书馆重点》由会员分享,可在线阅读,更多相关《数字图书馆重点(6页珍藏版)》请在金锄头文库上搜索。

1、1. 数字图书馆相关概念数字图书馆相关概念:电子图书馆;虚拟图书馆;无墙图书馆;网络(网上)图书馆。2. 数字图书馆特点数字图书馆特点:信息资源数字化;信息传递网络化;信息资源共享性;信息提供的知识化。3. 数字图书馆的产生数字图书馆的产生:产生背景:信息技术发展的后果;图书馆业务处理对象:信息载体质和量的变化;图 书馆业务处理手段:网络化、虚拟化、自动化;迫使图书馆必须调整馆藏结构、变革处理 流程、改变服务方式; 产生原因: 内因:文献载体电子化、数字化;文献信息利用手段受信息技术发展影响,特别是计 算机和网络技术的发展。 外因:信息资源的剧增;信息高速公路的建设和因特网的发展;数字化技术的

2、发展。4. 数字信息数字信息除了有大量的传统文本信息,还包括迅速发展的非文本信息(如照片、图 片、艺术作品等) ,视频音频资料(音乐带、电视电影片、动画游戏资料等) ,多维图 像和数据(如全息图像) ,数字流信息(如卫星信息、宇宙数据等) 。 数字对象:数字对象:一般来说,数字对象由元数据、数字资料和调度码组成 5. 元数据:元数据:它是结构化的关于数据的数据,它是存储在数字对象中的信息,包含一些 识别对象的条件、条款和调度码。其功能是管理网络环境下的数字对象,如数字对象 的存储、 复制和传递的管理。 数字资料:数字资料:指对文本经扫描转换后的数字化表示,即二进制数字。数字对象中的数字 资料是

3、数字图书馆的原型资料。 调度码:调度码:数字对象的名称是数字图书馆的一个最重要的结构元素,数字对象都需要一 个名称以区别各个数字对象。为了识别数字对象而制定的标识符称为调度码。URN 数字对象的结构特性:数字对象的结构特性:相关性;数字格式;数字对象变化;权限与许可权 元对象:元对象:是为数字对象集提供基准或参照的一种对象。最简单的形式便是数字对象的 一个句柄列表或调度码清单。 6. 数字图书馆系统结构模型:数字图书馆系统结构模型:用户界面;查询系统; 调度系统; 图书馆服务器;对 象库;制作系统 10. 几种标准:几种标准: ASCII、ISO646、GB1988;GB2312-80 ;GB

4、18030-2000;ISO10646编码标准 标准间的关系标准间的关系 :GB2312 支持的汉字太少。1995年的汉字扩展规范 GBK1.0收录了21886个 符号,它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的 GB18030是取代 GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文 等主要的少数民族文字。现在的 PC 平台必须支持 GB18030,对嵌入式产品暂不作要求。所 以手机、MP3一般只支持 GB2312。从 ASCII、 GB2312、GBK 到 GB18030,这些编码方法是 向下兼容的,即同一个字符在这些方案中总

5、是有相同的编码,后面的标准支持更多的字符。 在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为 0。按照程序员的称呼,GB2312、GBK 到 GB18030都属于双字节字符集 (DBCS)。 11. 元数据结构标准元数据结构标准 :1总体结构定义方式 。2内容结构3句法结构4语义结构 12. DC 结构标准:结构标准:题名;创建者;日期;主题;出版者;类型;描述;其它贡献;格式; 来源;语言;权限;标识;关联;覆盖范围。+修饰词。13. SGML 将信息分作两部分:将信息分作两部分:文件类型定义 DTD (Documnet Type Definition)和文件实

6、例。 HTML 是一种用来制作超文本文档的简单置标语言 。HTML 语言是基于标准置标语言 SGML 的文本,是一套用来描述数字化文档的结构并管理其内容的规范标准 。XML 即可扩展置标 语言。它是通用标准置标语言(SGML)的子集。在国际上它广泛地被用于文本处理传递。 XML 使 web 上的资源在 SGML 环境中简便易用,具有活力,比较 SGML 与 HTML,它具有 较好的互操作性。XML 是一个开放式标准,它由可扩展的标识语言 XML、可扩展的样式语 言 XSL(和可扩展的链接语言 XTL 组成。这三个标准相辅相成,使 XML 语言在数据标记、 显示风格和超文本链接方面功能强大,对数

7、据交换十分便利。除了一些个别的标记外, HTML 文档的标记都可嵌套使用。 14、RDF 的实现机制:的实现机制:它使用 XML 语法,首先指定词汇集的 URI,词汇集可以是多个,视 需要而定,再使用指定的词汇集来描述资源,不同的词汇集间用 RDF Schema 联系。 15、现有的 Ontology 及其分类:依照领域依赖程度,可以细分为顶级、领域、任务和应用 Ontologies 等4类:顶级 Ontologies 描述的是最普通的概念及概念之间的关系,如空间、时 间、事件、行为等等,与具体的应用无关,其他种类的 Ontologes 都是该类 Ontology 的特 例;领域 Ontolo

8、gies 描述的是特定领域中的概念及概念之间的关系;任务 Ontologies 描述 的是特定任务或行为中的概念及概念之间的关系应用 Ontologies 描述的是依赖于特定领 域和任务的概念及概念之间的关系。16Dublin Core 与与 MARC 的比较:的比较:1.Dublin Core 的适用范围超过 MARC;2图书馆的目录模式可以向 DC 靠拢有利于图书馆的文献信息参加网络环境下更大范围的统一处 理和共享;而且 MARC 的有关字段是可以转为 DC 元数据的。3.DC 与 XML 结合可使 XML 应 用更成功;4.MARC 用于图书馆系统间的交换数据,而 XML 有利于信息数据

9、的底层的格式 化统一转换;5.MARC 将继续使用下去,如将 DC 与 XML 相结合将会十分有益。17. 元数据标准的发展趋势元数据标准的发展趋势 :1. 从功能上看,其描述从单一向综合发展。2. 其结构是从整体式到模块化的变化。3其形式是繁到简、可以自由伸缩的变化。以前的元数 据需要几十个字段、上百个子字段,而 DC 只有15个核心元素。4. 其覆盖面从包罗万象到 面向特定学科、专业、文献类型的变化。5. 其方式从数字型代码到文字型含语义的元素标 签,并逐渐实现 XML 化的变化。6. 其生成方式从手工到自动化方向发展。18. 扫描仪的工作原理扫描仪的工作原理是通过 CCD 器件将所扫描的

10、文件读入处理器,经过光电耦合将光信号转换为电子信号,并利用扫描仪接口卡将信号送入计算机中。19、OCR 通称为文字识别,工作原理通称为文字识别,工作原理为通过扫描仪(或数码相机)等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出文字 的标准编码,并按通用格式存储为计算机的文本文件。 19. 数字图书馆的内容录入与采编的步骤:数字图书馆的内容录入与采编的步骤:1编写脚本及素材的收集整理;2素材的编辑;3定义元数据的格式;4资源内容再制作;5资源内容的标引质量检查;6归档; 7元数据抽取;8元数据抽取。20.概述:文本是计算机表示文字及符号等信息的最基本的数据类型

11、。概述:文本是计算机表示文字及符号等信息的最基本的数据类型。文本信息在形式上表现为字符的集合。获得文本信息的方式:文本信息在形式上表现为字符的集合。获得文本信息的方式:手工键盘录入;自动输入(电子笔和语音) 。文本信息的处理文本信息的处理:1文本信息编码处理(输入处理) 汉字内码又称为汉字机内码,它是指在计算机内部进行存储、传递和运算所使用的 汉字编 码。外码又称为汉字输入码,它是为了把汉字输入计算机而编制的编码。常常要求输入码 的规则简单、易于记忆、操作方便、编码容量大、码长短和重码率低。除此之外,在汉字 信息处理中,还有汉字地址码和汉字字型码。 2文本信息的压缩。文本信息的压缩一般采 用无

12、损数据压缩算法。常见文件格式常见文件格式:PDF 格式;TXT;MS DOC 文件格式;超文本格式;PS 格式;其他格式。21. 图像与图形的异同图像与图形的异同:(1)图形:数据量很少;有结构,便于编辑修改;能准确表示3D 景物,易于生成所需的不同视图;生成视图需要复杂的计算;自然景物的表示很困 难;国际标准:GKS,PHIGS,OpenGL,WMF,VRML,CGM,STEP;编辑软件: AutoCAD,CoreIDraw(2)图像:数据量大;无结构,不便于编辑修改;3D 景物的信息已部 分丢失,很难生成不同的视图;生成视图不需要复杂的计算;自然景物的表示不困难;国 际标准:GBIG,JP

13、EG,TIFF;编辑软件:Photoshop,Photostler22.描述图像的技术参数:描述图像的技术参数:像素及图像深;图像分辨率;调色板。23.图像信息的主要特征图像信息的主要特征(直观特征直观特征) :所占存储空间大;占用频带较宽;矩形阵列中的像素值集中在一定范围内;样本间的相关性;主观性;非平稳信源。 图像产生的途径与处理图像产生的途径与处理:扫描、数字拍摄设备1、平板扫描仪2、旋转鼓扫描仪3、手持扫描 仪;计算机合成、绘制或渲染;图像处理1、点处理、区处理和几何处理2、图像旋转和缩 放3、图像增强(锐化) 常见图像格式:常见图像格式:BMP 格式;TIFF 格式;JPEG 格式;

14、GIF 格式。24.模拟信号的数字化过程模拟信号的数字化过程也称为模拟/数字转换的过程,是将模拟信号转换为数字信号,这个过程称之为模数转换,常用 A/D 表示。25.常见视音频文件格式:常见视音频文件格式:1音频文件格式:WAV 、MIDI、MPEG、RealAudio;2视频文件格式1、动画文件格式 GIF、 Flic 2、影像文件格式 AVI、QuickTime、MPEG、RealVideo 、Real Media、 Advanced Streaming Format;3新型的流式视频格式 Real Medi 文件格式、 QuickTime 文件格式、 Advanced Streaming

15、 Format 视频格式27. 数据冗余的种类数据冗余的种类 :(一)信息熵冗余(编码冗余) (二)空间冗余(三)时间冗余(四)结构冗余(五)知识冗余(六)视觉冗余 (七)其他冗余28. 数据压缩方法分类:数据压缩方法分类: 根据解码后数据是否同原始数据一致可分为:(一)无损压缩(二)有损压缩(三)混合压缩根据压缩原理不同可以分为:预测编码、变换编码、 ;量化与向量化编码、信息樀编码、分频带编码、结构编码和基于知识的编码。29. 数据压缩算法与相关标准数据压缩算法与相关标准:(一)文本压缩技术:霍夫曼(Huffman)编码、算术编码、字典压缩模型(LZW 编码、游程编码) (二)文本数据压缩1

16、. 文件压缩存档实用程序、第二类是可执行文件压缩实用程序、第三类是系统级磁盘压缩管理软件、软盘 (光盘)压缩快递软件,.iso (三)静止图像压缩 1、CCITT G4;2、JBIG 和 JBIG2 ; 3、JPEG 和 JPEG2000 (四)运动图像压缩1、面向通信的视频编码 H 系列标准2、活动图 像专家组(MPEG)是几个国际标准化和工业组织的一个联合小组,该小组的主要目标是为 全屏幕活动视频图像提供工业标准。MPEG 压缩标准是针对运动图像而设计的,它包括 MPEG 视频、MPEG 音频和 MPEG 系统(视音频同步)三个部分。 (五)音频动态压缩, MP1,MP2,MP3。30. 数据仓库数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。 (含义可以从两个层次理解:首先,数据仓用于支持决策,面向分析型数据处理,他不同 于企业现有的操作型数据库;其次,数据仓库是对多个异构数据源的有效集成,集成后按 主题进行重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号