质量检测和质检错误类型分析课件教学内容

上传人:yulij****0329 文档编号:137635336 上传时间:2020-07-10 格式:PPT 页数:30 大小:1.43MB
返回 下载 相关 举报
质量检测和质检错误类型分析课件教学内容_第1页
第1页 / 共30页
质量检测和质检错误类型分析课件教学内容_第2页
第2页 / 共30页
质量检测和质检错误类型分析课件教学内容_第3页
第3页 / 共30页
质量检测和质检错误类型分析课件教学内容_第4页
第4页 / 共30页
质量检测和质检错误类型分析课件教学内容_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《质量检测和质检错误类型分析课件教学内容》由会员分享,可在线阅读,更多相关《质量检测和质检错误类型分析课件教学内容(30页珍藏版)》请在金锄头文库上搜索。

1、质量检测和质检错误类型分析,CADAL项目管理中心司红岩,Contents,2020/7/10,CADAL管理中心-司红岩,质检过程简述,2020/7/10,CADAL管理中心-司红岩,数据提交,数据提交方式 通过邮寄硬盘或光盘接收数据和提交单。在数据导入质检平台前进行预检,排除一些容易发现的错误,降低后续无效工作量 提交单 检验内容 宏观的提交程序问题:加工单位、资源类型、提交过程、单据、数据量 原则与依据 在资源选择、提交、代码分配方面的一些协议、文件、规范。,2020/7/10,CADAL管理中心-司红岩,著录浏览检验(人工质检),工作概述 CADAL电子书所有的著录信息都保存在dc.x

2、ml catalog.xml、a.opf三个文件中。 可以根据著录规范和细则对著录信息的规范性进行检查, 文字内容部分需要通过实际页面对比。 目录与其他信息中的电子书页面标引需要在电子书阅读环境下采用浏览工具逐个检验。 必要时还要查询查重原始记录,如缺失封面、封底、多册合订等,需要事先备注并在资源描述中著录,质检结果单据,质检过程产生三种结果单据: 质检明细单 PDF报表 终检明细单,2020/7/10,CADAL管理中心-司红岩,质量特性分析,按严重程度分类,CADAL成品数据中既有人工操作和输入的内容,也有软件自动生成的内容。一般人工输入的内容,如果图像文件完整,可以在缺少实体资源的情况下

3、通过异地实现修改。可修改的错误一般不归为严重错误。,质量特性分析,按错误程度分类,暂定14项(严重错误) 与查重系统比对ID相同,元数据不同 版权争议资源 政治敏感资源 保密资源 未定义语种的资源 非完整的书(资源),查重时未标注 缺封面,查重时未标注,2020/7/10,CADAL管理中心-司红岩,缺封底,查重时未标注 缺单页超过5页,查重时未标注 缺章节,查重时未标注 残破的书(资源),查重时未标注 页面大面积缺失(超过四分之一),查重时未标注 页面大面积缺失超过5页,查重时未标注 其他资源选择类错误,2020/7/10,CADAL管理中心-司红岩,暂定24项(严重错误) 错误的图片格式(

4、非JPEG2000或者tif) 错误的分辨率 错误的颜色模式 页面扫描不全 页面周围有黑边 图片底纹有阴影 有扫描者指纹 页面中有其他异物痕迹 有折角 纸面不平 页面扭曲,2020/7/10,CADAL管理中心-司红岩,中缝过窄、影响页面完整 缺单页未标注 页面破碎未修复、调整 页面模糊影响阅读 文字颜色过深 文字颜色过浅 文字颜色深浅不一 字迹不清晰,影响文字识别 笔画残缺 文字重叠 反面文字可见 二页扫描成一页 其他图片扫描错误:,2020/7/10,CADAL管理中心-司红岩,2020/7/10,CADAL管理中心-司红岩,暂定14项(严重错误) 扫描痕迹未彻底去除(如黑边、阴影、指纹、

5、异物等) 页面空白处污迹未去除 行间空白处污迹未去除 关键信息(如页码、章节、卷号等)周围空白处污迹未去除 过度去污导致文字内容残缺 过度去污导致有用信息残缺(如印鉴、签名、批注、页眉、页脚等) 裁切过度导致页面不全,裁切尺寸不当 同一幅面采用了不同大小的裁切尺寸 页面倾斜,超过3度 页面倒置 页面横置 页面未居中 其他图像处理类错误,2020/7/10,CADAL管理中心-司红岩,2020/7/10,CADAL管理中心-司红岩,暂定15项(重要错误) 实体资源缺目录,加工时未编制 实体资源缺目录,加工时未按要求编制 目录与正文内容不符,非同一资源 未按实体资源目录著录完整 实体资源目录与正文

6、标题不一致,有错别字或者未按正文标题著录 目录著录格式未遵从CADAL的目录著录细则 该资源有其他重要信息(封面、目录、内容提要、ABSTRACT或其他文种内容提要、前言、参考书目、附录、感谢、标题页、题跋、引语、序言、贡献、索引、注释、术语表、版权、表格清单、插图清单、封底等)未著录,2020/7/10,CADAL管理中心-司红岩,目录页码标注错误导致链接到不相关页面 “其他信息”导航中的页面页码标注错误,导致链接到不相关页面 .如果目录有很多级录入至少要三级 除了目录,封面、书名页、版权页、内容提要、前言、参考书目、附录、感谢、标题页、题跋、引语、序言、贡献、索引、注释、术语表、版权、表格

7、清单、插图清单、封底等都应该放在“其他信息”导航下(此项可商议) 目录导航不能正常打开 上一页与下一页链接不正确、或者不能正常跳转 封面和封底跳转不正确 其他目录信息错误,2020/7/10,CADAL管理中心-司红岩,暂定18项(重要错误) 不完整的文件结构 原始图片文件(JPEG2000)缺失 发布文件(DJVU)缺失 元数据文件(dc.xml)缺失 目录文件(Catalog.xml)缺失 索引文件(a.opf)缺失 无效(0KB)的文件结构 原始图片文件(JPEG2000)无效 发布文件(DJVU)无效 元数据文件(dc.xml)无效,目录文件(Catalog.xml)无效 索引文件(a

8、.opf)无效 文件数量(JPEG与DJVU)不一致 文件内容重复 相邻文件内容与页码均重复 部分章节内容与页面均重复 混入了不相关的内容,如A书中混入B书的内容 其他数据复制与传输类错误,2020/7/10,CADAL管理中心-司红岩,暂定7项(次要错误) 缺题名、作者、主题、出版社、出版时间、类型、语言、权限管理、时空范围等有则著录项 元数据与正文内容不符,非同一资源 元数据有乱码 元数据著录内容未遵从实体资源,如有错别字等 元数据著录格式未遵从CADAL的元数据著录细则 元数据著录内容不完整 其他元数据著录类错误,2020/7/10,CADAL管理中心-司红岩,常见错误举例,图片错误:有

9、扫描者手指图像未去除,2020/7/10,CADAL管理中心-司红岩,行间空白处污迹未去除:,2020/7/10,CADAL管理中心-司红岩,过度去污导致文字内容残缺,链接错误,2020/7/10,CADAL管理中心-司红岩,内容缺少,2020/7/10,CADAL管理中心-司红岩,元数据信息著录不全、不规范,2020/7/10,CADAL管理中心-司红岩,没有使用权限元素项,2020/7/10,CADAL管理中心-司红岩,元数据自定义项不规范,2020/7/10,CADAL管理中心-司红岩,元数据著录错误,元数据信息与原书不符,非同一资源 06814258 元数据日期和原书不一致 06813940 元数据没有书名 06817743,2020/7/10,CADAL管理中心-司红岩,正确范本展示 现代图书 英文图书 有多种语言的图书 侨批,2020/7/10,CADAL管理中心-司红岩,The end,thank you!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号