四库全书校对条例

上传人:夏** 文档编号:506510282 上传时间:2022-10-29 格式:DOCX 页数:13 大小:199.76KB
返回 下载 相关 举报
四库全书校对条例_第1页
第1页 / 共13页
四库全书校对条例_第2页
第2页 / 共13页
四库全书校对条例_第3页
第3页 / 共13页
四库全书校对条例_第4页
第4页 / 共13页
四库全书校对条例_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《四库全书校对条例》由会员分享,可在线阅读,更多相关《四库全书校对条例(13页珍藏版)》请在金锄头文库上搜索。

1、编辑校对为确保数据库的资料齐备和准确性,整个制作过程需要有系统地和足够人手去完成繁复的编辑和校对工作。数据库资料的编辑和校对工作,除了承办制作机构的努力外,更得到多家机构和单位的鼎力支持和协助。编辑校对单位上海人民出版社编审校对北京图书馆卷内标题检索校对辽宁省图书馆卷内标题检索校对东北大学等多位教授、研究生卷内标题检索校对北京大学文史系研究生卷内标题检索校对整个编校队伍超过二百人,在两年的时间内将,一百六十五张数据光碟进行浏览,解决对书籍位置的核准书、名的确定、着者与编纂者的调整、 书名与着者名的对应等各项工作。虽然电脑能辅助校对工作,但要从各个角落,用多种方法对照原文,快速而正确地校对与补充

2、输入,其难度可想 而知。经过多次校对,目前各数据库沿用的凡例部分如下:1. 全文文本数据2. 原文真迹图像数据3. 书名数据4. 着者数据5. 辅助数据 (分类条件、联机字典、汉字关联、辅助输入、辅助工具)1. 全文文本数据四库全书是在清代乾隆年间编纂,历时十载,由 3,000余名抄缮书手誊写,是我国迄今为止最大的一部丛书全。书文字总数共七亿多字次, 其中汉字出现逾七亿字次。为了尽量准确地表达这些汉字,本电子版采用了世界上迄今为止最大的国际标准编码字符集O/IEC 10646-1:2000中的CJK标准汉字27,000余个(CJK Unified Ideographs和CJK Unified

3、Ideographs Extension A,)并且在该标准框架内的Private Use Area区域内定义了近5,000个在古籍中较常使用的汉字,共计32,000编码汉字。我们把这个汉字字符集称作CJK+。根据统计,四库全书电子版的汉字数量、汉字出现字 次,在CJK+中的分布分别为:CJKCJK A63.9921.06EUDC其它符号695233305252246919598134556539925.0236.0127.986.503143884.49总数2917210070048562810000CJK+ / EUDC(Private Use区域)的自定义汉字,主要从以下来源选取:1.

4、上海人民出版社中华古汉语字典中的汉字(全选)2. 四库全书作者数据库中的全部汉字(全选)3. 四库全书书名数据库中的全部汉字(全选)4. 四库全书180万条篇目(全选)5. 四库全书中出现率在3次/亿以上的汉字6. 中华文化通志中的汉字。在CJK+的基础上,我们为电子版制作了新旧两套笔形的楷体字库开发了 OCR手写汉字识别引擎、校对软件以及键盘输入方法四库流行码。尽管如此,由於四库全书涵盖内容之大和手抄本字体的变异之钜,偌大的字符集仍然不可1能00%地保持原书字迹的真貌。因此,在工程 实际中,我们采用了一整套规则。规则的目的是在现有CJK+字符集的基础上尽量保真。不做以简代繁,只做有控制的异体

5、代换。异体代换之宽严在不同情况下有所不同:字书 从严,其他从宽;字头从严,释义从宽;表形时从严,表义时从宽。在异体代换时根据文字的一些具体情况实行了不同处理,其原则如下:(一)异体字及外字的处理1. 保真转换:凡原书字迹与CJK+字形一致时,不论是正体或异体,均实施对应的保真转换用编码汉字表示。2. 有控制的异体代换:字符集中没有、但在四库全书中出现的异写/异体汉字,已尽量选用字符集中与之最接近者代换(即:用微小笔形变异的同字代换),例如:代换为毅3. 对四库全书抄写过程中出现的增笔、减笔、误笔及书写习惯而出现的明显讹误,校对过程中已依照文意做辨别处理,例如:剌史改为刺史。4. 四库全书中避讳

6、字很多,不仅独体字避讳,写成缺笔,而且由这些字为构字部件组成的合体字同样避讳,例如:为了尊重古籍原貌,保留其文化现象,则在玄煙丿菁禎弘麽if-弦、 、 、 、 、 、 、 、 、字符集用户扩充区造字做到保真转换。但是通过汉字关联技术,从正字也可检索到避讳字。5. 对於四库全书原书中发现的疑难模糊之处模糊字”),已尽力参照原书和工具书加以鉴别,实在难以辨别者,保留其原图形作处理并加以说明。阅读时,打开联机字典,当光标移到处时,会自动出现原文字迹。例如:6. 外字处理方式:四库全书中出现了许多外字(即:无法按照原形保真转换,又无法进行异体代换的字)我们采用了以汉字结构符等特殊标记开头的字符串来 表

7、示它。以下将它如何显示、检索、提示、联机字典等的几个方面详细说明:字串字串含义显示检索提示(鼠标移到该字联机字典(鼠实例时的反应)标单击该字时的反应)倒立字显示倒立字可检索,以正常字检无索给出正常字的拼音及释义左旋转字显示左旋转字可检索,以正常字检无索给出正常字的拼音及释义右旋转字可检索,以正常字检显示右旋转字无索给出正常字的拼音及释义有圈包含此字给出正常字 可检索,以正常字检无的拼音及释索义相似而不等如:增笔、减笔等。显示正常字可检索,以 後给出原字迹图面的V检索画给出异体字的释义显示结构符是未编码的汉字,其结构如开头字符所描述的。可检索,以结构给出原字迹图无符检索二)版面问题处理原则1.

8、卷首做图形处理。2. 卷尾印章(乾隆御览之宝):删除。3. 紧密字列:长於 30 字的列由於字位过密无法显示而将其删除,只保留列中重要内容(人名或重要的大字内容)。4. 易类、八卦符下的八卦卦名,由原书竖向大字改为横向小字。例:5. 极个别类表格式的紧密字列删除较长列的部份字,以使整页字正常显示。6. 极个别单列小字和单列小小字保留,双列小小字删除。食疲二納桦鶴刃蠱_青貢*MAj千匹八五毎KxA百匹撫司印信一穎其住食緻二納#貢棵馬Aa一四+千匹八五每百匹(三)特例情况小学类中的字书和韵书,大多数是以保存或辨析字形为目的,这些书中的字形包括了历代积累下来的异写字、辨析字、讹误字、避讳缺笔字,以及

9、由於手抄典籍所造成的字形差异,遂使汉字字形的数量非常庞大,是迄今为止的任何一种标准字符集所无法容纳的,这就使得小学类古籍在转换成 电子版本时,不可能完全用编码汉字保真,而只能在现有字库所能支持的范围内,最大限度地保留它们的原貌。1. 存形、辨形的字书,不作代换。其目的在於保留当时的手字形,辨析字形之间的差异,如九经字样、干禄字书。例如:億億億音音晋音沁上出上鉴1 壷也丈從下丸*T人紈口富聲1 t-2. 释读性字书或存义的字书,为了便於检索,已作部份代换。如历代钟鼎彝器款识法帖中有一些章页是用现今文字去转写古文字的,目的在於帮助今人认读古文字的,而不是为了保存古字形。例如:3. 解释音义时适当代

10、换,分析形体时保留原貌。例如:幽4到龍丈从王応 fe-K亦聲#鏈坏4. 散见时适当代换,对比时保留原貌。例如:.朋冒荘莊例直對比例1=散見5. 非抄写讹误一般不做勘误处理。例如:(四)质量指标经过多方面的努力,除了原文极少数的模糊字以及集中在小学类的极少数外字(这些外字的解决,有SO/IEC 10646- Part 2的制定和颁布) 之外,全书汉字的99.955%的都已经用编码汉字表示,并可进行检索。外字和模糊字数量为314,388字次,占全书4.49%;其中小学类174,202 字次,占全书2.49%;非小学类140,186字次,仅占全书2.00%。经过国家图书馆善本部专家抽测,文本的错误率

11、为:经部: 0.756%(抽检字量1,931,023)史部: 0.590% (抽检字量1,033,914)子部: 0.547%(抽检字量 657,172)集部: 0.100%(抽检字量 4,120,351)大大低於万分之一的国家标准。四库全书涉及的内容极为广泛,收录的文献典籍浩如烟海,其中许多字迹、字体繁杂不清,许多字形发生变异,难以辨认,这给录校工作带来 很大困难,我们组织了一支以专家学者为主的古汉语队伍,对四库全书中的疑难文字进行了分类甄别,在各部门及广大校录员共同努力下,终 於将这篇宏伟巨作-四库全书电子版奉献给世人。由於工程浩大,时间短,难免出现缺点、错误,敬请广大读者和专家批评指正,

12、以便以後再 版时修订。1. 原文真迹图像数据全文版的原文图像即标题版的图像,以景印文渊阁四库全书为底本,以电脑高速扫描,3以ODPI的图像方式储存。原文图像经过页 面切分,将一个影印页切分为两个原始页,以便在显示屏幕下能将单幅原始页清晰显示出来。四库全书原书存在诸如页码、书名、卷数等方面的错误。为保持原书面貌,我们在讹误处旁加入更正标志符。当您遇到此类标志时,需用光标 点击该标志,即可看到我们的更正。同时,我们还以(Y:)注明原书误写的卷次、页码,以便用户查找原文。例如,原书将 卷一百十六误写为 卷 一百六十六,我们改正为卷一百十六Y:卷一百六十六)。2. 书名数据 书名大致依照景印文渊阁四库

13、全书目录索引,个别书名按原书情况有所改动。各书名并按原书顺序排列。3. 着者数据全文版共收着者二千七百七十七人,着者详细资料包括着者姓名、字、号、号等,并在产品检索结果的显示栏内通过选择模式显示。1. 凡四库全书正文页有明确撰者名、着者名、补者名、考证者名、编辑者名的,悉数收入;正文页没有列出,而提要中明确提到的,亦均收入;提要中所给不确定者,均查阅其他相关资料予以确定并收入;提要注明不详,而且至今未有定论者,均注详;对无其 他资料可证的,均注为不着姓名;御制、御纂、御定、钦定、奉敕修纂、御览一类的图书,一般收总编纂官姓名,并於编修人名後括号内署官修字样。2. 对有着作的历代皇帝,为求统一着者姓名,凡原书用年号者一律改为皇帝本名,并以括号显示其双名,括号外的是皇帝的本名,括号 内则是皇帝的庙号或号。如:李世民(唐太宗)、朱元璋(明太祖); 康熙改为爱新觉罗玄烨(清圣祖)、 雍正改为爱新觉罗胤(清世 宗)、 乾隆改为爱新觉罗弘历(清高宗)等。3. 若着者为释氏,检索时释字加在法号前。4. 凡书名前所冠钦定、 御定、 御制、 御纂等字样,均予保留,如钦定八旗通志、御定康熙字典、御制满珠蒙古汉字三 合切音清文鉴。4.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号