浅析知识组织视野下档案知识库的构建思路.docx

上传人:aa****6 文档编号:51794087 上传时间:2018-08-16 格式:DOCX 页数:7 大小:16.90KB
返回 下载 相关 举报
浅析知识组织视野下档案知识库的构建思路.docx_第1页
第1页 / 共7页
浅析知识组织视野下档案知识库的构建思路.docx_第2页
第2页 / 共7页
浅析知识组织视野下档案知识库的构建思路.docx_第3页
第3页 / 共7页
浅析知识组织视野下档案知识库的构建思路.docx_第4页
第4页 / 共7页
浅析知识组织视野下档案知识库的构建思路.docx_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《浅析知识组织视野下档案知识库的构建思路.docx》由会员分享,可在线阅读,更多相关《浅析知识组织视野下档案知识库的构建思路.docx(7页珍藏版)》请在金锄头文库上搜索。

1、浅析知识组织视野下档案知识库的构建浅析知识组织视野下档案知识库的构建 思路思路档案知识点的分类及标引是在分析档案知识点内容属性及相关外表属性的基础上,按照定义好的类别将其分门别类,并用特定语言表达分析出的属性或特征。档案知识点的分类及标引针对的是用户所需的直接档案信息、知识,是对档案信息资源中知识点的发掘和形式上的组织,如可以从数字档案、档案全文数据库、档案目录数据库等档案客体提取用户所需的档案知识,经分类标引后直接服务于用户。对档案知识点进行分类与标引首先要对档案知识点进行采集,并进一步分析与检测其是否可用、重复及是否完整等。可用性检测主要侧重于分析数据本身是否有误或是否对用户问题的解决有用

2、;重复数据主要是指基本相同的数据,可能由于格式或拼写上的差异,导致档案信息管理系统无法区分;不完整数据主要指信息的缺失,如档案责任者、所属机构、度量单位等信息的缺失等。然后要对采集到的档案信息资源进行数据清洗,要选择合适的策略,筛选无用数据,合并同类信息,补充完善缺失信息,最终形成用户所需的待分类与标引的知识点集合。在对档案知识点进行分类和标引时,可以参照中国档案分类法 、 中国档案主题词表 、网络信息资源分类法等分类标引语言词典进行设计,建立成套的档案知识分类体系,形成分类明确、层次明晰、次序井然的分类标准。大数据时代档案知识点的标引可有效借助于计算机的自动标引,可采用关键词标引、概念标引、

3、语义标引、本体标引等方法来标示档案知识点,使其具备一定的主题和属性特征。经过档案知识点的分类与标引,用户所直接需要的、知识服务密度低的档案知识集合已经形成,可以作为档案知识库的基础部分,用以满足用户基本的档案信息与知识需求,但许多潜在的知识尚需进一步开发,进行更深层次的知识组织。2 关联档案知识点,聚类档案知识资源档案知识点的关联组织“是将档案知识及其相互联系等关系信息也有效地存储于数据库中。这就使得原本无序的档案知识变得易于控制且有序,让原本孤立的数据呈现出有机的联系” 。例如用户在查阅数字档案信息资源时,遇到不了解的人物、事件等时就会产生直接查阅相关文件的需要,通过档案知识关联,就可以将数

4、据库中的相应人物与事件等知识点与之关联,为用户提供更高效的服务。而档案知识资源的聚类组织则“是根据一定的规则将信息或知识按类聚集起来,分别给予相同的类别标记,并将类号赋予相关信息,存储于数据库中的过程、技术和方法” 。这就将原本分散的档案知识点按照一定的主题特征聚合在一起,使聚合在一起的档案知识点具备相同的关联或特征。经过档案知识点的分类与标引,档案知识点已经具备一定的主题与属性特征,这一层次的档案知识分别涵盖各种事件、基本概念、情景、方法、用户知识需求等知识点,可以满足用户低知识层面的需求,解决用户的一些较单一问题,可将其直接归入档案知识库中,用以解决用户单一、低知识密度的问题。而通过档案知

5、识点的关联组织和聚类组织,形成知识密度较高且横向关联的档案知识单元,如档案文摘、索引、题录等形式的档案知识产品,实现档案知识点的优化组合,档案知识密度大为提升,可以解决用户较复杂的问题,满足用户较高层次的档案知识需求。通过对档案知识单元进行挖掘、推理、语意关联等形式的知识组织,可以进一步增强档案知识单元的知识密度,满足用户更高层次的档案知识服务需求。档案知识单元的语意组织“是将信息及信息间的语义关系存储起来,构成具有语义关系的数据库。在检索和分析时,通过建立的语义关系,进行语义推理实现知识服务” 。档案知识单元的语义组织与关联将数据库中档案知识的原有记录、字段的关系上升到知识间的语义关系,保证

6、了档案知识间的关联与再生及隐性知识的呈现。这种语义关系非常丰富,例如档案中事件与事件间语义关系、人与人之间的亲属关系及隶属关系、不同主题间的语义关系等。通过档案知识单元的挖掘、推理、语意关联等知识组织,改变了原有档案知识单元间的显性联系,产生了新的关联与知识,形成档案综述、档案百科全书、档案年鉴、档案主题库等更高知识密度的档案知识资源,即档案知识簇,真正实现档案资源有序化,有序档案资源知识化,最终实现档案知识资源服务化。经过档案知识点的关联与聚类、档案知识单元的挖掘推理与语意关联而形成的档案知识簇已经具备很高的知识密度,可以存入档案知识库中,服务于用户高层次的档案知识需求。然而档案知识簇层面的

7、档案知识仍不是最高层次的知识实现,还可以通过知识挖掘与推理等实现档案知识的进一步升华,即档案知识的再生,这也是借助档案知识单元、知识关联、档案信息资源等,通过挖掘、推理、演绎、归纳等方法形成新的档案知识的过程。这一过程需要融合用户的需求及知识组织的背景,对用户需求及档案知识资源进行不同层次的细分、关联、挖掘与推理,运用统计分析、机器学习、神经网络等方法,分析出新颖、有效、潜在有用的规律等新知识。比如对用户查档新规律的归纳进而为用户提供智能化推荐服务,这里归纳出的新规律就是再生的档案知识。档案知识的再生过程也可以是从档案知识簇到档案知识点的逆向细化的过程,而在这一逆化过程的推理中也可能产生档案新

8、知识。档案“再生知识产生过程中遵循有效性、新颖性、潜在有用性以及最终可理解性原则” ,以保证新生的档案知识、规律、模型等对于新的数据仍有一定的适用性,对于用户问题的解决以及社会实践的发展仍然具有实际效用。通过知识分析、推理、挖掘等再生的新知识在形式、内容等方面可能存在一定的问题,需要对其进行检查修正,结合档案用户实际使用状况及反馈等情况适当调整新知识,按照标准的规则修正再生的档案新知识,然后直接放入档案知识库中服务于用户。经过知识组织形成档案知识库,接下来就是将其呈现并服务于用户,即构建档案知识服务层,这一层表现为档案知识服务平台。档案知识服务平台是连接用户与档案知识资源的门户,是档案信息资源

9、知识组织结果的呈现形式,包括用户数据采集分析系统、多功能检索系统和可视化呈现系统三个主要模块。首先是构建用户数据采集分析系统,该系统一方面用于采集分析用户的检索请求、反馈意见等,将其分析、推理为标准详细的知识检索语言,并将分析结果进行标记与存储;另一方面,该系统可以采集用户档案知识需求信息与使用行为信息,并将其传递于档案知识组织层,用于构建用户行为分析数据库。其次是构建多功能检索系统,包括知识点检索系统、知识单元检索系统、知识簇检索系统,分别对应用户不同知识密度的检索请求。知识点检索系统主要针对用户关于事件、概念、档案原件等较低知识密度问题的检索分析,知识单元检索系统主要适用于用户关于档案文摘

10、、档案题录、案卷分析等较高知识密度问题的检索分析,知识簇检索系统则主要适用于用户关于档案年鉴、档案主题库、档案综述、档案使用规律等更高知识密度问题的检索分析。经过数据采集分析系统处理的检索语言到达多功能检索系统后,该系统迅速将其推理匹配于相应检索层次,然后将检索分析结果传递于档案知识库,并在其中进行用户检索请求与目标资源的匹配,然后将检索结果以可视化的方式多元呈现于用户。最后是构建可视化呈现系统,分为检索结果的多元呈现、知识导航系统、知识地图服务等形式。经过档案知识库匹配符合用户需求的目标资源需要经过可视化呈现系统予以多元化呈现,包括文本、图片、知识脉络图、知识关联地图等丰富形式,还可为用户提

11、供相关档案知识、相似档案知识、相似需求查询等关联推荐服务,将丰富的检索内容人性化呈现于用户。对于档案知识需求模糊、档案知识水平不高的用户,可借助知识导航系统与知识地图服务检索所需的档案知识。 “档案知识导航系统是引导用户,使用检索工具、档案知识资源库等获取所需档案知识的服务系统。 ”而知识地图服务则可以“用可视化图形等格式告诉用户在哪里或怎么样可以找到所需的知识资源” 。通过档案知识服务平台,档案知识资源库中的知识资源得以更好地呈现于用户,有效地促进了档案知识资源服务化宗旨的真正实现。随着大数据趋势的日益深入,为解决档案信息服务平台的信息组织方式与人们日益增长的知识服务需求之间不相匹配的矛盾,需要对档案信息资源进行知识组织,构建档案知识库。通过档案知识库的构建,使得档案资源知识化,知识资源有序化,这就可以使用户避免在浩瀚的档案信息海洋中搜寻所需的档案信息,而是以档案知识的形式推送并呈现于用户面前,节省用户时间,提升服务效率,最终实现知识服务化的宗旨。杨力,姚乐也.数字档案馆知识组织层次体系探讨.档案学通讯,XX:5860.黄静.档案信息服务知识导航研究.南宁:广西民族大学,XX.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号