资源信息微积分

上传人:l****6 文档编号:38678013 上传时间:2018-05-05 格式:DOC 页数:5 大小:32.50KB
返回 下载 相关 举报
资源信息微积分_第1页
第1页 / 共5页
资源信息微积分_第2页
第2页 / 共5页
资源信息微积分_第3页
第3页 / 共5页
资源信息微积分_第4页
第4页 / 共5页
资源信息微积分_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《资源信息微积分》由会员分享,可在线阅读,更多相关《资源信息微积分(5页珍藏版)》请在金锄头文库上搜索。

1、1资源信息微积分1 引子起初,神创造天地神说:“要有光”,就有了光。神看光是好的,就把光暗分开了。神称光为昼,称暗为夜。有晚上,有早晨,这是第一日。 引自圣经创世纪有了光,世界显得五彩缤纷。同样,知识发现需要光的照明;需要有能发光又能感光的全息摄像设备以及资源信息的传播渠道。那么,什么是资源?国际普遍认为它是指 anything(世界的万物)。诚然,信息本身也是一种资源,称为信息资源。信息资源用来描述资源信息,资源信息又充实了信息资源。信息资源和资源信息两者通过“廻环”的修辞,极准确地说明了信息和资源辩证结合、相依相成的关系。若用 y 表示资源信息,用 x 表示信息资源,则两者的关系可用准函数

2、 f 表示。如同我们可用指数求幂也可用幂求指数(对数)一样,资源信息和信息资源的辩证关系也反应了它们之间的准函数(f)和准反函数关系。从本休论(ontology)看来,哲学的辩证、修辞的廻环和数学的函数求反具有本质的一致性。我们可以通过信息发现资源,也可以通过资源去描述信息。用本体论的话说,也就是可用 x 求 y(f),可用 y求 x。f 和是一个关系的两个指向。所谓信息准微积分就是应用数值微积分的原理对资源信息进行微观描述和宏观整合,使其产生光的效应。信息(Information)一詞的詞干“formation”含有“结构”之意。信息之所以为信息就是因为它能以某种数据(不同于数字)结构为载体

3、进行传媒,离开数据结构信息也就不成其为信息了,而f 正是这种数据结构的具体表达形式,它建立了数据的联系。2 正和反逻辑函数传统的书目已经开始不自觉应用了 f 和之间的知识发现互动原理。所谓的文献著2录(标引),其实质就是用资源去描述信息,所谓检索就是利用数据的逆结构(反准函数)去寻求资源(索引),标引和反标引(索引)生动地反映了知识发现中潜在的 f和互动事实,f 在其中表示为某一字段元素,x 和 y 都是资源,它们互为元数据,x、y 方程组构成了一条款目的完整信息,而款目的集合就是数据库。无论是印刷型的还是电子型的,其本质是完全一致的。以下是一个简单的书目款目 A 文摘号 001ISBN 号

4、7-5323-5116-5题名 化石漫谈作者 夏树芳出版发行 上海科技出版社载体形态 32 开分类 Q911主题 化石摘要 A 在其中表示为某一资源的 m 维向量,该向量由 m 个元素(element)或字段组成,这样一个动态数据库的款目就可记为,数据库就可记为。e 变量名反映了数据(书)和元数据(夏树芳等)之间的准函数(逻辑)关系。标引或著录就是用元素名表示资源间的准函数关系,反标引(逆向著录)同样用元素名表示资源间的准反函数关系。既然资源代表 anything,那么元数据也属于 anything,同样可以对它标引建立一个款目 B。具体说来数据库文件的正文就是用元数据标引资源,而数据库文件的

5、索引就是用资源标引元数据。例如本例的作者反标引可记成款目 B: 夏树芳(作者名)元数据文摘号(元素名) 001(元素值)3B 款目的集合(数据库)则可记为其中元素(文摘号)的值就是元数据 001,通过它指向资源(书),并可通过该书的标引了解它的全貌。如同我们可以用逻辑地址去映射物理地址,用逻辑主语去映射实际主语,我们同样可以用本体论研究知识发现的方法,把元素称为资源的逻辑函数。利用这样的逻辑函数关系我们就能知晓某书是誰写的,而某人又写了哪些书。这种函数的映射建立了资源之间的对应关系。元素成了资源间的“血缘”。有了它,A 和 B 保持了父子关系,而 D 和 I 就有了源和目标的关系。这里我们把

6、A 定义为父款目,把 B 定义为子款目。把 D 定义为源数据库,把 I 定义为源数据库扩展(索引)。其关系如下图所示:3 资源信息微积分微积分的基本思想方法就是化整为零,聚零为整,通过对研究对象的无限细分来达到无限逼近的目标。资源信息微积分和数值微积分在方法论上如出一辙,大资源可以化为小资源更细致地描述。早期的分析著录和综合著录已经孕育了这一基本思想,而近年 RDF(Resource Description Framework 资源描述框架)的出现为资源描述提供了无限细分机制,从而为语义网的开发找到了有效的工具。任何资源信息从本体论看来,无非是由外延和内涵构成的反映事物存在状态的一种代码组合形

7、式。这种现象在早期应用中屡见不鲜,只是并不自觉而已。在图书馆界大谈特谈的分类索引语言和主题索引语言,提升一步说,不就是概念的外延和内涵吗?分类表示事物的类别概念,难道不也是主题吗?其实分类是一种特殊的主题(即分类主题),而主题则是分类中的一个实例(Instance)。在资源描述的过程中,分类的职能是“分”,而主题的职能是“赋值”,有了分类大资源可化为小资源,有了主题就可对小资源进行内涵“计算”(描述)。经过这样的剖析透视,隐藏在知识发现背4后大量微积分事实便可窥一斑而见全豹。因此,既然分类和主题关系的本质是外延和内涵的关系,分类和主题只是表达外延和内涵的一种语言,我们就可以利用外延和内涵的关系

8、揭示资源信息描述的本质所在。如图所示:M 表示内涵(Meaning);E 表示外延(Extension);e 表示由分类表达的小资源,而以元素名来表示它的具体类别;S 表示小资源的主题(Subject),即元数据(Metadata),它是元素 e 的值;曲线 C(e)表示外延和内涵的概念(Concept)关系,由于它表达的只是一种逻辑的外延和内涵,并非数值关系,这里不妨把它称之为“隐函数”以此说明隐在其中的是信息和概念而并不存在可以明显表示的数值:e 和 m 作为变量代表具体的外延和内涵,作为函数代表主题之间的外延和内涵关系;R 表示资源(Resource)信息,其“值”即为 S 的准积分或逻

9、辑意义上的积分;显然 S 就是 R 的微分。这样,即可建立一个资源信息的逻辑微积分数学模型:这些本不相干的元数据也可在另一概念空间中统一为单变量(内涵)。资源信息变量的坐标变换和空间映射使复杂的信息关系简化为简单的信息关系而又不因此抛弃它的本质。通过 E和 M 我们窥见到了信息所表达的“哭”、 “笑”面部表情(物质的存在状态)。为了研究探索事物的本质,我们经常改变视角,有时把父对象分为子对象,如子款目、子字段等,有时又把子对象聚在一起研究。在这里我们再次应用了这一思想,把资源信息从微观空间(子信息空间)移到了宏观空间(父信息空间),成功地表述了资源信息的微积分原理,从而使我们有可能通过这一理论

10、创新去克服知识发现的障碍。 4 语义网解读4.1 有形和无形有形分割是一种资源的物理分割,无形分割是一种概念分割。有形分割在几何(物理)空间中进行;无形分割则在概念空间中进行。资源描述的微分始于几何空5间。这种微分只是物理实体的结构分解,例如把文献逐层分解为书、刊、章、节、单册等,然而分别形成目录,题录,文摘等二次文献。分明分割的对象是资源的客观知识单元的物理实体。这种分割的优点是直观(有形),缺点是有限,难以在信息空间中扩展(微分)。然而,它必竟为以后的资源信息微分作了必要的前期准备。由于有形分割的空间束缚,人们梦寐以求跨越时空(泛空间)的信息传递目标即便在硬件(网络)支持下也难以实现,其瓶

11、颈制约是因为缺少一座在思维空间和信息空间的“推理”桥梁。所幸,人们从以上资源信息的逻辑函数求反中再次得到了启迪,从而摆脱了信息资源开发利用的根本理论困境。知识发现本身就是知识描述的求反,如果说其初级形式是“检索”,那么它的高级形式无疑就是“思维”了。信息的传播需要有形和无形的互动,实中有虚,虚中有实,虚虚实实才行,要善于在有形中观察描述,在无形中思索,这就是有形和无形,描述和检索,观察和思考的求反过程。离开有形,信息便会魂不附体;离开无形,网络就成行尸走肉。语义网的有形单元是网页,而无形单元就是附于其中的语义和概念。语义网络需要一座链接概念和网页的桥梁。完成网页链接至概念链接质的飞跃。4.2

12、资源信息微观演变资源信息的描述坐标已经发生了很大变化。从具体坐标发展到抽象坐标。以下列出几个坐标体系的比较: AACRII MARC RDF ontology描述对象 文献资源 文献资源 资源 语义传输平台 纸质 电脑 网络 网络语言 自然 数据库 XML OWL 等元素 著录项 字段 标记 标记6实际上,Ontology 是 RDF 在语义领域的应用和发展。它把概念作为特殊的资源对象对待。如果说后者是基于资源的描述框架。那么前者就是基于概念的描述框架。描述的坐标已经发生了从资源到概念(内涵和外延)的转变,知识发现的对象已经发生了从宏观到微观,从具体到抽象,从有形到无形的变化。RDF 提供了资

13、源拆分的技术而 Ontology 侧重于语义的分析,两者的完美的结合为我们架起了一座从宏观资源实体通向微观知识描述的桥梁。Ontology 的技术关键就是要刨根问底地弄清楚知识树“怎么种?根在哪?施什么肥?”。简言之,就是用什么去表达?怎样表达?表达什么的问题。4.3 语义“磁针”尽管从 AACRII(Anglo-American Cataloguing Rules.2.ed 英美编目条例)到Ontology,知识发现的对象发生了从宏观到微观的变化,但对象间的抽象关系即元素仍然不变,只是具体名称有所不同。在 AACRII 中元素用著录事项表示,它把书和其他资源联结起来;在 Ontology 中

14、,随着资源对象的微观化,资源关系进一步抽象为概念(Concept),而资源被抽象为外延 E 和内涵 M。由此看出元素是各种资源的粘合剂,和普通粘合剂的区别在于它犹如磁针带有极性和方向性,极性又可具体化为:外延和内涵。由此可见语义磁针是对元素功能的形象化描述。然而语义磁针不是天然物质,它需要人工导入,在导入过程中首先要对它的内涵外延进行定义使其具有明确的指向(磁极)。RDF Schema(RDF 的数据结构模式)担负了这一使命,它的结构化核心词汇(Structured Core Vocabulary)分别用 Classes 和Properties 来定义 RDF 数据文件所用元素的资源类型(外延

15、)以及所具有的特性(内涵),确定了各元素的描述职能范围,从而为构建语义磁场打好了“地基”。以下是语义磁场各层面的简单示意:7有了语义磁针(元素),信息的传播就有了“光”。其具体极性就可抽象为和,数字化为 0 和 1 二态。磁针通过彼此联结便形成“磁力线”,有了“磁力线”便能产生磁力场,产生磁感应,变离散描述为连续描述,这便是语义场的抽象化。在语义场中,语义的正负两极切换便能形成振动,振动在语义场中的传播就会产生语义波,但这种传播并不是直线的。其方向取决于语义磁针的连线轨迹,这种轨迹就是我们通常说的“思路”,人工智能就是要让电脑来产生“思路”。由于资源信息的描述方式不外乎以下几种:(1)串联 (

16、2)并联 (3)循环(互逆) (4)嵌套 (5)递归,对应的检索途经(思维)只是上述路径的逆。人工智能技术说到底就是上述路径的程序化。5 结语资源信息通过微分对资源分解在资源描述的不同层面创建和导入各种“磁针”,按照逻辑推理制定的布放规则,建立资源和语义在不同坐标平面间的穿梭映射;通过积分对它整合产生综合的“磁场”效应,形成语义场。资源信息微积分在语义场的点上表现是“振动”,面上表现是语义波。振动是对波的微分,而波是对振动的积分,积分是对微分的还原。架设语义网,首先需要对资源信息进行微积分运算。不能微分就无法在语义场中形成语义“磁针”,没有“磁针”就没有振动,当然也就不会产生语义波。资源信息的微观振动(即描述和标引)是借助于概念的二态(内涵和外延)切换产生的。概念的二个方面,也就是内涵和外延,组成了语义磁针的正负两极。MARC 开创了数据电脑处理的先河,并能利用分散著录的上挂(410 字

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号