企业关联数据应用模式与案例综析

上传人:小** 文档编号:54306134 上传时间:2018-09-10 格式:DOC 页数:7 大小:32KB
返回 下载 相关 举报
企业关联数据应用模式与案例综析_第1页
第1页 / 共7页
企业关联数据应用模式与案例综析_第2页
第2页 / 共7页
企业关联数据应用模式与案例综析_第3页
第3页 / 共7页
企业关联数据应用模式与案例综析_第4页
第4页 / 共7页
企业关联数据应用模式与案例综析_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《企业关联数据应用模式与案例综析》由会员分享,可在线阅读,更多相关《企业关联数据应用模式与案例综析(7页珍藏版)》请在金锄头文库上搜索。

1、 企业关联数据应用模式与案例综析 8700 字 摘 要:Tim Berners-Lee 提出的关联数据概念目前是图书馆学、情报 学、计算机科学、信息管理和信息系统等学科的研究热点。关联数 据作为语义的一种实现方式,正在引领一场络革命,它不仅使许多 新应用付诸实践,也为一些特殊领域的应用提供了契机。论文分析 了关联数据技术的背景和现状以及企业应用关联数据的原因、意义 和模式,根据关联数据的层次模型以及基于关联数据的企业信息资 源集成的目标取向和功能配置构建了企业关联数据应用模型,在逻 辑上将其分为支撑环境层、信息资源层、信息处理层和应用层,并 结合 Google、BBC 和 Renault 三大

2、公司的应用案例探讨了企业如何 利用关联数据技术创新盈利模式、改善效益,为关联数据在企业的 应用提供了参照。关键词:关联数据 语义 企业 应用模式1 概述关联数据作为发布数据的途径之一,可以视为语义的一种实 现方式。它采用 RDF 数据模型,利用 URI 命名数据实体,来发布 和部署实例数据和类数据,从而实现数据的相互关联和易于人机理 解,并可通过 HTTP 协议揭示和获取数据1。关联数据络不仅使许 多新应用付诸实践2,也为一些特殊领域的应用提供了新的契机3。关联数据络可以视为一个与传统的文件络紧密交织并有许多 相同属性的附加层,它包含了各种类型的数据,允许任何人发布数 据,对数据表达词表的选择

3、没有限制;此外,实体通过 RDF 链接相 连,因而全球数据资源得以广泛相连,新的数据资源也能够及时被 发现。开放数据项目(Linking Open Data, LOD)是关联数据应用的 典型案例之一。2007 年 1 月,LOD 项目由民间发起并获得了 obile,面向大学师生的基于络的资源列表管理应用 Talis Aspire 等等;数 据整合平台 DERI Pipes 使得数据源能够相互沟通从而形成新的数据; BBC 公司内部则使用关联数据作为一项轻量级数据集成技术,本文 将选取部分具有代表性的案例进行详细讨论。2 企业应用关联数据的意义企业界广泛采用电子信息系统已经有 30 多年历史。随

4、着各 企业全面实施企业资源计划(ERP)、供应链管理(SCM)、客户关系管 理(CRM)和电子商务(EC)等管理信息系统,整合各系统内部及系统 之间数据的访问势在必行。关联数据为这一问题提供了答案,它通 过整合所有数据的访问,降低生产运营成本,提高企业现代化管理 和科学决策的效率和水平,提升企业核心竞争力,创造经济效益。首先,关联数据可有效实现企业信息资源整合。企业将 RDF 模型应用于非结构化、半结构化和结构化的数据与内容,可以 消除企业内部数据相互分隔的弊端。基于 RDF,企业可以通过关联 数据描述信息资源,从而串联起非结构化、半结构化和结构化的数 据与内容,如图 1 所示。此外,通过使用

5、关联数据以及建立在各个 数据库中数据集的链接,使得企业各数据库可以相互链接,从而实 现数据库的整合,如图 2 所示。当企业、行业、开放式订阅系统和 开放数据都使用相同的命名规则和术语等,关联数据即可以方便快 捷地将其链接,有效地整合内部和外部数据。企业在生产经营过程中,产生了大量自主、异构和分布的数 据,包括各种数据库、文件、电子文档和络资源等,这些数据不仅 存在语义异构的问题,而且缺乏统一规划和标准;由于数据零散分布, 企业也难以有效筛选和过滤出所需的特定信息。对于这些遗留模式 的数据而言,关联数据可实现完全的模型化;因为 RDF 使用标准的 数据模型,用户无需学习特殊语法即可直接操作数据,

6、因此现有模 式几乎完全可重复利用并且易于拓展、更新和变更。企业无需因为 商业模式的改变、并购或其它原因而重构遗留的数据模式,通过关 联数据,可以将遗留数据和现有数据进行语义链接,从而实现了非 重构环境下的数据使用,如图 3,通过使用已有的数据库管理程序 和设施,企业还可以实现内部关联数据存储。此外,企业还可利用关联数据创建报表模板及实施数据检索, 节省人工操作,降低生产经营成本和风险;数据访问、分析和操作并 推送到用户层,为企业决策提供科学依据,提高企业现代化管理水 平,改善效益。3 企业关联数据应用模式企业数据处理的主要目的就是通过对企业数据的观察、分析、 传送或进一步处理,推导出对企业有价

7、值的信息,为行动和决策提供依据;通过保存和管理经过处理的企业数据,方便而充分地利用宝 贵的信息资源产生利润。 传统的企业数据处理主要是事务性的, 数据类型主要是结构化的,不同的信息系统采用的数据格式往往也 不一样(即异构数据)。这不仅为企业用户、系统分析人员、系统设 计人员和编程人员之间交流增加了困难,而且当需求发生变化、增 加新的需求或者采用新的信息系统后,原有数据(即遗留数据)就需 要转换。这些情况下,常常需要对系统作大量的修改,结果往往是 一再返工,甚至推倒重来,不断增加投资,浪费时间,用户意见大。 关联数据为企业提供了一种全新的模式,它对于企业数据处理的各 个步骤都提供了极大的便利,包

8、括数据的收集、转换、筛选、组织、 运算、存储、检索和输出等等。关联数据技术可以整合企业所有的 数据:包括内部和外部数据,当前数据和遗留数据,结构化、半结 构化和非结构化的数据;并可随着商业模式的改变或信息系统的升级 进行灵活的改变或更新,具有很强的适应性。关联数据的出现无疑 为数据处理的三大难题给出了最佳答案,即数据的存储形式、利于 数据存取的数据结构以及数据检索的方法。此外,利用关联数据技 术还可促进企业之间的数据交换、共享和开放。根据关联数据的层次模型8以及基于关联数据的企业信息 资源集成的目标取向和功能配置9,可以构建企业关联数据应用模 型,在逻辑上可分为 4 层结构,自下而上分别为支撑

9、环境层、信息 资源层、信息处理层和应用层,如图 4。3.1 支持环境层支撑环境是企业关联数据应用模型存在与运行的基础,可以 分为硬件支撑环境和软件支撑环境。硬件方面主要包括企业存储设 施、服务器、络等基础设施架构;软件方面主要包括技术支撑,例如 数据库技术、语义技术、络技术、人工智能技术和信息检索技术等, 以及企业经营管理机制和社会政治、经济环境等。3.2 信息资源层该层为资源集成处理层提供丰富的数据源,可分为内部信息 源和外部信息源。企业内部信息源包括企业内部各部门的管理信息系统和内部 络信息等,它们可提供信息系统运行数据、业务数据、供应商数据、 客户数据等信息资源。外部信息源包括关联数据开

10、放项目(LOD)、大众媒体、会议信息、关联数据搜索引擎等。信息收集则采用人工 和自动相结合的方式进行,一方面利用信息检索法、问卷调查法等 方式人工获取信息资源,另一方面则由企业管理信息系统等自动记 录和生成。3.3 信息处理层该层通过分析企业信息资源内部的特定关联,并利用 HTTP 和 RDF 的关联数据描述方式来加以表达,对企业信息资源进行挖掘、 重组和集成。通过抽取、标识、RDF 发布,将 RDF 格式的信息资源 生成 RDF 链接,应用手动或自动链接的方式实现不同资源之间的语 义关联,从而构建起企业异构和分布信息资源之间的语义链接,并 将经过处理后的企业信息资源用于界面管理、信息传递、功

11、能整合、 业务集成等具体应用中。3.4 应用层该层能根据用户需求提供多样化的关联数据应用,提供丰富 的浏览途径以及信息资源检索、调用和集成功能。用户或应用程序 可通过统一的入口无缝访问到集成后的各种关联数据,获取 SPARQL、关联数据浏览等建立在关联数据技术上的应用。4 企业关联数据应用案例4.1 Google直到 2007 年,Google 还无法搜索 Flash 中包含的非文本信 息和其它富媒体中隐含的信息。随着大数据时代的降临,络信息数 据膨胀变大之迅猛,尤其是其中海量的多媒体信息资源呈指数级增 长,对 Google 提出了严峻的挑战。2009 年 9 月,Google 正式支持使用

12、Facebook Share 和 Yahoo! SearchMonkey 的 RDFa 标记视频内容。站管理员可以在 HTML 中嵌入视频的描述信息,Google 则将这些信息显示于搜索结 果页面,这可以说是 Google 在关联数据上的一次突破。当年 11 月, Google 支持并开放了两种用于标记结构化数据的开放标准-微格式 和 RDFa,并首先应用于搜索结果的摘要,从而在搜索结果中为用 户提供更多详情,帮助他们了解页的价值。如果用户得到更多信息, 从中看出页搜索结果与其搜索请求之间的相关程度,他们就更有可能通过点击查看完整页面。这种结构化数据也可供用户站中的自定 义搜索引擎使用,使其能

13、够显著加强用户对自定义搜索引擎行为的 控制力度。在面临挑战的两年内,Google 正式支持使用 Facebook Share 和 Yahoo! SearchMonkey 的 RDFa 标记的视频内容,成功地运用关 联数据技术迎接挑战并提高了搜索质量。目前,Google 可以接受微 数据、微格式和 RDFa 三种标记格式,并支持对评价、人物、商品、 商家和组织、食谱、活动和音乐等内容类型进行页摘要的丰富,还 可接受视频内容标记并可用于改进搜索结果。关联数据在 Google 的 成功运用为未来搜索引擎的发展指明了一个方向,即搜索不仅仅局 限于简单的文本信息,更包括了海量丰富的多媒体信息,搜索引擎

14、就是在不断满足用户需求中实现变革和发展,从而变得越来越智能 化和人性化。4.2 BBCBBC 公司(The British Broadcasting Corporation,BBC)内部使 用关联数据作为一项轻量级的数据集成技术。该公司是世界上最大 的广播电视公司之一,运营着大量电台和电视频道,传统情况下, 这些电台电视分别使用不同的内容管理系统(CMS)。然而近年来, BBC 公司已开始使用关联数据技术并使用 DBpedia 和 MusicBrainz 作为控制词表,从而将位于不同地点的相同主题相互链接,并且利 用公开数据链接云(Linking Open Data cloud)中的其它数据扩

15、充内容。 基于这些链接,BBC 为其所有的音乐和节目建立了关联数据站点10。BBC 的项目支持、音乐挖掘以及自然史内容等都都可被逆 向引用至 HTML、RDF、JSON 等,从而获取节目、艺术家、种类 和产地的同一 HTTP URI,并使用概念自有的 URI 而不是编造新的 URI。此外,BBC 电台的大部分音乐都通过一个名为 VCS 的系统播 放-其实质是一个企业规模的 MP3 播放器。它不仅将音乐插入广播 链中,还在内部发布正在播放的音乐的数据。音乐挖掘小组将资源 和档案相链接,将音轨和目录数据以及 MusicBrainz 音乐家 ID 相链 接,并将所得数据插入节目中从而使单个节目可以提

16、供艺术家的演 出数据。BBC 发布的音乐测试版站是 BBC 音乐在线和整个 bbc.co.uk 数据结构的一次巨大改进。BBC 不仅使用关联数据实现了 系统之间基于目标的数据资源集成,还致力于资源公开。为了便于 用户使用 BBC 数据,BBC 将所有的音乐测试版页做成了XML、YAML、JSON 和 RDF 版11,用户不仅可以通过页间的链 接从音乐链至节目,还可以从节目页面上的专辑曲目反向链接至音 乐。BBC 认为关联数据技术使其站和数据的可用性大大增强,用户 体验得到巨大提升,搜索引擎的查询效果得到优化,资源的可查找 性、可点击性和可传播性都得到极大提高。124.3 RenaultRenault 是世界十大汽车公司之一,关联数据为阻 碍其 IS 结构的两大难题-数据存储和服务-提供了有效的解决方案; 并提供了一个易于启动和链接的 REST 服务结构。Renault 将关联数 据原则付诸实践并促进了语义技术在公司内部的应用,包括将数据 仓储作为关联数据发布、实施了一个简单的 RDF 浏览器、从外部应 用访问已发布数据的样品并研究了关联数据

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号