基于知识元的多源竞争情报融合方法研究

资源描述

《基于知识元的多源竞争情报融合方法研究》由会员分享，可在线阅读，更多相关《基于知识元的多源竞争情报融合方法研究（14页珍藏版）》请在金锄头文库上搜索。

1、基于知识元的多源竞争情报融合方法研究孙琳王延章大连理工大学管理与经济学部大连大学经济管理学院摘要：目的/意义大数据时代, 企业迫切需要把握机遇, 积极探索从海量数据中发掘和利用竞争情报以支持商业决策。如何从多源数据中辨识极具商业价值的信息和发现隐性知识仍是竞争情报研究亟待解决的问题。其有赖于竞争情报的完备知识结构和高效的知识融合方法。方法/过程基于知识元模型、证据理论和相似度分析, 开展多源竞争情报融合方法研究:竞争情报以知识元形式从多个数据源中被抽取并统一表示;通过相似性分析和多属性融合计算, 整合竞争情报知识元的同时, 实现竞争情报知识框架的更新;进一步利用知识元的属性关系融

2、合实现隐性知识发现。结果/结论以融合跨领域知识的视角构建了基于知识元的多源竞争情报融合原型系统。针对某外卖平台在线评语的知识元构建与融合实例研究证明了该方法的可行性和有效性。关键词：竞争情报; 多属性融合; 知识元; 证据理论; 相似度分析; 作者简介：孙琳 (ORCID:0000-0002-9313-4723) , 女, 1980 年生, 博士研究生, 讲师, 研究方向:知识融合、竞争情报;作者简介：王延章 (ORCID:0000-0002-7016-9624) , 男, 1952 年生, 博士, 教授, 博士生导师, 研究方向:综合信息管理、决策支持系统理论与应用。收稿日期：2017-0

3、5-04基金：国家自然科学基金项目“大数据环境下知识融合与服务的方法及其在电子政务中的应用研究” (编号:71533001) 研究成果之一A Multi-Source Competitive Intelligence Fusion Method Based on Knowledge ElementSun Lin Wang Yanzhang School of Management Science and Engineering, Dalian University of Technology; Abstract： Purpose/SignificanceIn the big data era,

4、 enterprises are in urgent needs of seizing the opportunity to explore and utilize competitive intelligence to support business decisions from vast amounts of data. Howto identify the valuable business information and discover tacit knowledge from multi-source data is still a pressing problem for co

5、mpetitive intelligence research, which relies on a complete knowledge structure of competitive intelligence as well as efficient knowledge fusion methods.Method/ProcessBased on knowledge element model, evidence theory and similarity analysis, a multi-sources competitive intelligence fusion approach

6、is proposed which mainly includes: using knowledge element model to represent valuable competitive intelligence extracted from different sources; designing a fusion framework based on similarity to implement procedures of updating meta knowledge element and integrating instantial knowledge element o

7、f competitive intelligence; illustrating a multi-attribute fusion computing to utilize the knowledge discovered based on attribute-relation mining.Result/ConclusionA prototype fusion system based on knowledge element of multi-source competitive intelligence is built from the perspective of integrati

8、ng cross-domain knowledge. The experiment on knowledge element fusion of the on-line evaluation of a takeout platform verified the feasibility and efficiency of this study.Keyword： competitive intelligence; multi-attribute fusion; knowledge element; dempster-shafer theory; similarity analysis; Recei

9、ved： 2017-05-04大数据时代, 企业迫切需要把握机遇, 积极探索从海量数据中发掘和利用竞争情报以支持商业决策1。在大数据竞争情报研究领域, 围绕全领域情报2、多源情报以及情报数据的清洗、信息的集成、大数据分析技术3等竞争情报分析方法创新备受关注。然而, 如何从多源数据中辨识极具商业价值的信息和发现隐性知识仍是亟待解决的问题, 其有赖于竞争情报的完备知识结构和高效的融合方法。在竞争情报收集与分析活动中, 为了解决多源数据复杂多样的难题, 竞争情报统一知识框架的构建及其知识表示至关重要。知识元 (Knowledge element, KE) 是对客体建立完整知识描述的最小独立单元, 兼

10、具本体论和认知论的属性特点4。知识元作为知识发现和推理的基本元素, 还可以通过对其属性关系融合来揭示微观规律, 有助于隐性知识挖掘5-6。王延章7提出了基于名称集、属性集和关系集三元组形式的知识元模型。和其他知识表示方法相比, 其不仅在解释和挖掘跨学科知识方面具备独特优势, 而且克服了本体论对概念关系的显式描述困境。大数据环境下的竞争情报分析更加强调数据信息在整个链条中的基础与核心作用, 注重多源情报融合与清洗、信息分析与内容挖掘等流程8。知识融合被视为大数据环境下有效收集、组织和使用情报的卓有成效的方法9-10。近年来, 从大量分布式异构信息源中检索、抽取信息和知识的研究成果丰硕11。相较

11、于贝叶斯理论、神经网络等方法, 证据理论是一种不需要提供先验概率的不确定信息融合方法, 且即便仅有少量信息依然能够得到不确定性度量结果12-13。证据理论还被扩展用于进行多属性组合型证据的融合计算14。此外, 相似度分析也是广泛应用的信息融合方法, 特别是对比相似度模型15和扩展特征相似度模型的相关应用研究16得到了不断丰富。本文提出了一种应对大数据环境下辨识与分析复杂多样的竞争情报的知识融合方法。具有商业价值的竞争情报将被以知识元模型的形式从多个数据源中抽取出来并统一表示;通过相似性分析和多属性融合计算, 整合抽取的竞争情报知识元的同时, 实现竞争情报知识框架的更新与扩展;并利用竞争情报知识

12、元的属性关系融合作为发现隐性知识的基础。1 竞争情报的知识元表示1.1 知识元模型人类对世界的认知始于对事物属性的描述。从全息理论的视角看, 任何事物均能够透过对其属性的完整描述而被唯一识别。而万物之间的普遍联系本质上即是事物属性之间的直接或间接的关系。知识元是对客观事物或系统的主观抽象的模型的知识表示, 可以通过以下三元组来描述客观事物7。其中, N, A 和 R 分别表示对象的名称集、属性集和关系集。N 可以是定义某事物名称的一组主题词表 (若干同义词、近义词等) 。同理, 属性集 A 可以是由若干属性要素及其主题词表构成的二维矩阵。若aA, 则 A 可进一步描述为其中, n a为属性名称

13、集, p a为界定属性 a 状态的特征描述。若 pa=0, 则 a 不可描述;若 pa=1 时, 属性 a 可定性描述但不可测度, 此时 ua为属性状态描述的字符串集合;若 pa1, 属性 a 可测度, d a为测度量纲集, 且若 a 的状态值随时间变化是可辨识的, 则存在 at=fa (at-1, t) 。设 rR 为 AA 上的一个映射关系, r 具有映射属性描述 pr, 则关系 r 可描述为且有 r: 。其中, A r为输入属性状态集, A r为输出属性状态集, 存在映射函数知识元模型是对事物认知的共性知识表示, 它构建了一种跨领域和细粒度的知识载体, 为信息融合和知识发现提供了坚实的数

14、据基础和完备的知识结构。1.2 竞争情报元知识元基于知识元模型, 对竞争情报相关客体的认知均可建立细粒度性的形式化描述。若要表达对某一类客体各属性及其关系的共性描述和界定, 则需要分别进行 K, Ka和 Kr组若干要素的定义。这种对某类客观对象的知识元空间的描述也称之为元知识元的构建。竞争情报元知识元存储于相应的元知识元库中, 一方面基于此建立竞争情报的先验知识, 有助于进行有价值情报的识别和收集;另一方面, 经过辨识和抽取的竞争情报将以其对应的元知识元的知识体系存储。1.3 竞争情报实例知识元对竞争情报某一具体对象的知识表示过程, 就是将对应的竞争情报元知识元中的各要素进行内容描述或状态赋值

15、, 即竞争情报知识元的实例化, 或称为竞争情报实例知识元。也就是说, 实例知识元是将竞争情报相关客体按照所属元知识元 (也称为映射元) 的形式进行属性的定量化或定性化描述。由此, 从多源数据中收集竞争情报的过程, 即为基于先验知识辨识竞争情报, 完成实例知识元的抽取, 并存储于竞争情报实例知识元库中。2 多源竞争情报融合机制2.1 基于知识元的竞争情报融合框架统一的知识表示框架是从多样的竞争情报源中发现知识的基础。基于知识元的多源竞争情报融合过程如图 1 所示。经辨识从数据源中抽取出的竞争情报实例知识元, 首先进行预处理:通过信息融合 (第一次相似性分析) 去除噪音和冗余;再与竞争情报实例知识

16、元库中的知识元进行合并 (第二次相似性分析) , 剔除已收集的情报。进行竞争情报元知识元库的更新时, 需要将实例知识元的映射元与所匹配 (第三次相似度分析) 元知识元进行多属性融合计算。最后, 按照融合结果更新竞争情报元知识元结构, 并存储竞争情报实例知识元, 为后续的属性关系融合和知识发现提供了完备的知识基础。图 1 基于知识元的多源竞争情报融合框架下载原图2.2 竞争情报知识元库竞争情报知识元库包括两种类型, 竞争情报元知识元库和竞争情报实例知识元库, 分别存储着用以进行某类事物特征共性描述的元知识元和事物个体特征状态赋值描述的实例知识元。从数据源中辨识出的竞争情报需要被抽取并描述为实例知识元。经过两次相似度分析而合并后的实例知识元, 将生成映射元。限于认知的局限性和表达的差异性, 人们对事物的元知识元描述呈现出不完备性和不一致性。因此, 通过将映射元与数据库中的元知识元进行多属性融合, 实现元知识元体系的扩展和完善。

展开阅读全文