7_知识管理_rdf

上传人:千****8 文档编号:118604825 上传时间:2019-12-19 格式:PPT 页数:85 大小:1.57MB
返回 下载 相关 举报
7_知识管理_rdf_第1页
第1页 / 共85页
7_知识管理_rdf_第2页
第2页 / 共85页
7_知识管理_rdf_第3页
第3页 / 共85页
7_知识管理_rdf_第4页
第4页 / 共85页
7_知识管理_rdf_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《7_知识管理_rdf》由会员分享,可在线阅读,更多相关《7_知识管理_rdf(85页珍藏版)》请在金锄头文库上搜索。

1、1,知识管理 Knowledge Management,李海生 Li_haisheng,2,课程邮箱,btbukm PWD:12345678,3,与知识管理相关的Topic,信息检索 Information Retrieval 知识工程 Knowledge Engineering 语义网 Semantic Web 本体 Ontology 资源描述框架 Resource Description Framework 本体描述语言 Ontology Web Language 知识网格 Knowledge Grid 面向服务的架构 Service-Oriented Architecture 知识管理成

2、熟度模型 Knowledge Management Maturity Model (K3M) 知识管理案例 ,知识管理标准,知识管理标准 国家标准GB/T 23703.1 欧洲标准 澳大利亚国家标准 加拿大国家标准 英国国家标准 美国APQC标准(美国生产力与质量中心American Productivity and Quality Center),4,知识管理国家标准,框架 术语 组织文化 知识活动 实施指南 评价,5,知识管理业务流程 知识管理成熟度模型K3M 知识管理评估模型,6,7,上次课程内容回顾,元数据 召回率(Recall) 检索出的相关文档数和文档库中所有的相关文档数的比率 衡

3、量的是搜索引擎的查全率 精度(Precision) 检索出的相关文档数与检索出的文档总数的比率 衡量的是搜索引擎的查准率,8,语义Web,语义Web的基础架构Tim Berners-Lee,2000,语义网书籍推荐,9,语义网书籍推荐,10,11,元数据表示语言,标记语言 标准通用标记语言SGML 超文本标记语言HTML 可扩展标记语言XML 虚拟现实模型语言VRML 无线标记语言WML 元数据标准 Dublin Core HL7(描述医学网络资源的元数据 ) 教育资源元数据 机读目录(MARC),12,XML,性质 W3C于1998年2月发布的一种标准 是SGML的一个简化子集 可扩展标记语

4、言 特点 较好地解决了HTML无法表达数据内容等问题 允许各个组织、个人建立适合自己需要的标记集合,13,XML与HTML比较,文档的3个要素 数据、结构以及显示方式 HTML 显示方式内嵌在数据中 在创建文本时,要时时考虑输出格式 创建文档的重复工作量大 不易抽取语义信息 XML 显示格式从数据内容中独立出来,保存在样式单文件(Style Sheet)中 自我描述性质能够很好地表现许多复杂的数据关系,14,XML结构,文件头 与HTML类似,是可选的 文件主体 包括一个或多个元素 形式是一棵分级的树 混杂的“结尾部分” 由注释、处理指令和空白组成 注释用表示,可在文档中任意位置,15,元素(

5、Element),表示方法 由开始标记、结束标识以及标识之间的数据构成 标记之间的数据被认为是元素的值 每个元素都有不同的标记名 王力 元素名是director 元素值是“王力” 王力 元素名是actor 元素值是“王力”,16,元素要点,关键的3点 所有元素必须有结束标记 所有元素必须正确嵌套,不允许交迭 所有属性值必须加引号 注意点 XML文档主体有且仅有一个XML根元素 可以嵌套XML元素,形成一棵树形结构,17,XML文档例子, 数据结构 许卓群等 数据挖掘 韩家炜等 ,18,例子的树状结构,19,XML属性,给元素提供进一步的说明信息 必须出现在起始标记中 以名称/取值对出现,属性名

6、不能重复 名称与取值之间用等号“=”分隔 用引号把取值引起来 例如 100000 说明了工资的货币单位是人民币元,20,XML处理器,目的 解析XML文档 提供对XML文档内容和结构的访问 文档对象模型(Document Object Model,DOM) 将完整的XML转换成一棵树的形式放在内存中 供随机访问元素、属性 XML简单API(Simple API for XML,SAX) 采用事件驱动模型 通过标记的起止来触发事件 DOM与SAX的比较(讨论),21,处理指令(Processing Instruction),目的 给XML处理器提供信息,使其能够正确解释文档内容 表示 起始标记是

7、“” 方法 XML分析器把这些信息原封不动地传给应用程序 由应用程序来解释这个指令 遵照它所提供的信息进行处理,22,两种处理指令,XML声明 必须包括version属性,指明所采用的XML的版本号,而且它必须在属性列表中排在第一位 standalone属性表明该XML文档是否和一个外部文档类型定义DTD配套使用 encoding属性则指明了数据所采用的编码标准 XSL样式单引用 告诉XSL样式单解析器,样式单的类型是text-xsl 类型text-xsl可以在文档contacts.xsl中找到,23,XML的名字空间,背景 由于XML对互操作性的支持,每个人都可以创建属于自己的XML词汇 不

8、同的开发者会用相同的元素来代表不同的实体 作用 为XML文档元素提供了一个上下文 允许开发者按一定的语义来处理元素 为什么引入NS(命名空间) 讨论,24,XML NS 例子,?xml version=“1.0“? hamburgers xmlns:purchase=http:/fastfood.org/franchise/prices xmlns:sales=http:/fastfood.org/customer/prices hamburger lowfat=“dream on“ nameCowBurger/name descriptionGreasy and good./descript

9、ion purchase:price0.99/price sales:price2.99/price /hamburger /hamburgers,25,XSL(Extensible Stylesheet Language),背景 用标准的DOM API来实现XML数据的交互,是十分单调乏味的 如想找到所有满足某些条件的元素,或转换为简单的HTML表格,必须手工书写代码遍历整棵树来寻找 目的 为标准化及简化人们完成这些任务所需做的工作,26,食品的例子,XML文档 月饼 中秋节食用的传统食品 2.99 ,HTML文档 食品 月饼, 中秋节的传统 食品, 2元 ,27,XSL文件, 选取了当前结

10、点的所有食品子结点 hamburgers 标识出符合给定条件的结点 , , 取结点中各个元素的值 ,28,XSL用途,增强了互操作性 XML数据转换为HTML 从一种XML格式到另一种XML格式之间的转换 开发人员不用为了描述某种类型的数据而采用通用的词汇 某个人向你的系统发送了一篇XML文档,而你的系统不认识它所采用的XML词汇 只要进行一次简单的XSL转换就可以得到自己熟悉的词汇,29,文档类型定义 DTD,目的 定义XML文档结构,即其中的元素、属性以及元素之间关系的 定义了文件中的元素能用什么名字,能放在什么位置,应该怎样组合 可以检测XML文档的结构是否正确 例如描述一组,其中每个又

11、可以包含若干个 DTD中应该有语句: 生成的表 :管乐弦乐器乐,30,DTD 引用,内部引用 包含在XML文档的前导说明部分 如 文档体 外部引用 作为一个外部文档被引用 如 文档体 SYSTEM指一个作者或组织所编写的通用的DTD 或是 PUBLIC 指由权威机构制订的、提供给特定行业或公众使用的DTD,31,DTD中ETD(元素类型声明),作用 声明所有有效的文档元素 结构 类型 空元素类型 使用空元素标记,元素中没有内容 ANY元素类型 元素中可以包含任何内容 父元素类型 元素中可以包含子元素 在DTD中通过正则表达式规定子元素出现的顺序和次数 混合元素类型 元素中可以包含文本 文本之间

12、可以有选择地插入子元素,子元素出现的顺序和次数不受限制,32,XML Schema,DTD缺点 采用了非XML的语法规则 不支持数据类型 扩展性较差 XML模式己经渐有取代DTD的趋势 拥有比DTD更强大的功能 用于更精确和有效地描述XML文档结构,33,XML模式的优点,一致性 直接借助XML自身的特性 利用XML的基本语法规则 定义XML文档的结构 不必再利用一种特定的形式化的语言 扩展性 引入了数据类型、命名空间 在基本数据类型基础上用户可自己扩展数据类型 互换性 利用模式能够书写XML文档并验证文档的合法性 对不同的模式进行转换,以实现更高层次的数据交换 规范性 利用元素的内容和属性来

13、定义XML文档的整体结构 基于XML,更具有规范性,34,数据类型,用途 为Element Type和Attribute Type指定数据类型 基本数据类型 (10种) entity,entities,enumeration,id,idref,idrefs,nmtoken,nmtokens,notation和string 扩展数据类型 bin.baSe64,bin.heX,boolean,char,date,dateTime,dateTime.tz,fixed.14.4,float,int,number,timetime.tz,i1 ,i2, i4,r4, r8,ui1, ui2,ui4, u

14、ri,uuid,35,XMLS元素类型,基本格式 取值及含义 (略),36,XMLS属性类型,基本格式 取值及含义 (略),37,数据类型的使用例子(1),定义元素“名字”和“生日” 其中string和date类型都是Schema中自带的基本数据类型 minOccurs和maxOccurs是最少和最多出现次数的约束,这里表示有而且只出现一次,38,数据类型的使用例子(2),扩展数据类型 Schema中没有规定的类型,如“性别”类型 定义例子 注释 name属性是该数据类型的名称 数据类型由restriction子元素进行约束 该元素中的base属性是基类型,39,元数据自动抽取技术,预处理 剔

15、除在格式、内容、语言等方面存在问题或严重缺失的文档 产生格式相对规整的文本文档 提取元数据 由数字化文档元数据的规范定义,产生提取元数据的各种模式 依据元数据模式进行数字化文档的挖掘与匹配 利用与数字化文档相关的启发式规则和经验规则,有效提取元数据,40,MathML,含义 Mathematical Markup Language 用途 用来描述数学符号、纪录其结构和内容 目标 是在Web上实现能像HTML处理文本一样,处理数学问题,41,例:x2 + 4x + 4 =0,apply plus/ apply power/ cix/ci cn2/cn /apply apply times/ cn

16、4/cn cix/ci /apply cn4/cn /apply,42,SMIL,含义 Synchronized Multimedia Integration Language 用途 一种基于XML的表述多媒体演示的语言 将一组独立的多媒体对象整合为一个多媒体演示,43,SMIL例子,HTMLHEAD STYLE .time behavior:url(#default#time); /STYLE/HEAD BODY DIV CLASS=“time“ t:timeline=“seq“ P class=“time“ t:dur=“1“ This appears for one second and goes away /P P class=“time“ t:dur=“1“ This appears after one second, remains visible for o

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业信息化/信息管理

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号