知识元数据库及其基础平台建设

上传人:j****9 文档编号:54497183 上传时间:2018-09-14 格式:PPT 页数:19 大小:278KB
返回 下载 相关 举报
知识元数据库及其基础平台建设_第1页
第1页 / 共19页
知识元数据库及其基础平台建设_第2页
第2页 / 共19页
知识元数据库及其基础平台建设_第3页
第3页 / 共19页
知识元数据库及其基础平台建设_第4页
第4页 / 共19页
知识元数据库及其基础平台建设_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《知识元数据库及其基础平台建设》由会员分享,可在线阅读,更多相关《知识元数据库及其基础平台建设(19页珍藏版)》请在金锄头文库上搜索。

1、知识元数据库及其基础平台建设,穗志方 北京大学计算语言学研究所,973 课题“文本内容理解的数据基础”之子任务,内容,定位 研究目标及意义 知识元的概念 知识元提取的计算机辅助实现 已有的工作基础 服务示范,定位,综合语言知识库是北京大学计算语言所的主要方向; 其中: 现代汉语语法信息词典、现代汉语语义词典以及大规模词性标注语料库描述的是语言层面的知识; 中文概念词典CCD描述的是常识知识; 领域知识库针对各个学科领域,描述的是更加深入的专业知识 。,研究目标及意义,百科知识工程:基于百科全书,建立领域知识库; 中国大百科全书是我国第一部大型现代、综合性百科全书。 学科广泛 内容浩繁 可满足不

2、同层次用户的需求,研究目标及意义,如果能对百科全书进行合理的开发,把给人看的百科全书转变成计算机能够理解、能够操作的结构化百科全书,在此基础上就可以实现: 面向社会的全方位和多样化的知识服务 跨地区、跨学科之间的知识交流和共享 实现基于知识的计算机应用,支持各种类型的智能化信息处理。 服务于Semantic Web,研究目标及意义,从充分开发和利用百科全书资源的角度出发,利用自然语言处理技术和语言分析工具分析百科全书资源,发现其中隐含的知识点以及知识点之间的内在关联,将大量的、不断出现的知识点结构化地组织和关联起来,构成智能连接的网状图,建立实验性知识元数据库。,知识元的概念,以知识元为单位描

3、述领域知识,一个知识元代表当前领域内的一个基本概念; 通常的知识库采用上下位关系连接知识点,知识元数据库针对知识元进行多维关系的描述,除了上下位关系外,还包括当前领域内的其他基本概念关系。,知识元的概念,不同领域的知识,以及同一领域中不同类的知识,在描述时应该有不同的描述侧面/框架。,知识元的概念,医学领域:疾病类知识元的描述框架概念 症状(例如:鼻塞、流涕、咽痛、咳嗽、发热) 病理(例如:上呼吸道黏膜炎症) 病因(例如:鼻病毒、冠状病毒、腺病毒)检查 常规项目(尿常规、血糖、肾功能、心电图) 特殊检查(24小时动态血压监测、冠状动脉造影、放射性核素检查)处理 一般治疗(休息、饮水、清淡饮食

4、) 用药(例如:退热剂、镇静剂、滴鼻剂、止咳剂、抗菌药) 外科(例如:手术、介入治疗等) 护理发病情况 发病率(例如:高、低) 发病时间(例如:冬春季) 传染性(例如:高) 并发症 预后(例如:良好),知识元的概念,医学领域:药物类知识元的描述框架 药物组成 适应症 禁忌症 注意事项 副作用 医学领域知识元描述示例 Demo,知识元的概念,计算机硬件领域知识元的描述框架 属种 组成部件 功能 分类 应用领域 使用/用于 计算机硬件领域知识元描述示例 Demo,知识元描述的计算机辅助实现,扫描仪 (scanner)是一种将图象信息输入计算机的设备。它将大面积的图象分割成条或块,逐条或逐块依次扫描

5、,利用光电转换元件转换成数字信号并输入计算机。 扫描仪是80年代中期才出现的光机电一体化产品。它由扫描头、控制电路和机械部件等组成。扫描头由光源、光敏元件和光学镜头等组成。光源通常采用长条状白色发光二极管(LED)或冷阴极管,也有彩色扫描仪采用黄绿色发光二极管的。工作时照射到原稿(即扫描对象)上的光反射(或透射)到电荷耦合器件(CCD)上,电荷耦合器件本身是由许多单元组成的,因此在接收光信号时将连续的图象分解成分离的点(象素),同时将不同强弱的亮度信号变成幅度不同的电信号,再经过模数转换成为数字信号。扫描完一行后,控制电路和机械部件使扫描头或原稿移动一小段距离,继续扫描下一行。扫描得到的数字信

6、号以点阵的形式保存,再使用文件编辑软件将它编辑成标准格式的文本,存储在磁盘上,以便进一步处理。一幅300点?/in?(1?in=25.4?mm)的A4幅面的彩色图象,最后形成的文本大约是30MB。 扫描仪种类很多,可以按不同的标准来分类。按图象类型分有黑白、灰度和彩色扫描仪。按扫描对象幅面大小分可分为小幅面的手持式扫描仪、中等幅面的台式扫描仪和大幅面的工程图扫描仪。按扫描对象的材料分有扫描纸质材料的反射式扫描仪和扫描透明胶片材料的透射式扫描仪。按用途分除了通用的扫描仪外,还有专用的扫描仪,如卡片扫描仪、条码扫描仪等。 在计算机中应用扫描仪始于1984年,早期进展缓慢,近几年由于中央处理器运算速

7、度的提高,硬磁盘存储器容量的增大,扫描仪本身技术的进步以及配套软件的完善,使扫描仪得到广泛应用。现在扫描仪应用最多的领域是出版、印刷行业。使用扫描仪可以不用手工录入而直接整页输入计算机,不但可输入文字,还可输入图象、照片等,大大提高了工作效率。在办公自动化领域,扫描仪用于资料制作,资料管理,机械或其它工程图纸档案的管理等。此外,扫描仪还用于模式识别,如公安系统的指纹识别等。计算机科学技术百科全书,知识元描述的计算机辅助实现,内科学 第六章 高血压 第一节 原发性高血压 病因原发性高血压的病因为多因素,可分为遗传和环境两个方面。高血压是遗传易感性和环境因素相互作用的结果。一般认为在比例上,遗传因

8、素约占40%,环境因素约占60%。 一、遗传因素 二、环境因素 (一)饮食 (二)精神应激 三、其他因素 (一)体重 (二)阻塞性睡眠呼吸暂停综合症 临床表现及并发症 一、症状 常见症状有头晕、头痛、颈项板紧、疲劳、心悸等, 也可出现视力模糊、鼻出血等较重症状,知识元描述的计算机辅助实现,受限文本,格式较规范 模式匹配 机器学习 术语提取 术语之间概念关系的自动提取 信息提取技术 NLP技术,知识元数据库编辑平台,已有的工作基础,术语自动提取软件(包括人机交互的编辑功能),已有的工作基础,IT领域术语库、语料库 计算机硬件领域知识库原型,服务示范,面向社会的医学知识咨询系统 智能问答式电子百科全书 智能搜索 ,Thanks!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号