内容标签和关系标签相结合的汉语篇章标注

上传人:m**** 文档编号:568694637 上传时间:2024-07-26 格式:PPT 页数:15 大小:485.01KB
返回 下载 相关 举报
内容标签和关系标签相结合的汉语篇章标注_第1页
第1页 / 共15页
内容标签和关系标签相结合的汉语篇章标注_第2页
第2页 / 共15页
内容标签和关系标签相结合的汉语篇章标注_第3页
第3页 / 共15页
内容标签和关系标签相结合的汉语篇章标注_第4页
第4页 / 共15页
内容标签和关系标签相结合的汉语篇章标注_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《内容标签和关系标签相结合的汉语篇章标注》由会员分享,可在线阅读,更多相关《内容标签和关系标签相结合的汉语篇章标注(15页珍藏版)》请在金锄头文库上搜索。

1、内容标签和关系标签相结合的汉语篇章标注李素建,王荀 ,王宇昕北京大学计算语言学研究所 北京 100871lisujian,xunwang,本文的框架篇章标注及相关工作内容标签和结构标签相结合的标注规范标注样例和工具总结篇章关系篇章关系是指文本的组成部分之间的语义关联。一般只标注相邻部分之间的关系最小单位是句子、小句,也有使用短语的。树状结构或者图模型来描述标注结果篇章关系理论和语料库基于RST理论的RST-Discoures Treebank(Carlson等,2001)385篇Wall Street Journal文章PDTB-v2(Prasad等,2008)语义关系分为三层一百万字规模的W

2、all Street Journal文章FrameNetGraphbank中文语料库:乐明/娄开阳/李毅篇章关系理论和语料库RST-DT和GraphBank是将整个文本作为一个整体进行理解和标注PDTB和FrameNet主要用来描述文本片段。篇章关系标注的目的:不同层次的文本标注统一到一个框架更好地服务于自然语言处理任务的需要内容标签和关系标签相结合的篇章标注体系标注的基本原则分层的原则句-段-篇-章简单的原则关系标签内容标签异质的原则不同的层面使用不同的标签分层的原则篇:由关系比较单调和松散的章组成章:由一个或者几个意义段组成意义段:由意义段或者自然段组成自然段:由句子组成句子:由句内基本单

3、位组成每一层的单元彼此之间以及相邻的层次之间存在着关系,从而构成了整个篇章。简单的原则关系标签:两个相邻的成分之间的关系。内容标签:单个的成分本身的内容所具有的意义特征。内容标签的设计比较灵活,而关系标签的数目和种类则是比较固定。这样可以兼顾标签体系灵活性和稳定性的需要。关系标签是必须的,内容标签是可选的,内容标签可以是对关系标签的一个补充。异质的原则(关系标签)内容标签以医学文本为例病理病理数据数据预后预后防治防治病因病因死亡情况死亡情况症状症状病理解剖病理解剖预防预防定义定义诊断诊断病理生理病理生理治疗治疗诱因诱因体征体征检查检查临床表现临床表现分类分类描述描述功能功能篇章关系标注散文为例关系标签标注结果标注辅助工具总结在新闻语料和医学文本上进行了标注同时标注篇章的语义关系和重要内容内容和语义关系分开保证了标注体系的理论上完备性保证了重要信息可以被标识出来对文本整体和片段都有较强的描述能力。之后我们将对更多的文本进行标注,并在实际中不断完善这套体系。多谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号