{求职简历模板}毕业设计答辩面向教师简历的关系抽取

上传人:精****库 文档编号:140062879 上传时间:2020-07-26 格式:PPTX 页数:20 大小:1.20MB
返回 下载 相关 举报
{求职简历模板}毕业设计答辩面向教师简历的关系抽取_第1页
第1页 / 共20页
{求职简历模板}毕业设计答辩面向教师简历的关系抽取_第2页
第2页 / 共20页
{求职简历模板}毕业设计答辩面向教师简历的关系抽取_第3页
第3页 / 共20页
{求职简历模板}毕业设计答辩面向教师简历的关系抽取_第4页
第4页 / 共20页
{求职简历模板}毕业设计答辩面向教师简历的关系抽取_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《{求职简历模板}毕业设计答辩面向教师简历的关系抽取》由会员分享,可在线阅读,更多相关《{求职简历模板}毕业设计答辩面向教师简历的关系抽取(20页珍藏版)》请在金锄头文库上搜索。

1、毕业设计答辩,题目:面向教师简历的关系抽取,1/20,提纲,课题介绍 系统总体介绍 关键技术 实验结果分析与改进,2,提纲,课题介绍 系统总体介绍 关键技术 实验结果分析与改进,3,课题介绍,传统关系抽取方法 有指导关系抽取 核方法 无指导关系抽取 序列模式学习算法 面向教师简历关系抽取 没有标注语料(无法采用机器学习方法) 引入搜索引擎机制,4,课题介绍,教师简历的实体类型:,5,课题介绍,本课题定义了7种教师简历实体关系:,6,提纲,课题介绍 系统总体介绍 关键技术 实验结果分析与改进,7,系统总体介绍,8,提纲,课题介绍 系统总体介绍 关键技术 实验结果分析与改进,9,关键技术,教师简历

2、实体识别模块 基于动态词典的实体识别 技术:双数组Trie树 姓名、院系、职称、职务、性别、学位、学科 基于模板的实体识别 技术:正则表达式 电子邮箱: bA-Z0-9._%-+A-Z0-9.-+.A-Z2,4b,10,关键技术,特征提取 实体类型特征 选出有可能构成目标关系的候选实体对 实体距离特征 计算出候选实体对在一篇文档中的距离 实体共现概率特征 计算出候选实体对在语料中共同出现的概率 互信息模型,11,关键技术,搜索引擎的引入,12,关键技术,插件机制,13,关键技术,教师简历关系数据库,14,提纲,课题介绍 系统总体介绍 关键技术 实验结果分析与改进,15,实验结果分析与改进,人工标注200篇HTML文档作为测试集 处理6类教师简历实体关系 “姓名电子邮箱” “姓名性别” “姓名职称” “姓名职务” “姓名学科” “姓名学位”,16,实验结果分析与改进,实验结果,17,实验结果分析与改进,增加过滤规则,对“姓名电子邮箱”关系的改进 将学校名与邮箱后缀映射 技术:维护一张映射表 例如:“哈工大”映射成“” 将教师姓名与邮箱前缀映射 技术:IR实验室拼音模块 例如:“孙大烈”映射成“sdl” 例子:哈工大计算机学院孙大烈老师邮箱: ,18,实验结果分析与改进,改进后的结果对比,19,谢谢!Q&A,20,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号