面向专利文献机器翻译统定制

上传人:博****1 文档编号:592883724 上传时间:2024-09-23 格式:PPT 页数:18 大小:882.02KB
返回 下载 相关 举报
面向专利文献机器翻译统定制_第1页
第1页 / 共18页
面向专利文献机器翻译统定制_第2页
第2页 / 共18页
面向专利文献机器翻译统定制_第3页
第3页 / 共18页
面向专利文献机器翻译统定制_第4页
第4页 / 共18页
面向专利文献机器翻译统定制_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《面向专利文献机器翻译统定制》由会员分享,可在线阅读,更多相关《面向专利文献机器翻译统定制(18页珍藏版)》请在金锄头文库上搜索。

1、面向专利文献的机器翻译系统定制面向专利文献的机器翻译系统定制Siriussoft Corp.目录I.公司简介II.技术竞争力III.韩国专利文献的特点IV.定制过程V.改良需求2008-11-04公司简介Siriussoft 目前拥有韩译英、英译韩、韩译日以及日译韩的机器翻译技术。公司计划扩展机器翻译所涵盖语种,如汉译韩、德译英、法译英以及俄译英。3现行经营模式现行经营模式 产品 : 集成有机器翻译引擎的 在线专利检索系统 韩国专利 (K2E-PAT)EP, US, JP, PCT 专利 (E2K)平台: KIPRIS 网站 (eng.kipris.or.kr)PIE 网站 ()目标客户: 终

2、端用户一千四百万 KIRRIS 用户研究人员、信息专家 个人发明者、专利律师等价格 : $ 30 /篇 (K2E)篇幅不限公司简介终端用户终端用户研究人员研究人员个人发明者个人发明者专利律师专利律师信息专家信息专家公司简介 历史与成就2024-09-232008.09 E2K 机器翻译引擎嵌入KIPO内部专利检索系统2008.07 在KIPRIS 网站开通E2K & J2K 服务2007.11 开通 PIE.COM 服务: 2007.04 为三边专利局开通K2E机器翻译系统2006.12 J2K机器翻译引擎并入KIPO 内部专利检索系统2006.10 KIPRIS系统开通 K2E-PAT服

3、务2005.11 开通 K-PION (韩国专利信息在线网络系统) 2004.12 获得ETRI机器翻译技术转让5机器翻译:计算语言学的分支学科,研究如何运用计算机软件将文本或语音从一种自然语言翻译为另一种自然语言 。语素处理技术句法处理技术语义处理技术语境处理技术句子生成技术技术竞争力源语句语素分析器 句法分析器 词典知识库语境处理语法库生成器目标语句分析语法技术竞争力专利领域专用MT系统词典和语法的涵盖范围限制在专利领域文章,使输出译文具有高准确度。 K2E 专利机器翻译系统 K2J 专利机器翻译系统 E2K 专利机器翻译系统 J2K 专利机器翻译系统MT 方法 K - E 引擎 : 以“

4、基于模板”为主的机器翻译 K J 引擎 : 基于规则的机器翻译将来会用到混合方法目标文本基于规则基于模板基于统计词法分析源文本混合机器翻译系统混合机器翻译系统技术竞争力专利技术 (ETRI)多语言翻译设备中用于识别多语言短语的系统(KR0261273) 基于概念的跨国语言翻译系统的自动语法修正方法(KR0204068 )对大量机器翻译请求的快速响应翻译记忆例) Opposition to Utility Model Registration例) The due date of submission of the amendment for the present application is

5、not allowed until the above due date.对同一个机器翻译请求进行分布式计算 负载平衡技术多样与便捷的 API网络翻译, 批量翻译, 电子文件翻译等 语序差异英语是SVO语言,而韩语是SOV语言格标记英语中不存在格标记没有对应于“, ”的英文词 冠词韩语中不存在冠词通常不被翻译成特定的词韩国专利文献的特点 HeHe ateate thethe cookcookiesiesS O VS O VS V OS V O韩国专利文献的特点间隔单位不同英语 词与语素相对应不需要改变间隔单位韩语词(eojeol)与语素不同需要改变间隔单位 * Eojeol是人性化的间隔单位主

6、语韩语语句中,主语可以省略英语语句的主语不能被对应到一个韩语词汇韩国专利文献的特点专利文献极长又复杂的句子 韩语专利文献中,句子由平均14.5个Eojeol组成 韩语新闻文章中,句子由平均12.3个Eojeol组成独特的句型摘要例) 本发明涉及发明内容详述例)根据现有技术 如图N所示附图简要说明例) 图n是用于说明的视图 有益效果例) 本发明的有益效果在于权利要求例)如权利要求n所述的,进一步包括 11定制过程半自动词典创建过程通过包含在专利文献中的括号提取韩英语对双语专利标题语料库双语专利标题12(TFT : (TFT : ThineThine Film Transistor) Film T

7、ransistor)(patterning)(patterning)(etching)(etching)(deposition)(deposition)定制过程手动词典创建过程日常处理 机器翻译过程中未得到翻译的词汇被自动报告给翻译人员 年度处理 术语从一年中的韩语专利文献中抽取 新术语自动识别 新术语人工翻译 加入到字典13定制过程名字翻译过程 包含在PCT等同专利、申请代码、公司网站及罗马字体书写规则中的英文名 14定制过程语句模板创建过程手工创建专利特有语句模板例1) 源文本: KR 模板 : NP1 匹配模板: NP1 that be:v achieved by the present

8、 invention 目标文本: The system that is achieved by the present invention is developed.例2) 源文本: KR 模板: NP1 NP2 VP1 匹配模板: NP1TopicVP1 compared to NP2 目标文本: The Invention improved performance compared to the prior art.15定制过程消除词语歧义DB建设: IPC的统计信息例) 韩语词“” 可以被翻译成 电子领域中的“磁极” 医药领域中的“刺激” 16改良需求源语句自身的错误 间隔错误 例) (synchronization plan) + (east evaporation plan) + (same period fire plan) + (same period studio plan) 拼写错误 源句改写机器翻译系统错误 通常出现在长句和复杂句中 混合方法缺少语言资源 专利领域中的双语文本 PCT 等同专利

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号