EPO-SIPO 联合自动机器翻译国际研讨会联合自动机器翻译国际研讨会 世界知识产权组织专利文献翻译与术语管理世界知识产权组织世界知识产权组织 PCT 运营司翻译与词汇管理世界知识产权组织致力于发展一种兼顾各方利益、易于接受的知识产权制度,在保障公共利益的同时奖励创造专利合作条约( PCT)是主要工具之一WIPO与PCT专利合作条约•通过提出国际专利申请,PCT使得一项发明在许多国家(目前139个)同时获得专利保护成为可能•作为专利公布体系的组成部分,WIPO负责公布PCT申请•为便于公开,PCT申请与作为发明综述的摘要一同公布•为满足公开需要,WIPO每年要翻译大量文献 PCT - 《《专利合作条约专利合作条约》》 PCT 翻译服务•PCT框架下出版的首个译本是1978年10月19日出版的英语到法语译本•迄今,我们在PCT申请公布方面已拥有30年的技术摘要及专利性报告翻译经验•PCT PATENTSCOPE®数据库包含约1,800,000篇摘要PATENTSCOPE® ———— WIPO 专利检索工具专利检索工具PCT 翻译服务PCT国际申请国际申请量走势图量走势图 1978-2007PCT 翻译服务——语言•一件国际申请的翻译服务需涉及多达三种语言Ø初始申请语言Ø两种公布语言:§英语§法语国际申请的公国际申请的公布涉及布涉及三种语言三种语言PCT 翻译服务——语言•提出的申请可以用10种语言公布:–阿拉伯语,汉语,英语,法语–德语,日语,俄语,西班牙语–韩语和葡萄牙语(2009年1月1日起)•申请及公布语言PCT 翻译服务——语言PCT申请来源国发展中国家的申请PCT 统计数据翻译量(2009年预计)–约 70,000,000 词(摘要及报告)–约 150,000 份申请•约 220,000 份翻译–近年来,翻译量以6% 的年增速增长。
术语•PCT是公布创新及传播知识的载体•大量的科学/技术词汇•高度专业化, 前沿各技术领域的最前各技术领域的最前沿沿术语术语术语•专利摘要中术语非常密集•摘要中,平均有50%以上的用语是涉及发明的技术领域和具体特点的专业词汇发明摘要发明摘要中超过中超过50%50%的内容的内容是专业技术术语是专业技术术语摘要中的术语频率•153个词(786个字符)•36个术语(421个字符)•22个独特术语•53%的比例此摘要范例含有此摘要范例含有2222个独特的术语词个独特的术语词摘要中的术语频率•包含164个非罗马字符的中文专利摘要摘要中的术语频率•除去术语,仅剩80个字符•约50%的用语为实质实质性技术内容性技术内容. 50%50%的内容的内容为为实质性实质性技术术语技术术语术语和机器翻译•完善的词典及术语库对于机器翻译尤为重要,为源语言中所用术语的准确翻译提供保证•这些术语往往包含一个以上词,即复合词语境中的术语•例如,缩略语IP可有多种解释:–对律师而言,是知识产权对律师而言,是知识产权 –对物理学家而言,是感应极化对物理学家而言,是感应极化–对计算机程序设计员而言,是互联网协议对计算机程序设计员而言,是互联网协议–对消费者而言,是对消费者而言,是因特网服务提供商因特网服务提供商或或智能智能外设外设 –对棒球迷而言,是对棒球迷而言,是投球局数投球局数–对银行家而言,是对银行家而言,是投资组合投资组合 不同领域中,同一术语或缩略语可有多种解释不同领域中,同一术语或缩略语可有多种解释语境中的术语•对医生而言, IP 可有多种解释–住院病人–间质性肺炎–色素失调症–以上各例的不同之处在于上下文所显示的主题领域不同。
术语学中, 术语必须与特定领域相联系Context: 背景技术领域及上下文内容背景技术领域及上下文内容 语境中的术语•同形歧义: –例如,thermostatic:–恒温恒温 thermostatic bath 恒温槽–定温定温 thermostatic switch 定温开关–热力热力 thermostatic expansion valve 热力膨胀阀 机器翻译示例中的术语•伪线标签接收模块,该模块接收伪线标签消息,如果该伪线标签消息的目标提供商边缘设备(PE)不是自己,则交给本地中继的伪线管理模块处理;本地中继的伪线管理模块,该模块保存并维护经自己中继的伪线状态 … •The module is received to pseudo- line label, and pseudo- line label news is received to this module, if target provider edge device (PE) of this puppet line label news is not oneself, then gives the pseudo- spool reason module of local relaying and handles; The pseudo- threadiness attitude through own relaying is preserved and safeguards to the pseudo- spool reason module of local relaying …机器翻译示例中的术语Ø机器翻译机器翻译:ØThe present invention relates to a fastening of a veliplanchist (4) comprising a hook (30) and a carrying rope (5), IE carrying rope (5) being suited has to be connects has an arch of operation (6) of a sail (2) of board has veil so as to form a loop related to the hook (30). Ø人工翻译人工翻译:ØThe present invention relates to a securing device for a sailboarder, (4) comprising a hook (30) and a bearer line (5), the bearer line (5) being able to be connected to a boom (6) used to control a sail (2) of a sailboard in such a way as to form a loop connected to the hook (30). PCT术语库术语库•统计数据–2008年1月7日投入使用–合并了 WIPO以前使用的术语库–目前包含10,000条记录(30,000个术语)•现仅供内部使用•PCT 术语库是–跨语言信息检索 (CLIR)的基石–协调及标准化的工具–未来用于翻译记忆和机器翻译的资源PCT术语库•目标公众–翻译人员, 校对人员, 技术文献编写人员, 专利专家及其他专利文献用户•质量控制- 制定术语创建及校验规程,使WIPO内部的术语策略制定及相关流程规范化 。
PCT术语库PCT术语库•技术–SDL TRADOS MultiTerm•远程服务器位置–英国–数据加密 (SSL AES 256 bits)•访问–MultiTerm 桌面系统本地用户»内部和外部职员–MultiTerm »基于Web的访问 (可公布内容)•语言 (1)–多语言术语库 阿拉伯语,汉语,英语, 法语,德语,日语,俄语, 西班牙语 葡萄牙语和韩语 - 将于2009年纳入PCT术语库•语言 (2)–当前主要是两种语言内容:英语-法语•60% 的申请使用英语•PCT翻译人员的语言分布–即将采用三种语言:英语-法语-德语PCT术语库•用户 (1)–多用户术语库–90 个内部用户–9 个外部用户–自由译员»目前只读访问–翻译机构 (进展中)PCT术语库•用户 (2)–基于术语角色划分为不同的语言组基于术语角色划分为不同的语言组 –内部/外部贡献者–内部校对人员–术语学家–专家用户–(管理员)PCT术语库–术语库定义 (1)–综合设计•基于标准–ISO 12620, 16642, TBX等•向上可扩容 –覆盖全部 WIPO 分类体系–例如. IPC, Trademarks, Locarno, UPOV–语言提示 –例如,原始登录语言PCT术语库–术语库定义(2)–综合设计–机器翻译–翻译记忆–创作工具–质量控制–要避免的术语,陈旧术语等PCT术语库–统计 (1)–监控术语库活动及增长–SDL MultiTerm 中由于缺乏现有功能而内部开发的程序•表面统计PCT术语库–统计 (2)–深入统计–依据主题领域、术语状态、条目状态、 条目来源、 用户贡献–用于术语库质量控制–不一致性,罕见术语等–用于日/周输出检测PCT术语库–挑战–10种语言的任务–集中于亚洲语言–职员的语言组成–缺乏人力资源–避免重复劳动–合作–汉语术语贡献者/校对人员/专家用户–对由相关知识产权局所创建术语库的访问PCT术语库–WIPO 可提供–术语及技术知识–例如,统计–翻译技术–30年专业知识及经验–非官方的联合国语言–德语, 日语, (2009年葡萄牙语, 韩语)PCT术语库。