开源TTS语音合成和处理工具

上传人:hs****ma 文档编号:489656224 上传时间:2023-10-14 格式:DOCX 页数:7 大小:238.35KB
返回 下载 相关 举报
开源TTS语音合成和处理工具_第1页
第1页 / 共7页
开源TTS语音合成和处理工具_第2页
第2页 / 共7页
开源TTS语音合成和处理工具_第3页
第3页 / 共7页
开源TTS语音合成和处理工具_第4页
第4页 / 共7页
开源TTS语音合成和处理工具_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《开源TTS语音合成和处理工具》由会员分享,可在线阅读,更多相关《开源TTS语音合成和处理工具(7页珍藏版)》请在金锄头文库上搜索。

1、开源TTS/语音合成和处理工具1. eSpeakeSpeak是一个紧凑的开放源码软件的语音合成器为英语和其他语言,为Linux 和 Windows 。eSpeak生产高质量的英语演讲。它使用了不同的合成方法从其他开源语音合成 引擎,和声音完全不同。这也许不是作为自然人或“平稳”,但我觉得发音更 清晰,更容易听很长时间。它可以运行命令行程序发言的文本文件或从标准输入。一个共享库的版本也已 推出。包括不同的声音,其特点可以改变。能产生语音输出为WAV文件。 SSML (语音合成标记语言)的支持(未完成),并使用HTML。 该计划及其数据,其中包括数种语言,总计约700千字节。 可以把文字,音素代码

2、,所以它能够适应作为一个前端另一个语音合成引擎。 潜在的其他语言。 一些包含在不同阶段所取得的进展。 帮助母语为这些或 其他语言的欢迎。 开发工具可用于生产和调整音素数据。 写在C + +Windows版本 目前的Windows SAPI5和命令行版本的eSpeak。SAPI5版本的 可以使用屏幕阅读器,如完,颌骨,超新星,以及窗的眼睛。它们可以作为一个Windows安装程序包该eSpeak语音合成器支持几种语言,但在大多数情况下,这些都是初稿,并需 要更多的工作来改善。援助的母语是值得欢迎的这些或其他新的语言。请与我 联系如果你想帮助。eSpeak没有文字,语音合成的语言,一些比别人做得更好

3、。南 非荷兰语,粤语, 克罗地亚语,捷克语,荷兰语,英语,世界语,芬兰语,法语,德语,希腊语, 印地语,匈牙利语,冰岛语,意大利语, Lojban ,马其顿语,普通话,挪威语, 波兰语,葡萄牙语,罗马尼亚语,俄语,塞尔维亚语,斯洛伐克语,西班牙语, 斯瓦希里语,瑞典,越南,威尔士。2. FreeTTSFreeTTS 是完全采用 Java 开发的语音合成系统,它是卡内基梅隆大学基于 Flite 这个小型的语音合成引擎开发的。FreeTTS是一个语音合成系统写的JavaTM编程语言完全。它是根据Flite公司: 一个小运行时语音合成引擎卡内基梅隆大学的发展。弗莱特来源于节语音合成系 统,从爱丁堡大

4、学和卡内基梅隆大学的festvox项目。这种FreeTTS版本包括: *核心语音合成引擎*支持的多寡:邻一 8kHz的双音子,男,美国英语语音办公 16KHz 的双音子,男,美国英语语音办公 16KHz 的有限域,男*美国英语语音的 festvox的进口(美国英语的声音只)*对进口的festvox (仅限美式英文)*支 持工具中央结算系统的 MBROLA 北极的具体支持,支持的声音声音(单独下载): 办公自动化 16KHz 的女性,美国英语语音 O 2 个 16KHz 的男性声音*美国英语为 JSAPI 1.0 *广泛的 API 文档部分支持*几个演示应用3. eSpeak-ChineseeS

5、peak-Chinese 是一个 TTS 软件。它是基于 Jonathan Duddington 的 eSpeak 由于中文词典太大,eSpeak缺省并不带中文词典,需另外下载。发布 eSpeak-Chinese 只是为了方便用户安装。国语支持的主要贡献者: Kyle Wang (waxaca at ) -创建了最初的字典,规则和声音文 件。 Silas S. Brown (http:/people.pwf.cam.ac.uk/ssb22/)- 改进词典(力廿 入 CEDICT 等).粤语支持的主要贡献者: 黄冠能 - 创建了粤语字典,简易的规则和声音文件。eSpeak-Chinese是eGu

6、ideDog项目的重要组成部分。另一个中文TTS(余音)在开 发中。它在设计上更简易但文件较大。由于使用了真人发声,它比 eSpeak 的声 音更自然。目前它只支持粤语。4. FliteFlite 是一个小型、快速的 TTS 系统,是著名的语音合成系统 festival 的 c 版 本。可用于嵌入式系统5.OpenVXIOpenVXI 提供的是完整的 VXML 解析服务,同时也提供了有限语言的 TTS 支持。Voice eXtensible Markup Language (简称VXML)是被用来创建语音对话系统, 可以调用语音合成以及语音识别服务,可以用来记录语音录入和连接电话系统。 创建

7、VXML 语音的主要目的就是用 Web 开发的理念来开发交互式的语音应用。VXML 提供了基于 Menu 和基于 Form 的两套框架,整合了语音识别和语音合成 两个关键服务,使得语音应用的开发变得更为方便和快捷。VXML 和普通的标记语言一样,需要有浏览器进行解析;还需要提供语音识别和 语音合成服务的应用服务器;有时也需要有 http 服务器提供文档服务;当然, 如果需要与电话系统相连,就必须力上 VOIP (网络电话)的支持。如下图所示 的就是 VXML 的运行环境: 图 1. VXML 运行环境Requ-estDocument ServerDocumentVoice-NMLVXMLinL

8、&rprotofrnterpreterContext Implement Platform一个企业级应用的系统框架IVR (interactive voice-response services) 也就是自动应答服务,是使用VXML的典型企业级应用。IVR和使用者通过电话,按键(DTMF)互动,如语音 订票,语音查询,语音投票等。普通的 IVR 都是支持 VXML 的解析和提供了 sip 协议的支持,通过和 ASR ( 语音识别 ) 应用服务器以及 TTS( 语音合成 ) 应 用服务器的集成,可以实现几乎所有的 VXML 封装的操作。企业级的 VXML 应用需要如下的体系结构,以使用 IBM

9、Voice Server (WVS) 为 例:图 2. 一个 VXML 具体应用的例子上图中的IVR事实上就是VXML解析器,通过解析VXML,分发相应的工作给 WVS ,实现 VXML 封装的语音识别和语音合成的功能。6. FestivalFestival 是 Linux 下的一个语音合成软件 使用方法:$ festival -tts letter.txt$ festivalfestival (SayText Greetings from ) $festival (tts myfile.txt)在线演示:http:/www.cstr.ed.ac.uk/projects/festival/on

10、linedemo.html7. MBR0LAMBROLA 是一个 TTS 引擎,旨在尽可能的提供各种语言的语音合成器,这些语言 在其首页上都有说明。8. AstLinuxAst Linux是一个定制的Linux发行版,主要是围绕这ast erisk这个语音交换 软件定制的。Ic-EfryVQiMtndklWtliUHCfcUMTSNctwgrKEfimFa-J5fiJrtAT-!?flfePfcl1* SvctdvnTP A.ddlira & s :iMS :Systexa Ufitiaic :LgipiM AvciragCLQOp QCdst 1 丄siiUJC-tunJc-EW m Aat

11、fi上丄bK. 11 -JJ-ral1.3.17bisk UsdigesP.lXc sysLm 心申小曲IZdeir/Indidi 2ZdQy/hd%3&t /oLdroat/isrit /as tmrw it /HJSt/kJDHCP Leases:Aetive Channels;caian DelO ac Live cihannc:ls0 ac tivc QB-1 lKLdeationt&tiXLpp Licitid fi (Dat a)9.HTS (HMM-based Speech Synthesis System)HTS (HMM-based Speech Syn thesis Sys

12、 tem)是一个语音合成系统 阅读 HTS 所使用的技术和算法,请看:htt p:/h ts.sp.n it ech.ac.jp/?Publica tionslO.Fes tvoxFestvox 是卡内基梅隆大学语音项目组开发的语音合成系统11.Speak It 阅读的书页或选定文本使用微软语音合成引擎.12. 语音识别系统 SimonSimon 是一个开源的语音识别系统,它不仅可以输入文字,而且可以代替键盘、 鼠标操作电脑。Simon基于Qt用C+开发,因为某些支持库与KDE相同,所 以可完美的集成到KDE4中。除KDE之外,Simon也可在GNOME、Xfce、及其 他XII环境下运行。1

13、3. 语音合成引擎 gnuspeechGnuspeech 是一个可扩展的语音合成实现包的基础上,实时,发音,语音合成按 规则。也就是说,它转换成语音的描述文本字符串,由一个发音辞典,信中对声 音的规则,节奏和语调模型资助;参数转换成一个低级别的发音合成的语音说明, 以及利用这些驱动发音模型的制作人声是正常的声音输出的GNU / Linux的设备 输出合适的道14. 语音合成引擎 EposEpos 是一个跟语言本身无关的规则驱动的语音合成系统,主要作科研用途在线演示:http:/epos.ure.cas.cz/cgi-bin/saye.cgi?lang二czech15. 语音合成软件NeXTeNSNeXTeNS是一个荷兰语的Text-to-Speech的软件。16.JVoiceXMLJava VoiceXML Interpreter 一个用 Java 写的免费 VoiceXML 的解析器,支持 JSAPI、JTAPI。17.语音合成引擎 MARYMARY 是一个支持英语、德语和藏语的 Text-to-Speech 合成系统

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号