非特定人语音识别(asr)嵌入式解决方案

上传人:j****9 文档编号:47104535 上传时间:2018-06-29 格式:DOC 页数:4 大小:43KB
返回 下载 相关 举报
非特定人语音识别(asr)嵌入式解决方案_第1页
第1页 / 共4页
非特定人语音识别(asr)嵌入式解决方案_第2页
第2页 / 共4页
非特定人语音识别(asr)嵌入式解决方案_第3页
第3页 / 共4页
非特定人语音识别(asr)嵌入式解决方案_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《非特定人语音识别(asr)嵌入式解决方案》由会员分享,可在线阅读,更多相关《非特定人语音识别(asr)嵌入式解决方案(4页珍藏版)》请在金锄头文库上搜索。

1、非特定人语音识别(ASR)嵌入式解决方案国家/地区上海市上海市区上海市上海市区联系电话 13918041362 联系人 郑先生郑先生 (经理经理)最近登入 2009/12/24嵌入式语音识别在消费类电子产品市场应用上大约分成三类:手提设备,游 戏/ 玩具以及汽车。我们已经开发出能安装在智能手机 Smartphone 上的连续 语音及短语语音识别软件:Wanson ASR Chip1.0 ,它是专门为微小芯片上而开 发的嵌入式语音识别引擎。,可以为用户提供语音拨号和声音命令控制等功能。 这些软件可以 作用在智能手机 Smartphone,CDMA/2.5G/3.5G 芯片,智能玩具 以及汽车的导

2、航 系统上。该语音识别软件兼顾到识别速度和识别准确率的平衡, 能运用于一系列从语音命令控制,语音人名拨号到语音翻译,语言学习的实际 应用中,使得我们的 OEM 伙伴能快速地推出他们的新产品。 1 1、WansonWanson ASRASR Chip1.0Chip1.0 综述:综述: l 此引擎可以为您已有的硬件平台上(无论是 16 位 MCU、DSP、或者 ARM)上 增加语音识别的功能,比如手机控制器平台。全套的解决方案包括了公司专有 的非特定人语音识别引擎,不需要您现有控制器作大的硬件改动(仅需要增加 音频的输入和输出电路)。 l 在控制器芯片中移植非特定人语音识别引擎(标准的 C 语言写

3、的代码),利 用控制器芯片的运算能力完成语音识别功能,引擎可以识别关键词 200 多条左 右(可以根据控制器芯片的性能有所增加)。 l 系统具有显着的抗噪性能,在 30 分贝下,基本上能够完全识别,在 30 到 50 分贝的较吵的环境中,也能保持在 90%以上的识别率;2 2、WansonWanson ASRASR Chip1.0Chip1.0 系统系统 2、1 系统框图及概述 Wanson ASR Chip1.0 是一套功能强大,具有全部开发工具的语音识别系统,使 开发者可以方便而快速地开发出一系列不同的应用。Wanson ASR Chip1.0 提供 的特性包括有: 该语音识别软件附带了一

4、系图形化界面的软件开发包,使厂商可以很快 在现有的产品上增加语音识别功能; 秉承 Wanson ASR 电信级语音识别软件的高准确率和稳定性,持续提高 客户意度; 软件采用标准 C 书写核心算法,使得该软件能很快地移植到其他操作系 统和处理器上; 提供了常规的,功能强大的 API 接口,能够很方便地与设备上的现有软 件集成 2.2 应用程序开发 开发具有嵌入式语音识别功能的应用程序大约需要以下的步骤: 性能的定义 开发商在开发应用程序时,首先要定义的是准备给用户提供什么样的特性和功 能。例如,唤醒功能 (该引擎可以使产品工作在待机状态,等待清晰的唤醒命 令, 启动语音识别软件工作)等等; 现有

5、硬件环境分析 定义完性能之后,需要结合现有设备的硬件条件分析能否支持上述性能的实现。如果必须的话,是否需要另加 RAM 和 ROM,或者提高 CPU 的速度; 用户界面的设计 因为是基于消费类电子产品开发的应用程序,用户界面是否友好事关重大。 Wanson ASR Chip1.0 提供了一系列的开发包模拟运行环境,可以不断调试, 只到满意为止; 开发 以上所有步骤完成之后,可以进行代码编写和集成的工作。 3 硬件环境 Wanson ASR Chip1.0 是模块式的系统体系,单处理器处理所有模块程序的 运行。 CPU 的运算能力,一般而言,在不同的系统配置下,需要做到实时识别并 且不影响其他任

6、务执行所需要的最低配置为 6MIPS(取决于识别词汇量大小和 硬件配置等)。 RAM 和 ROM 需求 对于嵌入式的语音识别系统,RAM 和 ROM 的大小需求是由应用系统的功能设 计所决定的。同时,不同的 RAM 和 ROM 大小又影响着识别的准确率和响应速度。 一般情况下,较大的 RAM 和 ROM 存储空间和快速的 RAM 和 ROM 速度更 有利于识 别速度和识别准确率的提高。更多的情况下,在实际应用中,考虑到性能价格 比,一般会选择适当的 RAM 和 ROM 尺寸以达到速度和识别率的平衡。功能 描述 ROM 大 小要求RAM 大 小要求语音识别 离线语法 生成适用于语音命令控制等不需

7、要动 态语法生成的应用程序200k 150k语音识 别在线语适用于语音命令控制、语音拨号 等需要动态语法生成的应用程序300k 200k法生成语音识别 在线语法 生成、语 音合成适用于语音命令控制、语音拨号 等需要动态语法生成的应用程序 并提供完整语音合成方案500k 250k表中所列的 RAM 和 ROM 的空间需求是一个近似数字 4 功能及特性 Wanson ASR Chip1.0 嵌入式语音识别系统提供了一系列独到的功能和特性, 以 适应不同的开发厂商的需求。 * 话者独立 该软件无需事先对用户的语音训练,任何人拿起来均可使用; * 独特的口音的处理技术 用户不用说播音员般标准的普通话,

8、全国各地带有口音的用户亦可以毫无问题 得顺畅使用该系统; * 高识别率 在一定的硬件环境下,一次性载入词汇量达到 1000 中文词条时,平均准确率 达到 95以上,并且实时识别; * 可移植的代码 软件采用标准 C 书写核心算法,使得该软件能很快地移植到其他操作系统和处 理器上; * 小封装,低系统配置 如前所述,Wanson ASR Chip1.0 对系统硬件资源要求很少,因此可以适用于 一系列消费类电子产品上,例如: a) PDA,Smart phone b) CDMA,GSM,GPS 手机 c) MP3 播放器 d) 玩具 e) 车载 GPS 系统 f) 其他手提设备 * 在线更改语音资源 用户在每次增加/删减/更改词汇集合后,无需关闭和重新启动应用程序,系统可 以即时在线更新系统资源,使用户可以马上使用; * 环境噪音 该系统带有噪音消除技术,对于应用环境噪音一定范围之内,仍可保证高识别 率; * 动态词汇库 适用在不同的硬件条件下,词汇集合可以从零到 1000 词条,采用系统软件开 发包,可以方便创建新的词汇以适用于不同的应用(例如:命令控制集,地址 簿, 人名等等)。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号