文档详情

测验2语音识别测验手册

天****步
实名认证
店铺
DOCX
17.93KB
约6页
文档ID:254958360
测验2语音识别测验手册_第1页
1/6

本文格式为Word版,下载可任意编辑测验2语音识别测验手册 实 验 2 2 语音识别测验手册 目次 一. 测验目的: ................................................................................................. 2 二. 测验步骤: ..................................................................................................... 2 (一)环境设置步骤 .......................................................................................... 2 如何设置白名单 ..................................................................................... 4 (三)运行语音识别模块 ................................................................................... 6 (四)如何录音生成audio.wav文件 ................................................................ 7 三.学识要点及总结 ............................................................................................... 8 四.语音输入结合到测验一 .................................................................................... 9 (一) 代码注解: .......................................................................................... 9 (二) 运行代码步骤: ................................................................................... 9 五.总结 ............................................................................................................... 10 一. . 测验目的: 调用科大讯飞接口举行语音识别。

二. . 测验步骤: ( ( 一) ) 环境设置步骤 1. 安装 python3.0 版本以上参考测验环境安装教程文件夹) 2. 在该 python 下安装必要的调用库概括库包括:request,flask,aiml) (参考测验环境安装教程文件夹) 1) 右键以管理员身份开启 CMD 命令行窗口 2) 输入 pip3 install request 并按回车确定安装 安装完毕后,接着输入 pip3 install flask 并按回车确定安装 安装完毕后,接着输入 pip3 install aiml 并按回车确定安装 安装完毕后,接着输入 pip3 install jieba 并按回车确定安装 3. 需要安装一个 IDE pychrom,spyder 都可以,以 pycharm 为例参考测验环境安装教程文件夹)(二)账号注册和设置白名单 1.在科大讯飞开放平台()上注册账号; 2.在操纵台上创造应用 注册完账号后登陆进去,点击左上角的操纵台 3.将要添加的功能(如语音听写、语音合成)添加到刚创造的应用里,并将本地ip 添加到白名单,细致处境看下文的白名单设置方法。

4.获得你的账号 APPID 和应用 APIKey,留神语音听写和语音合成的 APIKEY是不一样的,需要区分,在运行 example_文件举行语音转文本时,要用语音听写的 APIKEY,在测验三做语音合成时,要使用语音合成的 APIKey. 如何设置白名单 A. 白名单的作用: 在调用全体业务接口时,授权认证通过后,服务端会检查调用方 ip 是否在讯飞开放平台配置的 ip 白名单中,对于没有配置到白名单中的 IP 发来的苦求,服务端会拒绝服务 注: IP 白名单可在操纵台应用管理卡片上编辑,五分钟左右生效; IP 白名单最多可设置 5 个,更多的需求可通过工单联系技术人员; 假设服务器返回结果如下所示,那么表示由于未配置 IP 白名单,服务端拒绝服务: B. 关于科大讯飞的 接口说明 授权认证,调用接口需要将 Appid,CurTime, Param 和 CheckSum 信息放在 HTTP 苦求头中; 接口统一为 UTF-8 编码; 接口支持 http 和 https; 苦求方式为 POST C. 授权认证的主要参数: 在调用全体业务接口时,都需要在 Http Request Header 中配置以下参数用于授权认证: l apiKey:接口密钥,由讯飞开放平台供给,调用方留神保管,如泄露,可联系讯飞技术人员重置; l checkSum 有效期:出于安好性考虑,每个 checkSum 的有效期为 5 分钟(用 curTime 计算),同时 curTime 要与标准时间同步,否那么,时间相差太大,服务端会直接认为 curTime 无效; l BASE64 编码采用 MIME 格式,字符包括大小写字母各 26 个,加上 10 个数字,和加号 + ,斜杠 / ,一共 64 个字符。

D. 概括网站设置: 1.开启科大讯飞开放平台官网并登录 2.开启操纵台 3.设置白名单 IP 地址 ( ( 三) ) 运行 语音识别模块 1)使用 pycharm 开启 shiyan 文件夹,然后在列表里双击 example_文件 2)添加测验语音转文本的账号 APPID 和 APIKEY 3)运行文件 example_ 在 example_代码中右键,然后单击 RUN,如下图所示他就会把保存在里面的录音翻译成文本 ( ( 四) ) 如何录音生成文件 像运行上面那个 py 文件的流程一样运行文件 然后展现这个*recording 表示正在录音,你可以对着电脑录音 录音会持续 10 秒左右,然后会展现下图这个表示录音终止,录音保存告成,生成文件 三. . 学识要点及总结 此测验通过调用科大讯飞的接口把输入的语音转化为对应的文本生成 四. . 语音输入 结合 到测验一 我们将语音识别输入这个功能移植到测验一,这样你可以不用手动输入问题,而可以通过语音输入,使用语音代替文字输入,闲聊机器人根据文本来回复问题。

当前 code 文件夹里有一个文件,这个文件把语音识别和闲聊机器人融合起来,用语音代替文字输入与闲聊机器人举行对话 ( ( 一) ) 代码注解: ( ( 二) ) 运行代码步骤: 1. 在用 pycharm 开启当前目次下的文件,先输入你自己的语音模块的 APPID 和API_KEY,右键点击"Run example',按照提示,如图在操纵台下按下回车 2. 按下回车后,等到展现* recording 提示符,这时候你可以说出你的问题,等待约 10 秒后,录音自动终止,弹出录音终止提示符"*saving recording',"record complete',操纵台会根据你的语音输入,生成文本并返回回复譬如,你说:"你好',语音识别模块会将你的语音切实地识别为"你好',并返回回复"Hi,你好!" 五. . 总结 本次测验主要实现了对于语音输入模块的完整实现以及把该模块应用到上一个测验的人机对话系统中,实现了对比梦想的效果 — 6 —。

下载提示
相似文档
正为您匹配相似的精品文档