walking机器人入门教程-语音交互-配置百度语音服务
walking机器人入门教程-语音交互-配置百度语音服务
说明:
- 介绍如何配置百度语音服务来实现语音识别ASR
- 在简化的语音交互有三个重要概念: 唤醒词,语音识别,语音合成.
- 唤醒词,是进行唤醒语音交互的词,比如我们是用"小腾"来唤醒语音交互.
- 语音识别,是唤醒之后,在几秒内说一段话,作为执行的语音指令或匹配的语音关键词. 比如播放本地音乐, 测试深度相机,测试雷达等,当收到语音指令,语音识别会转化为文字与写好的语音脚本关键词匹配,从而执行匹配的脚本.
- 语音合成,是当匹配到语音脚本后, 在处理前会生成一段处理的回答语.或在执行后,提示已经处理的结果.
相关设备
- walking机器人套件:采购地址
步骤:
- 唤醒功能通过snowboy实现, 语音识别和语音合成通过百度语音服务实现.
- 更详细的配置介绍, 可以参考配置文件~/.voice/config.yaml里面的提示.
- 目前主要通过百度语音服务实现. 需要注册帐号和开通语音服务.
- 默认我们是不提供使用帐号, 需要自己先注册帐号和开通语音服务
- 大致流程:
1. 注册或登陆帐号
2. 冲值, 充10元, 用于测试金额可以小点. 首次注册会有一定免费额度.长期使用建议小额充值.
3. 创建应用,有星号的,按实际选择即可. 默认就是包含了语音技术.就可以.其他随意.
4. 开通付费,语音识别下,点击开通付费, 在语音合成下,点击开通付费.开通付费后,默认采用按量后付费形式,总调用量不受限制,并发提升至50
5. 记录帐号信息, 点击管理应用, 进入页面后,记下 AppID, API Key, Secret Key几个值
6. 配置帐号,打开~/.voice/config.yaml 在百度配置一栏, 填写上述的几个值.即可完成配置
注册帐号:
- 点击访问百度云服务网站, 已有帐号,请登陆. 没有帐号,可以点击注册
冲值:
- 如果首次使用,可以不冲或小额充值测试.
创建应用:
- 点击创建应用, 有星号的,按实际选择即可
- 默认的语音技术下就包含了语音识别和语音合成
- 语音包名: 不需要
- 应用归属: 个人
- 应用描述: 随意写
- 创建应用后,记下 AppID, API Key, Secret Key几个值,后面配置需要
开通付费
- 首次可以忽略,默认有免费额度. 如果不想受限制,继续开通.
- 在可用服务列表下, 语音识别分页下API, 选中文普通话一行的开通付费.
- 在可用服务列表下, 语音合成分页下API, 选基础音库一行的开通付费.
记录帐号信息
- 上面创建应用如果没记下AppID, API Key, Secret Key几个值
- 打开管理应用,记录上述几个值
配置帐号
- 打开配置文件,
vim ~/.voice/config.yaml
- 找到# 百度语音服务, 修改百度下配置的AppID, API Key, Secret Key几个值
测试语音:
- 执行语音交互
~/tools/ai_voice/ai_voice.sh
- 说出唤醒词: 小腾. 读法: 小.腾. 小中间拖长一点,腾 这样容易识别
- 目前支持的语音指令:
播放本地音乐 #内置在/home/ubuntu/Music下已经不少歌曲
测试底盘
关闭底盘
测试雷达
关闭雷达
测试深度相机
关闭深度相机
- 更多的语音指令在开发中.....
- 语音插件目录在~/tools/ai_voice_custom/walking/custom
- 功能插件目录在~/tools/ai_voice_custom/walking/scripts
- 参考我们现有的插件写法,可以扩展自己语音插件和脚本插件.
- 比如说: 语音指令: 启动巡逻, 实现自动航点导航功能脚本.
- 比如说: 语音指令: 设置闹钟几点, 实现自动设置闹钟等等.
- 具体扩展,发挥自己的想象力.只有想不到,没有做不到. :)
获取最新文章: 扫一扫右上角的二维码加入“创客智造”公众号