< >
Home » walking机器人入门教程#galactic#视频版 » walking机器人入门教程-语音交互-配置百度语音服务

walking机器人入门教程-语音交互-配置百度语音服务

walking机器人入门教程-语音交互-配置百度语音服务

说明:

  • 介绍如何配置百度语音服务来实现语音识别ASR
  • 在简化的语音交互有三个重要概念: 唤醒词,语音识别,语音合成.
  • 唤醒词,是进行唤醒语音交互的词,比如我们是用"小腾"来唤醒语音交互.
  • 语音识别,是唤醒之后,在几秒内说一段话,作为执行的语音指令或匹配的语音关键词. 比如播放本地音乐, 测试深度相机,测试雷达等,当收到语音指令,语音识别会转化为文字与写好的语音脚本关键词匹配,从而执行匹配的脚本.
  • 语音合成,是当匹配到语音脚本后, 在处理前会生成一段处理的回答语.或在执行后,提示已经处理的结果.

相关设备

步骤:

  • 唤醒功能通过snowboy实现, 语音识别和语音合成通过百度语音服务实现.
  • 更详细的配置介绍, 可以参考配置文件~/.voice/config.yaml里面的提示.
  • 目前主要通过百度语音服务实现. 需要注册帐号和开通语音服务.
  • 默认我们是不提供使用帐号, 需要自己先注册帐号和开通语音服务
  • 大致流程:
1. 注册或登陆帐号
2. 冲值, 充10元, 用于测试金额可以小点. 首次注册会有一定免费额度.长期使用建议小额充值.
3. 创建应用,有星号的,按实际选择即可. 默认就是包含了语音技术.就可以.其他随意.
4. 开通付费,语音识别下,点击开通付费, 在语音合成下,点击开通付费.开通付费后,默认采用按量后付费形式,总调用量不受限制,并发提升至50
5. 记录帐号信息, 点击管理应用, 进入页面后,记下 AppID, API Key, Secret Key几个值
6. 配置帐号,打开~/.voice/config.yaml 在百度配置一栏, 填写上述的几个值.即可完成配置

注册帐号:

冲值:

  • 如果首次使用,可以不冲或小额充值测试.

创建应用:

  • 点击创建应用, 有星号的,按实际选择即可
  • 默认的语音技术下就包含了语音识别和语音合成
  • 语音包名: 不需要
  • 应用归属: 个人
  • 应用描述: 随意写
  • 创建应用后,记下 AppID, API Key, Secret Key几个值,后面配置需要

开通付费

  • 首次可以忽略,默认有免费额度. 如果不想受限制,继续开通.
  • 在可用服务列表下, 语音识别分页下API, 选中文普通话一行的开通付费.
  • 在可用服务列表下, 语音合成分页下API, 选基础音库一行的开通付费.

记录帐号信息

  • 上面创建应用如果没记下AppID, API Key, Secret Key几个值
  • 打开管理应用,记录上述几个值

配置帐号

  • 打开配置文件, vim ~/.voice/config.yaml
  • 找到# 百度语音服务, 修改百度下配置的AppID, API Key, Secret Key几个值

测试语音:

  • 执行语音交互
~/tools/ai_voice/ai_voice.sh
  • 说出唤醒词: 小腾. 读法: 小.腾. 小中间拖长一点,腾 这样容易识别
  • 目前支持的语音指令:
播放本地音乐 #内置在/home/ubuntu/Music下已经不少歌曲
测试底盘
关闭底盘
测试雷达
关闭雷达
测试深度相机
关闭深度相机
  • 更多的语音指令在开发中.....
  • 语音插件目录在~/tools/ai_voice_custom/walking/custom
  • 功能插件目录在~/tools/ai_voice_custom/walking/scripts
  • 参考我们现有的插件写法,可以扩展自己语音插件和脚本插件.
  • 比如说: 语音指令: 启动巡逻, 实现自动航点导航功能脚本.
  • 比如说: 语音指令: 设置闹钟几点, 实现自动设置闹钟等等.
  • 具体扩展,发挥自己的想象力.只有想不到,没有做不到. :)

纠错,疑问,交流: 请进入讨论区点击加入Q群

获取最新文章: 扫一扫右上角的二维码加入“创客智造”公众号


标签: walking机器人入门教程