树莓派上搭建唤醒词检测引擎 Snowboy

  Snowboy 是一款高度可定制的唤醒词检测引擎,可以用于实时嵌入式系统,并且始终监听(即使离线)。当前,它可以运行在 Raspberry Pi、(Ubuntu)Linux 和 Mac OS X 系统上。

  一些热门的唤醒词包括,Amazon Echo 上的“Alexa”,Android 设备上的“OK Google” 和 iPhone 上的“Hey Siri”。这些唤醒词用于,发起一个完整的语音交互界面。除了此,唤醒词还可以用于其他用途,比如执行简单的命令和控制动作。

  在一个棘手的解决方案中,它可以运行完整的自动语音识别(ASR,Automatic Speech Recognition)来执行热词检测。在这种情况下,设备将在自动语音识别转录中观察特定的触发词。转录中观察特定的触发词。 另外,当使用基于云的解决方案时,它也不会保护您的隐私。幸运的是,Snowboy 被创造出来,解决这些问题。

Snowboy 具有以下的特性:

  • 高度可定制。允许您自由定义自己的魔术词,如(但不限于)“芝麻开门”(open sesame)、“打开车库门”(garage door open)、或者“你好,梦之屋”(hello dreamhouse)。你能想到的,你就能定制它。
  • 一直监听,但是保护您的隐私。因为 Snowboy 没有连接到网络,因此不需要将你的声音上传到任何地方。
  • 轻巧的、可嵌入,可以让您在 Raspberry Pi 上运行。在最小的Pi(单核700M Hz ARMv6)上消耗少于10%的CPU。
  • Apache 协议

当前,Snowboy 可以支持:

  • 所有的 Raspberry Pi (搭载 Debian Jessie 8.0)
  • 64位 Mac OS X
  • 64bit Ubuntu (12.04 和 14.04)
  • iOS
  • Android (ARMv7 CPU)
  • Pine 64,搭载 Debian Jessie 8.5 (内核版本 3.10.102)
  • Intel Edison,搭载 Ubilinux (Debian Wheezy 7.8)

一、前期准备

  1、一个支持 Snowboy,并带有麦克风的设备;

  2、一个训练好的模型,可以从 https://snowboy.kitt.ai/dashboard 获取,可以自己训练,也可以下载训练好的模型,但是下载的时候,需要自己录入自己的语音。

 

二、下载Snowboy

  您可以下载预先打包好的 Snowboy 二进制文件,及其 Python 封装:

  下载地址:1/2/3/Zero

  或者在GitHub上下载编译

 

三、访问麦克风

  在这里,我们使用 PortAudio 作为音频输入/输出的跨平台支持。我们还使用 sox 作为快速实用程序,来检查麦克风设置是否正确。因此,我们需要先安装这个软件,使用麦克风。

  1、安装 Sox

sudo apt-get install sox

  2、安装 pyaudio 软件,推荐使用源码编译安装(此时不推荐 apt-get 的方式安装,原因是之后在会报各种错误)

    下载PortAudio源码包,下载页面:http://www.portaudio.com/download.html

wget http://www.portaudio.com/archives/pa_stable_v190600_20161030.tgz
tar -zxf pa_stable_v190600_20161030.tgz
#解压之后的文件夹名称是 portaudio
cd portaudio
sudo ./configure
sudo make && make install

  3、安装Python的pyaudio模块

sudo pip install pyaudio
sudo apt-get install libatlas-base-dev

  4、要检查是否可以通过麦克风进行录制,请打开终端并运行:

rec temp.wav

 

四、运行DEMO

  该 DEMO 可以在任何设备上运行。但是我们建议您:在带有扬声器输出的笔记本电脑/台式机上运行它,因为当您的唤醒词被触发时,DEMO 会播放Ding声音

python demo.py snowboy.pmdl

 

posted @ 2017-12-19 18:22  贱书生  阅读(11989)  评论(2编辑  收藏  举报