智能家居入门DIY——【二、LD3320之语音识别】

        前一篇说了一下只有RX,TX,VCC,GND的WIFI模块软串口通讯;在实现了远程观察数据,类似的就可以实现远程控制。接下来说一下近距离控制,很多情况下应用语音识别技术无疑比掏出手机操作要更人性化一些,当然有些情况是例外,例如半夜起床来,那么人体感应模块和光传感器结合就更人性化。LD3320模块本身识别准确率并不高,但是通过编写程序的一些技巧,可以提高这个准确度。不过这个模块接线的时候有一些小问题,我买的是很多教程上的那个长方形模块,头上有俩插孔,尾巴上面2排12个针那种。说一下怎么用起来:

一、接线

A、下排

CS是片选,很多教程讲接GND,如果有多个SPI设备,则需要接一个引脚。

P0-P2,接UNO11-13引脚。(通讯+时钟)。

同排的GND,3.3V接UNO的GND,和3.3输出。

B、上排

IRQ是中断,接PIN2

WR接GND

RST接PIN9

共9线完成。

二、程序

        首先,感谢ld3320.h的原作者。

        然后,说一下这个“垃圾关键词”:首先,明确的说,把垃圾关键词都认为是真垃圾的思路我不认同;让我说严重点这就是误导,是背道而驰,贵圈确实很乱。提出几点原因:

1、本身识别准确率并不高,假定为60%,并且要求发音清楚、连贯性适中。

2、“垃圾关键词”是接近正确命令的发音,其中有相当部分是用户正确发音但未正确识别,假定为30%。

如果,代码中让“垃圾关键词”并不“垃圾”,那么识别率就是60%+30%;换一种说法,垃圾关键词中即使有1%是正确发音但未被准确识别的,我们把它加上,也是提高1%的正确识别。那么,接下来的问题就是真的垃圾怎么办。

1、场景切换(口令模式),当15%的真垃圾进入下一个场景,接下来的语句仍然符合下一场景的关键词的几率是多少?

2、长口令,带称呼的口令更符合人们的习惯,所以开灯可以变成二狗子开灯……长口令的错误识别率无疑要低。

所以,我的程序中,数据结构和逻辑结构是这样的:

struct AsrCommand
{
    char* flag;
    int ID;
};

AsrCommand CallName[] = { 
{ "da hei", 0 },
{ "da ei", 0 },
{ "da kei", 0 },
{ "da bai", 1 },
{ "da he", 1 } };

AsrCommand ExecuteCommand[] = { 
{ "kai dian shi",0 },
{ "ai dian shi",0 },
{ "kai yan shi",0 },
{ "ai yan shi",0 },
{ "kai tian shi",0 },
{ "ai tian shi",0 },
{ "guan dian shi",1 },
{ "kuan dian shi",1 },
{ "guan yan shi",1 },
{ "kuan yan shi",1 },
{ "guan tian shi",1 },
{ "kuan tian shi",1 } };

CallName中,编号为1的是真垃圾关键词,但是编号是0的部分里面包含了一部分假垃圾关键词,通过场景切换,使用ExecuteCommand中的关键词,两组都是命令,一组是开电视,一组是关电视。通过场景切换,第一组中的错误识别将被缩小。你可以尝试一下这个模式,它可以让你不必咬文嚼字的和机器对话而机器也会正确的响应你。识别率被提高,而不必非常担心:它会不会知道我说了什么?尽可能的不要让我们找方便的时候被搞得不痛快吧,那就不是用机器了,简直就是被机器用。

 

posted @ 2018-06-23 15:33  zcsor~流浪dè风  Views(5662)  Comments(0Edit  收藏  举报