用树莓派上打造成智能音箱

一年前写过《我们需要什么样的智能音箱》,里面提到现在市面上智能音箱在某种程度上是从厂商的角度设计的,存在两个问题:一是音箱作为一个always-listening black box所带来的隐私顾虑,另一是设备不开放所造成的功能受限问题。

那么我们就自己从头设计一个开源的智能音箱吧,在《语音交互——弹药库》中罗列了各种语音方面的资源,已经足够用来打造一个完全开源的智能音箱,就以一个开源项目的方式开始尝试,项目英文名就叫Smart Speaker from Scratch(因为受到Linux From Scratch的启发和激励)。

就定三个小目标:

  1. 开源(Open Source)
  2. 平价(Affordable)
  3. 可日常使用(Daily Use)

开源,即项目所用到的软硬件尽可能开放,当然也不排斥没开源的资源,希望有一套完全开源方案,最终希望是有开源的方案和各种其它方案可供用户选择(是的,有选择很重要)。

平价,意味着这不应该是很昂贵的玩物,虽然不能做到市面上智能音箱补贴后的价格,但会在硬件和结构的选择和设计上充分考虑成本,让成本尽可能的低。比如结构上可以选择低成本的纸壳(纸壳设计的门槛很低,可以让更多的人参与到DIY中)。

可日常使用,意思是可靠性足够好,不能停留在prototype阶段,不能只是demo的程度,需要可以像市面上的智能音箱那样,可以日常听歌,可以控制家里的电器。

这里面涉及的软件一点都不少,所幸的是过去三年一直在语音这个方向折腾,如今也算轻车熟路。过去的几年,主要就是在写代码,不过呢,一直会去思考产品要怎么设计,现在就开始把一些想法具象化吧。去挑战各种类型的事情,一个人像一支队伍,大概是因为队里面有程序 、产品 ,机械攻城 ……当然,一支队伍是不够的。

另外,想把整个过程写下来,写成一个电子书《Smart Speaker from Scratch》,可以写硬件设计、结构DIY、语音前端处理算法、语音交互逻辑,诸如此类。

项目的记录放在hackaday.io上面

Smart Speaker from Scratchhackaday.io图标

代码和文档会放在Github,欢迎follow跟进

voice-engine/smart_speaker_from_scratchgithub.com图标

如果你对智能音箱感兴趣,对always listening black box很在意,对DIY一个感到好奇,其它什么原因也行,欢迎在下面留言,也可以加入 gitter chat room 交流。

Have fun!

 

 

出处:https://zhuanlan.zhihu.com/p/58834651

出处:https://zhuanlan.zhihu.com/p/58690069

posted on   jack_Meng  阅读(1974)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
历史上的今天:
2013-05-23 利用Attribute实现AOP事务
2013-05-23 C#中的Attribute
2013-05-23 Remoting事件处理全接触
2013-05-23 系列文章--Remoting学习资料

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示

喜欢请打赏

扫描二维码打赏

支付宝打赏

主题色彩