摘要: 前面分享过一个算法《音频增益响度分析 ReplayGain 附完整C代码示例》 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法。 不过在项目实测的时候,其实真的很难定标准, 到底在什么样的环境下,要增大音量,还是降低。 在通讯行业一般的做法就 阅读全文
posted @ 2018-04-22 18:04 cpuimage 阅读(8263) 评论(3) 推荐(2) 编辑
摘要: 降噪是音频图像算法中的必不可少的。 目的肯定是让图片或语音 更加自然平滑,简而言之,美化。 图像算法和音频算法 都有其共通点。 图像是偏向 空间 处理,例如图片中的某个区域。 图像很多时候是以二维数据为主,矩形数据分布。 音频更偏向 时间 处理,例如语音中的某段时长。 音频一般是一维数据为主,单声道 阅读全文
posted @ 2018-04-22 10:25 cpuimage 阅读(27000) 评论(6) 推荐(9) 编辑
摘要: 之前有大概介绍了音频采样相关的思路,详情见《简洁明了的插值音频重采样算法例子 (附完整C代码)》。 音频方面的开源项目很多很多。 最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包含有 AGC自动增益补偿(Automatic Gain Control)自动调麦克风的收音量,使与会者收到一定的 阅读全文
posted @ 2018-04-19 22:44 cpuimage 阅读(8675) 评论(8) 推荐(2) 编辑
摘要: 绝大数人都知道mp3格式编码,以及aac,amr等压缩格式编码。 而在语音通信界有一个强悍的音频格式编码opus. 经过实测,压缩比最高可以达到1:10。 100KB 压缩后 10KB 虽然是有损压缩, 但是根据实际对比试听, 几乎听不出差别。 而且还原度还比mp3高,压缩比也比mp3高。 用来压缩 阅读全文
posted @ 2018-04-18 23:17 cpuimage 阅读(10774) 评论(5) 推荐(1) 编辑
摘要: 人们所熟知的图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了使感光器件获得合适的曝光量 AW自动白平衡(Automatic White Balance)白平衡的 阅读全文
posted @ 2018-04-15 13:00 cpuimage 阅读(4852) 评论(0) 推荐(2) 编辑
摘要: 前几天无意间看到一个项目rnnoise。 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法。 采用的是 GRU/LSTM 模型。 阅读下训练代码,可惜的是作者没有提供数据训练集。 不过基本可以断定他采用的数据集里,肯定有urbansound8k。 阅读全文
posted @ 2018-04-07 16:47 cpuimage 阅读(13530) 评论(1) 推荐(3) 编辑
摘要: 近一段时间在图像算法以及音频算法之间来回游走。 经常有一些需求,需要将音频进行采样转码处理。 现有的知名开源库,诸如: webrtc , sox等, 代码阅读起来实在闹心。 而音频重采样其实也就是插值算法。 与图像方面的插值算法没有太大的区别。 基于双线性插值的思路。 博主简单实现一个简洁的重采样算 阅读全文
posted @ 2018-03-26 22:00 cpuimage 阅读(7552) 评论(0) 推荐(1) 编辑
摘要: mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化。 也就是中文车牌识别开源项目EasyPR的作者liuruoze,刘兄。 自那时起就有一块石头没放下,想 阅读全文
posted @ 2018-02-03 23:12 cpuimage 阅读(4647) 评论(1) 推荐(1) 编辑
摘要: 2年前在学习图像算法的时候看到一个文档倾斜矫正的算法。 也就是说能将一些文档图像进行旋转矫正, 当然这个算法一般用于一些文档扫描软件做后处理 或者用于ocr 文字识别做前处理。 相关的关键词: 抗倾斜 反倾斜 Deskew 等等。 最简单算法实现思路,采用 霍夫变换(Hough Transform) 阅读全文
posted @ 2018-02-03 17:27 cpuimage 阅读(7062) 评论(0) 推荐(3) 编辑
摘要: 前年学习opengl做的一个小东西。 原本计划将gpuimage 的算法一个一个转写成cpu版本 c,c++ 版本。 gpuimage 项目参考: https://github.com/BradLarson/GPUImage https://github.com/BradLarson/GPUImag 阅读全文
posted @ 2018-01-30 21:28 cpuimage 阅读(1085) 评论(0) 推荐(1) 编辑