摘要:
近期一直不间断学习音频处理,一直也没想着要去碰音频编解码相关。 主要是觉得没什么实际的作用和意义。 不管视频编解码,图像编解码,音频编解码,都有很多组织基金在推动。 当然,在一些特定的情景下,需要用起来编解码库, 而一般这些库都会有编译困难,使用困难等等困难综合症。 图像方面,已经有stb_imag 阅读全文
摘要:
前面有提到音频采样算法: WebRTC 音频采样算法 附完整C++示例代码 简洁明了的插值音频重采样算法例子 (附完整C代码) 近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题。 坦白讲,我精力有限,但一般都会抽空回复一下。 大多数情况,阅读一下代码就能解决的问题, 也是要尝试一下的。 阅读全文
摘要:
众所周知, 图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了使感光器件获得合适的曝光量 AW自动白平衡(Automatic White Balance)白平衡的 阅读全文
摘要:
在前面的文章,我提到过VSCO Cam 的胶片滤镜算法实现是3d lut。 那么3d lut 到底是个什么东西呢? 或者说它是用来做什么的? 长话短说,3d lut(全称 : 3D Lookup table )它是通过建立一个颜色映射表,对图像的色调进行重调的算法。 有用于摄像机的效果美化润色,例如 阅读全文
摘要:
图片颜色量化算法, 又称之为图片主色调提取算法。 也可以称之为调色板提取算法。 比较常见的应用就是用于提取图片的主色调用于上色配色, 当然也可以用于图像分割。 算法的主要目的是从真彩色图像所能表现的大约16M中颜色中选取最代表性或者出现频率最高的256种颜色。 维基百科: https://en.wi 阅读全文
摘要:
在一些特殊情况下,经常需要依据图像中的人脸,对图片进行倾斜矫正。 例如拍照角度幅度过大之类的情况,而进行人工矫正确实很叫人头大。 那是不是可以有一种算法,可以根据人脸的信息对图片进行角度的修复呢? 答案肯定是确认的。 再次例如,想要通过人脸的特征对人物的表情和情绪进行精准判断, 那么这个时候如果能确 阅读全文
摘要:
说起红眼算法,这个话题非常古老了。 百度百科上的描述: “红眼”一般是指在人物摄影时,当闪光灯照射到人眼的时候,瞳孔放大而产生的视网膜泛红现象。 由于红眼现象的程度是根据拍摄对象色素的深浅决定的,如果拍摄对象的眼睛颜色较深,红眼现象便不会特别明显。 “红眼”也指传染性结膜炎。 近些年好像没有看到摄影 阅读全文
摘要:
人脸检测 识别一直是图像算法领域一个主流话题。 前年 SeetaFace 开源了人脸识别引擎,一度成为热门话题。 虽然后来SeetaFace 又放出来 2.0版本,但是,我说但是。。。 没有训练代码,想要自己训练一下模型那可就犯难了。 虽然可以阅读源码,从前向传播的角度,反过来实现训练代码, 但是谁 阅读全文
摘要:
在几年前的时候在做修图APP算法的时候, 曾经一度想过对3D Lut 预设数据进行压缩, 主要用于提升用户体验。 关于3d lut算法开源的资源也挺多的,就不多做科普了。 有兴趣的朋友,可以去查阅下ffmepg项目相关实现代码。 最早接触3d lut算法是2014年逆向 VSCO Cam 胶片算法的 阅读全文
摘要:
WebRTC提供一套音频处理引擎, 包含以下算法: AGC自动增益控制(Automatic Gain Control) ANS噪音抑制(Automatic Noise Suppression) AEC是声学回声消除(Acoustic Echo Canceller for Mobile) VAD是静音 阅读全文