随笔 - 41 文章 - 0 评论 - 500 阅读 - 121万

DirectShow捕获+mencoder+ffmpeg+sox 打造小巧的音视频制作、加工软件

DirectShow捕获+mencoder+ffmpeg+sox

打造小巧的音视频制作、加工软件

　　捕获音视频并进行加工处理，是常见的应用。录制一段小视频，加上广告，贴上字幕，再搞点音乐什么的，可以上传到视频网站上去，不管是做营销宣传，还是纯粹的娱乐目的，都很常见。当然，你可以使用市面上的很多的视频处理软件，不过，很多需要收取较高的费用或者需要破解，搞不好还会中毒。而事实上你可能只需要其中的一部分功能，而有的需求则需要使用几款软件同时合作才能实现。这个时候，做一下软件定制，搞一个完全符合自己需求的软件，不仅省去了诸多麻烦，使用起来也会得心应手、事半功倍。

　　本人最近做了一个小软件，实现音视频捕获，然后进行轻度的加工处理，功能不多，但是简单、易用，最重要的是完全符合客户的需求。既然是小项目，没有必要做深层的音视频编码和格式封装，而且客户也没有那么高的需求，因此，充分的利用开源程序，是最恰当的方式。这里和大家分享一下经验。

主要需求：

1. 采集摄像头和麦克风，并生成文件

2. 为录制的视频添加字幕

3. 为录制的视频背景音乐，背景音的音量要能调节

4. 添加片头和片尾

5. 最终生成的文件体积要小，方便上传至视频共享网站（优酷、土豆等）

　　需求比较简单，就这几项，但如果真的从轮子造起，那就不知道要造到猴年马月了。先上一张产品照，养养胃口：

技术分析

　　1. 首先是音视频捕获，可以采用DirectShow技术（说到DirectShow，需要说明一下，我使用的是Windows SDK 7.1所带的dshow，有些人用的是dx9中的dshow，我没有对比区别）。因为这里不是做直播或监控，所以没必要实时对每一帧做处理，所以决定不采用SampleGrabber的回调形式，直接让它生成AVI文件，然后再做处理。这里因为我们还想做预览，所以需要对视频做两次RenderStream。对了，别忘了还有音频哦:）。

　　2. 因为需要到要上传，所以需要对采集后的视频文件做编码处理，直接调用ffmpeg即可，可以把你几百MB的采集视频压缩为1MB。这里不采用mencoder，因为它似乎对avi文件的处理有问题。考虑到之后要添加背景音，为了保证背景音和麦克风同时存在，需要抽取音频单独处理，同样是调用ffmpeg，这里把代码列上，相信你在其他地方也能用的上：

　　3. 音频处理，就是调用sox了。它是个好东西啊，不仅可以做音频的合并、分割，也能做混音和音量调节，这就是选择它的原因。注意，音量调节是针对原始音乐的，-v 传入的参数，指的是针对原始音量的调整幅值。大于1为增大音量，小于1减小音量，负数表示还需要对音频进行反相变换。sox还能做其他的声音处理效果，大家可以自己Google之。

　　4. 添加字幕。需要调用mencoder，因为我对它进行了封装，这里不方便展示，只把字幕相关的参数列出来，以供参考。其中-subfont-text-scale后面的参数是字体的大小，-subfont参数输入的是字体文件的绝对路径，一般是C:\WINDOWS\Fonts\中的文件。

-subcp cp936 -sub-fuzziness 1 -subfont-autoscale 3 -subfont-text-scale %d -subfont-blur 2 -subfont-outline 2 -subfont %s

　　5. 添加片头片尾，也就是视频合并了。合并的前提是它们的编码要一致，所以有必要对它们进行重新编码，按照录制后视频的处理方式进行处理。我把它们都转换成了mp4文件，然后就可以很方便的合并了。mp4合并是我之前就已经写好的程序，直接拿来用了。如果你没有，可以调用mp4box来做这件事情。参数我直接贴上了，大家就不用再找了。顺便说一句，如果你发现你的mp4文件存在同一时刻的音频帧和视频帧相距较远，导致网络播放时无法快起的问题，也可以用mp4box来解决：

mp4box.exe -cat input_1.mp4 -cat input_2.mp4 out.mp4

　　基本上，主要技术就是这些了，毕竟是定制项目，不方便完全贴出来。下面贴几张处理后的效果图：

字幕。。。

片尾广告。。。

+++++++++++++++++++++++++++++++++++++++++++++++++++++

posted on 2011-11-07 11:40 haibindev 阅读(11169) 评论(8) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

公告

15年专业网络音视频技术

国产化平台流媒体系统、直播监控、视频聊天、视频会议、网络音视频传输、RTMP/RTSP/GB28181/HTTPFLV/WEBRTC/UDP等各种网络协议
Windows/Linux/Android/IOS/ARM/统信UOS/银河麒麟等平台开发

联系方式

商务合作：

微信: hbstream

QQ：229375788

淘宝店铺：

haibindev.taobao.com

技术交流：haibindev@gmail.com

昵称： haibindev
园龄： 14年2个月
荣誉：推荐博客
粉丝： 608
关注： 0

+加关注

2011年11月

日

一

二

三

四

五

六

随笔档案

相册

备用(1)

DirectShow捕获+mencoder+ffmpeg+sox 打造小巧的音视频制作、加工软件

DirectShow捕获+mencoder+ffmpeg+sox

打造小巧的音视频制作、加工软件

主要需求：

公告

搜索

常用链接

我的标签

随笔档案

相册

阅读排行榜

评论排行榜

推荐排行榜

最新评论