随笔分类 - 音视频处理
audio video encode decode ffmpeg opencv
摘要:起因是,现在开始做翻译,发现这个软件在 WIN 上面显示很模糊,没有适配 高 DPI 显示,看了 从 2014年后,官方就不在发布新版本了,为了自己用着舒服,也为了广大的字幕影视爱好者。 所以 fork 了项目,开始维护这个项目:https://github.com/nejidev/AegisubX
阅读全文
摘要:1 首先升级用 vs2015 来编译开发 windows 下的程序,因为更好的兼容 c99 语法,不用改很多东西。 libx264 的编译: 在 ubuntu 下的确非常容易,windows 平台有点麻烦,需要用到 MYSY2 ,现在这些开源项目,有的都不提供 vs 的工程,哪怕提供个 cmake
阅读全文
摘要:上一篇对摄像头预览,拍照做了大概的介绍,现在已经可以拿到视频帧了,在加上 RTSP 实现,就是直播的雏形,当然还要加上一些 WEB 管理和手机平台的支援,就是一整套直播软件。 介绍一些基础概念:RTP RTSP RTMP RTP 实时传输协议,RTMP 以前 flash 用的视频协议,RTSP 目前
阅读全文
摘要:windows 上开发摄像头程序,比较容易的方式是 OpenCV ,几行代码就能显示出来,但是简单的容易搞,有点难度定制化需求的就不这么容易了。所以说还是要从,最基础的 DirectShow 开始搞起,网上找了许久,这方面的资料不多。准备工作:SDK的下载地址:https://www.microso
阅读全文
摘要:RTP标准是采用 UDP 发送,有不少现成的开源库,但不在本文讨论的范围内。UDP 用户数据报,不提供流程,安全传输的功能,但速度快,能提供多播,广播,没有序列号 SEQ ,有 MTU 限制,1500。TCP 传输控制协议,提供流控,SEQ ,重传功能,没有数据长度限制,可以发几 M 。 但在使用中
阅读全文
摘要:RTP 使用 udp 进行数据传输,udp 是不能保证,数据包一定可以到达的,也不提供时序。同时还有 MTU 限制。 RTCP 用来配合 RTP 提供,传输报告,会话建立和退出。 一大批参考规范 有几关键问题: 1,udp 怎么建立 2, 声音定时器多少时间传输入一次 3, 丢包问题 jitter
阅读全文
摘要:Baresip is a modular SIP User-Agent with audio and video support https://github.com/alfredh/baresip PJSIP 代码太大,修改不易。需要一些时间才能。 Baresip 非常小巧的一个 SIP UA 的
阅读全文
摘要:RTP Real-time Transport Protocol 实时传输入协议,使用 udp 做为载体。 SIP Session Initiation Protocol 会话初始化协议,加入,查询,注册,等功能。 VOIP Voice over Internet Protocol 网络电话。 VO
阅读全文
摘要:ffmpeg 是现在开源的全能编解码器,基本上全格式都支持,纯 c 语言作成,相对比其它的 VLC ,GStreamer glib2 写的,开发更简单些,文档很棒,就是 examples 比较少。 常用的功能有: AVFrame 数据帧 AVCodecContext 编解码器AVPacket 数据帧
阅读全文
摘要:采样率: samples 441100 每秒 DAC/ADC 采样的频率,声卡一般还支持 48k 8k 等模式。 通道:channels 2声道 左右声道 也有单声道的声音,5.1 声道 位数: 16bit 采样 DAC/ADC 深度 16bit 就是 65536 种声音层次 pcm 原始的 bit
阅读全文
摘要:在 ARM 2440 开发板上正常播放 16bit 44100 采样率的wav , 为了程序简单,没有判断返回值。 补充,在 ubunto 上也能正常播放。 编译方法: arm-linux-gcc -lasound wplay.c -o wplay 或在 ubuntu 上编译 gcc -lasoun
阅读全文