随笔分类 -  音视频处理

audio video encode decode ffmpeg opencv
摘要:起因是,现在开始做翻译,发现这个软件在 WIN 上面显示很模糊,没有适配 高 DPI 显示,看了 从 2014年后,官方就不在发布新版本了,为了自己用着舒服,也为了广大的字幕影视爱好者。 所以 fork 了项目,开始维护这个项目:https://github.com/nejidev/AegisubX 阅读全文
posted @ 2022-09-24 11:42 宁次 阅读(177) 评论(0) 推荐(0) 编辑
摘要:1 首先升级用 vs2015 来编译开发 windows 下的程序,因为更好的兼容 c99 语法,不用改很多东西。 libx264 的编译: 在 ubuntu 下的确非常容易,windows 平台有点麻烦,需要用到 MYSY2 ,现在这些开源项目,有的都不提供 vs 的工程,哪怕提供个 cmake 阅读全文
posted @ 2020-03-19 20:45 宁次 阅读(2284) 评论(0) 推荐(0) 编辑
摘要:上一篇对摄像头预览,拍照做了大概的介绍,现在已经可以拿到视频帧了,在加上 RTSP 实现,就是直播的雏形,当然还要加上一些 WEB 管理和手机平台的支援,就是一整套直播软件。 介绍一些基础概念:RTP RTSP RTMP RTP 实时传输协议,RTMP 以前 flash 用的视频协议,RTSP 目前 阅读全文
posted @ 2020-03-14 12:41 宁次 阅读(2574) 评论(0) 推荐(0) 编辑
摘要:windows 上开发摄像头程序,比较容易的方式是 OpenCV ,几行代码就能显示出来,但是简单的容易搞,有点难度定制化需求的就不这么容易了。所以说还是要从,最基础的 DirectShow 开始搞起,网上找了许久,这方面的资料不多。准备工作:SDK的下载地址:https://www.microso 阅读全文
posted @ 2020-03-11 21:04 宁次 阅读(1406) 评论(0) 推荐(0) 编辑
摘要:RTP标准是采用 UDP 发送,有不少现成的开源库,但不在本文讨论的范围内。UDP 用户数据报,不提供流程,安全传输的功能,但速度快,能提供多播,广播,没有序列号 SEQ ,有 MTU 限制,1500。TCP 传输控制协议,提供流控,SEQ ,重传功能,没有数据长度限制,可以发几 M 。 但在使用中 阅读全文
posted @ 2019-02-02 18:05 宁次 阅读(3221) 评论(0) 推荐(0) 编辑
摘要:RTP 使用 udp 进行数据传输,udp 是不能保证,数据包一定可以到达的,也不提供时序。同时还有 MTU 限制。 RTCP 用来配合 RTP 提供,传输报告,会话建立和退出。 一大批参考规范 有几关键问题: 1,udp 怎么建立 2, 声音定时器多少时间传输入一次 3, 丢包问题 jitter 阅读全文
posted @ 2018-11-18 10:03 宁次 阅读(2789) 评论(0) 推荐(0) 编辑
摘要:Baresip is a modular SIP User-Agent with audio and video support https://github.com/alfredh/baresip PJSIP 代码太大,修改不易。需要一些时间才能。 Baresip 非常小巧的一个 SIP UA 的 阅读全文
posted @ 2018-11-18 09:56 宁次 阅读(4884) 评论(0) 推荐(0) 编辑
摘要:RTP Real-time Transport Protocol 实时传输入协议,使用 udp 做为载体。 SIP Session Initiation Protocol 会话初始化协议,加入,查询,注册,等功能。 VOIP Voice over Internet Protocol 网络电话。 VO 阅读全文
posted @ 2018-11-10 21:33 宁次 阅读(1331) 评论(0) 推荐(0) 编辑
摘要:ffmpeg 是现在开源的全能编解码器,基本上全格式都支持,纯 c 语言作成,相对比其它的 VLC ,GStreamer glib2 写的,开发更简单些,文档很棒,就是 examples 比较少。 常用的功能有: AVFrame 数据帧 AVCodecContext 编解码器AVPacket 数据帧 阅读全文
posted @ 2018-11-10 21:17 宁次 阅读(5972) 评论(0) 推荐(0) 编辑
摘要:采样率: samples 441100 每秒 DAC/ADC 采样的频率,声卡一般还支持 48k 8k 等模式。 通道:channels 2声道 左右声道 也有单声道的声音,5.1 声道 位数: 16bit 采样 DAC/ADC 深度 16bit 就是 65536 种声音层次 pcm 原始的 bit 阅读全文
posted @ 2018-10-27 21:31 宁次 阅读(4686) 评论(0) 推荐(2) 编辑
摘要:在 ARM 2440 开发板上正常播放 16bit 44100 采样率的wav , 为了程序简单,没有判断返回值。 补充,在 ubunto 上也能正常播放。 编译方法: arm-linux-gcc -lasound wplay.c -o wplay 或在 ubuntu 上编译 gcc -lasoun 阅读全文
posted @ 2017-05-15 16:32 宁次 阅读(1657) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示