随笔分类 - 数字音视频技术
摘要:海康萤石C6C摄像头RTSP连接方式 1. 概述 通过RTSP获取海康萤石C6C摄像头的码流。 测试型号为:萤石C6C 2K+ 星光增强版 400万极清 2. 开启RTSP连接 萤石摄像头默认是没有激活RTSP连接的,需要手动开启,开启步骤如下: 1. 打开萤石官方的App - "萤石云视频",在底
阅读全文
摘要:原因 Nvidia的显卡,接HDMI线来输画面,驱动会把你的电脑萤幕辨识为电视TV,什么是HDMI线?就是这个: 接HDMI辨识成电视TV会怎麼样呢?此时的灰阶会受限在RGB 16-235,而不是Full Range RGB 0-255,这就是很多人用了N卡后,发现画面会泛白、黑色没这麼黑的原因。
阅读全文
摘要:一. 概述 1.1 来源及其作用 为什么要使用码率控制?这个问题是由现实产生的。在传输压缩编码视频的时候,必须要考虑两个问题:视频质量和传输带宽,如果带宽大,肯定要尽可能传输质量更好的视频;如果带宽低,则需要提高压缩比,减小码流;如果带宽动态变化,那么码流也需要动态改变来适应带宽,总之,码流与带宽紧
阅读全文
摘要:一. 基本组成 MP3文件中的ID3v2 的基本组成如下: 可以看到,基本分为三部分:标签头,帧头,帧标识三部分。 二. 标签头 在文件的首部顺序记录 10 个字节的 ID3V2.3 的头部。数据结构如下: typedef ID3_HEADER { uint8_t id3_identifier[3]
阅读全文
摘要:准备工作: 1. VLC。一个流行的音视频播放器,除了能够播放音视频之外,还可以作为本地的推流服务器。下载地址: https://www.videolan.org/ 2. 一个mp4文件。目的是能够看到该mp4文件的内容,最好选一个时长稍微长一点的视频,否则不容易观察到效果。 全部工作在本地即可完成
阅读全文
摘要:最近项目里有一个奇怪的需求:为编码完成后的AAC文件添加ID3v2 header。这个ID3v2是个什么东西呢?简单的说就是一系列元数据,里面存储了一些跟歌曲相关的信息(比如:演唱者、歌曲名、备注等等),比如说我在网络上下载了一首歌曲,在windows的文件浏览器下有时就能看到这首歌曲的一些元数据信
阅读全文
摘要:ADTS是Audio Data Transport Stream的简称。 是AAC音频文件常见的传输格式。 有的时候当你编码AAC裸流的时候,会遇到写出来的AAC文件并不能在PC和手机上播放,很大的可能就是AAC文件的每一帧里缺少了ADTS头信息文件的包装拼接。只需要加入头文件ADTS即可。一个AA
阅读全文
摘要:IP数据报有首部和数据两部分组成的,首部的前一部分是固定长度20字节,是所有IP数据报必须具有的。首部包括:总长度、标识、MF、DF、片偏移。 一. 基本概念 数字信号实际传送的是数据流,一般数据流包括以下三种: (1)ES流(Elementary Stream): ES--Elementary S
阅读全文
摘要:1. 采样率 采样率(sampleRate), 采样率就是每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示,说的简单一点就是每秒在每个声道上采样的个数。采样就是把模拟信号数字化的过程,不仅仅是音频需要采样,所有的模拟信号都需要通过采样转换为可以用0101来表示的数字信号,示意图如
阅读全文
摘要:当我们在互联网上浏览内容时,总会看到各种各样的图片,比如在你刷IT之家时,所看到的绝大部分图片都是JPG格式的,这种图片格式之所以在互联网上广受欢迎,是因为相比于PNG、GIF格式,它的体积相对较小,毕竟在上网时,用户希望图片加载得越快越好。 JPG格式的图片体积相对较小,是因为它采用了一系列的压缩
阅读全文
摘要:在WIndows下的画图工具中绘制完图片后,另存为的时候有以下几种选项: 这些分别代表什么含义呢? 单色位图: 每个像素最多可以表示2种颜色,只需要使用长度为1的二进制位来表示,因此每个像素占1/8byte 16色位图: 每个像素最多可以表示16种颜色,所以只需要长度为4的二进制表示,因此每个像素占
阅读全文
摘要:混音器是处理音频的一种装置,分为软件类型和硬件类型。由于原理不同,软件类型的混音器和硬件类型的混音器的应用也大不相同,前者主要用于音频处理,后者主要用于音响设置。 软件类型的混音器 软件类型的混音器,是将多个音频文件、线路输入音频信号混音后,合成单独的音频文件; 它的作用主要是对不同的音频频率进行不
阅读全文
摘要:不仅限于FFmpeg, 音频采样所得的PCM都含有三个要素:声道(channel)、采样率(sample rate)、样本格式(sample rate)。 声道 当人听到声音时,能对声源进行定位,那么通过在不同的位置设置声源,就可以造就出更好的听觉感受,如果配合影像进行音频位置的调整,则会得到更好的
阅读全文
摘要:所谓音频信息,就是一个点随着时间不断在一个轴(振膜的垂直方向)上振动的情况。 所谓音频信息,就是一个点随着时间不断在一个轴(振膜的垂直方向)上振动的情况。 所谓音频信息,就是一个点随着时间不断在一个轴(振膜的垂直方向)上振动的情况。 当我们假设振膜的位置可以被这根轴上的任意一个点A表示时,则A的位置
阅读全文
摘要:在图像数据传输和显示的过程中有一个不常用的参数:间距。 间距的名称: 它有很多的别名,在使用d3d显示的时候,它叫pitch;在用ffmpeg解码的时候,它叫linesize; 在用ffmpeg转换格式的时候,它叫stride。这篇文章中统一以间距来表示。 间距为什么出现: 这个参数看起来似乎没什么
阅读全文
摘要:概述 之前介绍了YUV码流的采样格式,下面分析下YUV码流的存储格式,YUV码流的存储格式与采样格式息息相关。总的来讲,YUV存储格式主要分为两种: planar 平面格式 指先连续存储所有像素点的 Y 分量,然后存储 U 分量,最后是 V 分量。 packed 打包模式 指每个像素点的 Y、U、V
阅读全文
摘要:一. AV_TIME_BASE 经常在FFmpeg的代码中看到一个奇怪的单位 AV_TIME_BASE ,比如 AVFormatContext 结构体中就有这样一个字段: duration ,它在FFmpeg中的解释如下: /** * Duration of the stream, in AV_TI
阅读全文
摘要:一.视频传输原理 视频是利用人眼视觉暂留的原理,通过播放一系列的图片,使人眼产生运动的感觉。单纯传输视频画面,视频量非常大,对现有的网络和存储来说是不可接受的。为了能够使视频便于传输和存储,人们发现视频有大量重复的信息,如果将重复信息在发送端去掉,在接收端恢复出来,这样就大大减少了视频数据的文件,因
阅读全文
摘要:一.视频压缩 1.1 为什么需要压缩视频? 假设一个2小时未压缩的高清视频,1920×1080p的电影,我们来计算一下他的存储容量。先介绍一下帧率(frame rate或者是 FPS)概念,也就是每秒传输图片的帧数,也可以理解为图形处理器每秒能够刷新几次。由于人眼的特性-视觉暂留,帧率要在20以上才
阅读全文
摘要:比特率 比特率是指每秒传送的比特(bit)数。单位为bps(Bit Per Second),比特率越高,传送的数据越大。在视频领域,比特率常翻译为码率。 在数字多媒体领域,比特率是单位时间播放连续的媒体如压缩后的音频或视频的比特数量。而比特就是二进制里面最小的单位,要么是0,要么是1。比特率与音、视
阅读全文