typedefstruct {
WORD wFormatTag;
WORD nChannels;
DWORD nSamplesPerSec;
DWORD nAvgBytesPerSec;
WORD nBlockAlign;
WORD wBitsPerSample;
WORD cbSize;
}WAVEFORMATEX;
以上为WaveFormatEx的C语言定义
在C#中可以写成:
[StructLayout(LayoutKind.Sequential)]
publicclassWaveFormatEx
{
privateshortwFormatTag;
privateshortnChannels;
privateintnSamplesPerSec;
privateintnAvgBytesPerSec;
privateshortnBlockAlign;
privateshortwBitsPerSample;
}
由于在PInvoke时传递的都是该结构的指针,所以为了方便编码这里就把它定义成类(若定义成struct的话则要做一些取地址再传指针的麻烦操作)。
这里也可以看出,class被称为引用类型,在作为参数传递时它就是以指针传递的
且由于要与非托管代码交互,所以要用固定内存布局[StructLayout(LayoutKind.Sequential)]来标记它。
WORD - typedef unsigned short WORD; 16位无符号整数
DWORD - typedef unsigned long DWORD; 32位无符号整数
既然都是无符号的,WORD就应写成UInt16(ushort).DWORD就应写成UInt32(uint).
那这里为何要用short 及int?
我的个人建议:在平台交换时,应尽量使用CLS兼容的数据类型。并且,只要位宽一样,数据的表示总是对的,因为PINVOKE会自动调用转换,且转换的开销很小乃至无开销(熟悉计算机基础架构的人很容易理解无开销的意思,具体有没有转换要看.net是怎么设计的,我不了解)。
wFormatTag是格式标签,几乎都是已定义好的一些常数
如pcm格式是0
Adpcm是1
杜比Ac2 是30
有好多。过后我会给出
其中最常用的就是PCM 和ADPCM
nChannels是声道数
nSamplesPerSec是 Samples per second ,即每秒的样本数量,也就是传说中的速率、采样率。每秒有多少个样本的确可以反应“率”的概念
nAvgBytesPerSec平均传输速率。如果是PCM的话,则该值等于nSamplesPerSec除以nBlockAlign。
nBlockAlign 数据块调整度(块对其,字节),其值为通道数*样本的数据位值/8,播放软件需要与一次处理多个该值大小的字节数据,以将其中于缓冲区调整
wBitsPerSample 每个样本的位数。表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言样本大小都一样
cbSize 该结构(类)的大小
常见的Format Tag:
WaveFormatEx 完整定义: