MFC录制音频和播放音频

一、录制音频

　　在windows中提供了相应的API函数（waveIn这个族的函数）实现录音功能；在使用这些函数时，一定要引入相应的头文件

#include <windows.h>

#include <Mmsystem.h>

#pragram comment(lib, "Winmm.lib")

1、在开始录音之前，需要首先定义音频的相关信息：使用WAVEFORMATEX结构，设置相关的音频流信息。以下是MSDN中的定义：

typedef struct 
{
WORD wFormatTag;        // 波形音频的格式，一般情况下设置为WAVE_FORMAT_PCM
WORD nChannels;         // 音频声道的数量。可以是1或者2（现在电脑基本上都是左右两个声道，因此一般设置为2）
DWORD nSamplesPerSec;   // 每个声道播放和接收的音频的样本频率（一般的频率为8khz, 11.025khz, 22.05khz,44.1khz）
DWORD nAvgBytesPerSec;  // 平均的数据传输率，单位为byte/s
WORD nBlockAlign;       // 以字节为单位的块对齐的大小，一般为：（nChannels * wBitsPerSample）/8
WORD wBitsPerSample;    // 根据wFormatTag设置的类型，设置采样率的大小，如果设置为WAVE_FORMAT_PCM，则大小为8的整倍数
WORD cbSize;            // 额外的空间，一般不需要，设置为0
}WAVEFORMATEX, *PWAVEFORMATEX;

定义一个WAVEFORMATEX对象，根据自己的要求设置音频流的信息，如下：

WAVEFORMATEX waveFormat;
waveFormat.nSamplesPerSec = 44100;
waveFormat.wBitsPerSample = 16;
waveFormat.nChannels = 2;
waveFormat.cbSize = 0;
waveFormat.wFormatTag = WAVE_FORMAT_PCM;
waveFormat.nBlockAlign = (waveFormat.wBitsPerSample * waveFormat.nChannels)/8;
waveFormat.nAvgBytesPerSec = waveFormat.nBlockAlign * waveFormat.nSamplesPersec;

2、当音频流信息设置完成后，接下来需要启动录音设备：使用waveInOpen函数。

waveInOpen函数原型为：

WINMMAPI
MMRESULT
WINAPI
waveInOpen(
    _Out_opt_ LPHWAVEIN phwi,　　　　// 一个特定的录音设备指针，如果设备启动成功，该参数的值将会被赋值为启动的设备
    _In_ UINT uDeviceID,　　　　　　　// 需要启动的设备ID。一般不会手动指定某个设备，而是通过设置WAVE_MAPPER，通过系统查找可用设备
    _In_ LPCWAVEFORMATEX pwfx,   　　// 音频流信息对象的指针。这个参数就是我们第一步设置的对象
    _In_opt_ DWORD_PTR dwCallback,　 // 录音消息的处理程序，可以设置一个函数、事件句柄、窗口句柄、一个特定的线程。也就是说录音消息产生后，由这个参数对应的值来处理该消息。包括关闭录音、缓冲区已满、开启设备
    _In_opt_ DWORD_PTR dwInstance,   // dwCallback参数的参数列表
    _In_ DWORD fdwOpen               // 打开设备的标识符。对应dwCallback，如果第四个参数设置为函数，则这个参数的值为CALLBACK_FUNCTION;如果为线程，则为CALLBACK_THREAD
    );

注意：要想该函数成功执行，必须在开始之前，有录音设备的存在（台式电脑一定要插入麦克风才可以被检测到）。

3、当录音设备启动后，接下来需要声明两个缓冲区和两个缓冲区头部结构体WAVEHDR对象，缓冲区用来存放录音音频，并用缓冲区初始化头部对象：

INT bufSize = 512;

BYTE *pBuffer1 = new BYTE[bufSize];
if (pBuffer1 == NULL) return;
memset(pBuffer1, 0, bufSize);

WAVEHDR wHdr1;
wHdr1.lpData = (LPSTR)pBuffer1;
wHdr1.dwBufferLength = bufSize;
wHdr1.dwBytesRecorded = 0;
wHdr1.dwUser = 0;
wHdr1.dwFlags = 0;
wHdr1.dwLoops = 1;

BYTE *pBuffer2 = new BYTE[bufSize];
if (pBuffer2 == NULL) return;
memset(pBuffer2,0, bufSize);

WAVEHDR wHdr2;
wHdr2.lpData = (LPSTR)pBuffer2;
wHdr2.dwBufferLength = bufSize;
wHdr2.dwBytesRecorded = 0;
wHdr2.dwUser = 0;
wHdr2.dwFlags = 0;
wHdr2.dwLoops = 1;

WAVEHDR对象定义如下：

typedef struct
{
LPSTR lpData;          // 缓冲区存放的内容
DWORD dwBufferLength;  // 缓冲区的大小
DWORD dwButesRecorded; // 缓冲区中存放的字节数
DWORD_PTR dwUser; 
DWORD dwFlags;
DWORD dwLoops;
struct wavehdr_tag *lpNext;
DWORD_PTR reserved;
} WAVEHDR;

4、接下来将这两个头部对象，加入到准备的录音缓冲区中。该过程使用waveInPrepareHeader函数。

waveInPrepareHeader(hWaveIn, &wHdr1, sizeof(WAVEHDR)); // 准备第一个波形数据块用于录音
waveInPrepareHeader(hWaveIn, &wHdr2, sizeof(WAVEHDR)); // 准备第二个数据块用于录音

　waveInPrepareHeader的第一个参数表示：录音设备句柄；第二个参数表示：录音的缓冲区对象；第三个参数表示：录音缓冲区结构体的大小。

5、当准备好录音缓冲区，就可以将录音缓冲区加入到指定的录音设备中。该步骤使用waveInAddBuffer函数：

waveInAddBuffer(hWaveIn, &wHdr1, sizeof(WAVEHDR)); // 指定波形数据块为录音输入缓存
waveInAddBuffer(hWaveIn, &wHdr2, sizeof(WAVEHDR)); // 指定波形数据块为录音缓存

分别将缓冲区1和2设置为录音缓冲区。这些缓冲区将被加入到录音缓冲队列中，缓冲区循环执行。

6、开始录音，使用waveInStart函数

waveInStart(hWaveIn); // 开始录音

这个函数的意思就是，通过hWaveIn录音设备，将波形音频放入录音缓冲区（前面已经指定了缓冲区）

7、当缓冲区满时，waveInStart函数，就会自动的调用waveInOpen函数中指定的函数/窗体/事件；通过该函数，用户可以将缓冲区的波形文件发给其它的用户，也可以将缓冲区的文件保存起来，即就是用户对缓冲区的拷贝。声卡自动将音频缓冲区从缓冲队列中删除。拷贝完成后，就将该缓冲区以及对应的音频头文件初始化，并通过waveInAddBuffer函数重新加入录音缓冲队列中。

DWORD CIP_PHONEDlg::MicCallBack(HWAVEIN hWaveIn, UINT uMsg, DWORD dwInstance, DWORD dwParam1, DWORD dwParam2)
{
    // 所有的这些录音缓冲区都是由录音函数自动触发的，开发这不需要自己触发
    CIP_PHONEDlg *pwnd = (CIP_PHONEDlg*)dwInstace;     // 表示录音的窗体
    PWAVEHDR whd = (PWAVEHDR)dwParam1; // 录音的头结构体对象
    switch(uMsg)
   {
    case WIM_OPEN: // 打开录音设备，这里不做处理
            break;
   case WIM_DATA: // 表示缓冲区已满，我们将信息写入一个pcm文件
         {
             // 保存数据
             pwnd->pf = fopen(pwnd->soundName, "ab+"); // 一定要以二进制数据写入，否则录音的音频会出现杂音
             Sleep(1000);  // 等待声音录制1s
             fwrite(whd->lpData, 1, whd->dwBufferLength, pwnd->pf);
             if (pwnd->isGetSound)
             {
                  waveInAddBuffer(hWaveIn, whd, sizeof(WAVEHDR));
              }
              fclose(pwnd->pf);
         }
         break;
    case WIM_CLOSE: // 停止录音
       {
           waveInStop(hWaveIn);
           waveInReset(hWaveIn);     
           waveInClose(hWaveIn);
        }
        break;
     default:
         break;
   } 
   return 0;
}

8、停止录音，使用waveInClose函数执行该操作

delete [] pBuffer1->lpData;
delete [] pBuffer2->lpData;
waveInClose(hWaveIn); // 停止录音

停止录音时，将会触发WIM_CLOSE消息。

在这个过程中首先执行waveInStop函数：表示禁止向输入缓冲区中输入波形数据；

然后执行waveInReset函数：表示停止波形数据的输入并且将当前的位置位0，将所有挂起的输入缓冲区设置为完成，并返回给应用程序（其实就是一个复位操作）

最后执行waveInClose函数：表示关闭录音设备。

posted @ 2017-02-21 17:37 木缥缈阅读(3072) 评论(0) 编辑收藏举报

刷新页面返回顶部

木缥缈

MFC录制音频和播放音频

公告