【Alsa】播放声音和录音详细流程
linux中,无论是oss还是alsa体系,录音和放音的数据流必须分析清楚。先分析alsa驱动层,然后关联到alsa库层和应用层。
二,链接分析:
1)链路一
usr/src/linux-source-3.0.0/sound/core/pcm_native.c文件中注册部分.mmap = snd_pcm_mmap调用snd_pcm_mmap_data(substream, file, area);
该方法中进一步调用substream->ops->mmap(substream, area);
根据./soc/pxa/pxa3xx-pcm.c文件中.mmap = pxa3xx_pcm_mmap,可知dma_mmap_writecombine(, ,runtime->dma_addr,);函数被调用。
soc/pxa/pxa3xx-pcm.c文件中pxa3xx_pcm_hw_params()函数会创建链表,根据
dma_buff_phys = runtime->dma_addr;
dma_desc->dsadr = dma_buff_phys;可知runtime->dma_addr为dma内存端地址,且此地址由alsa库层传递进来。又根据
dma_desc->dtadr = prtd->params->dev_addr和soc/pxa/pxa3xx-ac97.c文件中
.dev_addr = __PREG(PCDR),可知dma外设端地址为ac97控制器中fifo读写寄存器PCDR。至此,第一条链路建立完毕:FIFO通过DMA和内存交互。
2)链路二
ac97接口或者i2s(Inter—IC Sound)或者pcm接口可以将cpu和codec(wm9714/alc5620/alc5621)连接起来。
配置好格式:
pcm接口必须配置采样率、采样位数、通道数和传送格式;
i2s接口必须配置采样率、采样位数、通道数和对齐方式;
ac97接口比较灵活,可以认为cpu这端不用配置,只需要在codec端配置就行了。当然,电源、时钟、IO任何数字芯片都得配置。
最后不能混淆数据接口和控制接口的慨念,i2s和pcm只能传输音频数据,访问codec的寄存器必须通过i2c等控制接口,ac97接口分时传输控制和数据。
codec中的adc/dac通过ac97等接口同cpu的fifo交互数据。第二条链路建立完毕。
3)链路三
alsa_lib源码中pcm.c文件中snd_pcm_readi(,buffer,size)调用pcm_local.h文件中_snd_pcm_readi(,buffer,size);
进一步调用pcm->fast_ops->readi(pcm->fast_op_arg, buffer, size);
根据pcm_hw.h文件中.readi = snd_pcm_hw_readi可知,ioctl(fd, SNDRV_PCM_IOCTL_READI_FRAMES, &xferi);被调用。
内核中,根据/soc/pcm_native.c文件中.unlocked_ioctl = snd_pcm_capture_ioctl,可知snd_pcm_capture_ioctl1被调用,根据SNDRV_PCM_IOCTL_READI_FRAMES参数可知snd_pcm_lib_read(substream, xferi.buf, xferi.frames);被调用,
最终snd_pcm_lib_read1(,,,,snd_pcm_lib_read_transfer)被调用。根据transfer被调用可知snd_pcm_lib_read_transfer被调用,然后调用copy_to_user(buf, hwbuf, frames_to_bytes(runtime, frames)),可知,将dma端内存的数据拷贝到alsa_lib提供的一个指针所指的内存,alsa库函数snd_pcm_readi、snd_pcm_writei实现了内存到内存的交互,或者近似地认为是内存到音频文件的交互。至此最后一条链路建立完毕。
三,执行分析:
录音:mic phone接到codec,经过adc变成数字信号,经过链路二中ac97等接口存储到cpu的fifo中,经过链路一中的dma传输存储到内存,经过链路三中alsa_lib中snd_pcm_readi接口传给录音软件,经过编码,进而形成音频文件。
放音:播放软件将音频文件解码,并通过链路三中snd_pcm_writei接口逐渐传递到和dma相关的内存,经过链路二中dma传递给cpu的fifo,再经过ac97等接口传递给dac,最后传给连接在codec上的speaker。
四,总结:
1)ac97(声卡标准)数据传输颇复杂,分时复用,cpu端fifo和codec端adc/dac关系要对应好。比如,cpu端的pcm left fifo占用slot3(CPU中扩展插槽),那么adc(Analog to Digital 模数变换)只有配置成slot3才能把数据传递给它,如果配置成slot6,那就传给cpu的mic in fifo了。录音单声道通常选择slot6,录音双声道通常两个adc分别选择slot3和slot4。
2)wav音频文件大小计算:要测试录音是否丢祯,就必然要计算文件大小,通常的方法是:根据录音时间,用公式:
录音时间(单位s)x采样率x(采样位数/8)x通道数。
比如:录音时间5秒,采样率8kHz,位数16位,通道数1,那么5x8000x(16/8)x1=80k,实际的wav文件大小稍大于80k就对了。还有一种计算文件大小的方法:通常音频系统要用dma,也会用到dma中断,可以在dma中断中打印计数,次数xdma中断周期字节就行了。
3)数据交换的大小问题:
链路一中DMA传输必须和FIFO的特性匹配:若FIFO位宽是16位,深度是16,并且半满时向DMA发出请求(握手),则链表式DMA必须配置成传输位宽16位,1次突发16字节,才能保证不丢失位数和数据个数。
链路二中cpu端FIFO位数要和codec端adc/dac采样位数匹配,i2s/pcm接口可以配置成一样的值,比如16位,ac97接口复杂一点,cpu端不用配置,那么采样位数是多少呢?若cpu端fifo一个声道位宽16位,codec端adc/dac位宽18位,ac97通道20位,则传输到fifo端就被截取到有效的16位,整体采样位数16位,adc/dac的性能没有充分发挥而已。
链路三中snd_pcm_readi、snd_pcm_writei函数第三个参数表示读写数据的大小,单位是帧,不是字节。双声道16位格式一帧大小为4字节。