STM32 浅谈MCU的DMA技术
浅谈MCU的DMA技术
DMA技术简介
DMA外设和存储器(或存储器和存储器)直接通过总线进行数据交换而不经过CPU的技术。在MCU中,DMA是一项十分重要的技术,它可以降低CPU的处理压力,提高外设数据的处理效率。
概念:
- 通道:DMA的通道表示一组外设对存储器的请求,
- 数据对齐:源和目的数据源的地址要对齐,传输宽度对齐
- 仲裁器:协调优先权,多个外设访问同一个存储器时可通过软件设置优先级,优先级相同时由硬件决策
DMA的定义可以看出,这是一种利用总线的技术,降低CPU在数据读取和存储上面的压力,可以执行其他操作。当CPU初始化这个传输动作,传输动作本身是由DMA 控制器来实行和完成。
DMA 控制器和Cortex-M3核共享系统数据总线执行直接存储器数据传输。当CPU和DMA同时访问相同的目标(RAM或外设)时,DMA请求可能会停止 CPU访问系统总线达若干个周期,总线仲裁器执行循环调度,以保证CPU至少可以得到一半的系统总线(存储器或外设)带宽。
stm32F4中的DMA
DMA主要特性
直接存储器访问 (DMA) 用于在外设与存储器之间以及存储器与存储器之间提供高速数据传 输。可以在无需任何 CPU 操作的情况下通过 DMA 快速移动数据。这样节省的 CPU 资源可 供其它操作使用。
DMA 控制器基于复杂的总线矩阵架构,将功能强大的双 AHB 主总线架构与独立的 FIFO 结 合在一起,优化了系统带宽。
两个 DMA 控制器总共有 16 个数据流(每个控制器 8 个),每一个 DMA 控制器都用于管理 一个或多个外设的存储器访问请求。每个数据流总共可以有多达 8 个通道(或称请求)。每 个通道都有一个仲裁器,用于处理 DMA 请求间的优先级。
-
每个数据流有单独的四级 32 位先进先出存储器缓冲区 (FIFO)
-
可供每个数据流选择的通道请求多达 8 个。此选择可由软件配置,允许几个(several,注意不是同时启用)。在
DMA_SxCR
数据流配置寄存器中,CHSEL[2:0]
唯一确定一个通道的使用)外设启动 DMA请求
手册上的框图为:
根据上表可以看出,一个DMA控制器管理8个数据流,每个数据流含8个通道,每个数据流在外设和存储器之间均存在一个FIFO做数据缓冲。
每个数据流都与一个 DMA 请求相关联,然而并不是每个通道都能与一个DMA请求相关联,例如DMA1:
即每个数据流选择一个通道内的DMA请求生效,源传输和目标传输在整个 4 GB 区域(地址在 0x0000 0000 和 0xFFFF FFFF 之间)都可以寻址外设和存储器。
三种传输模式
- 外设到存储器
- 使能这种模式(将
DMA_SxCR
寄存器中的位 EN 置 1)时,每次产生外设请求,数据流都会启动数据源到 FIFO 的传输。 - 达到 FIFO 的阈值级别时,FIFO 的内容移出并存储到目标中,直接模式下每完成一次从外设到 FIFO 的数据传输后,相应的数据立即就会移出并存储到目标中。
- 只有赢得仲裁后,FIFO数据才会被取走
- 使能这种模式(将
- 存储器到外设
- 使能这种模式(将
DMA_SxCR
寄存器中的 EN 位置 1)时,数据流会立即启动传输,从源完全填充 FIFO。 - 每次发生外设请求,FIFO 的内容都会移出并存储到目标中。
- 只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。
- 使能这种模式(将
- 存储器到存储器
- DMA 通道在没有外设请求触发的情况下同样可以工作。
- 通过将
DMA_SxCR
寄存器中的使能位 (EN) 置 1 来使能数据流时,数据流会立即开始填充 FIFO,直至达到阈值级别。达到阈值级别后,FIFO 的内容便会移出,并存储到目标中。 - 只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。
上面说的这三种模式,其实简单的理解下就是数据可以先放入FIFO,等待触发时一次取走或写入,或者直接模式不用等FIFO到达阈值就操作。
DMA的配置与工作流程
DMA可以类比为仓库的货物搬移,因此需要配置以下几个基本的条件:仓库的位置,仓库的单位,仓库的大小,搬的方式。以HAL库的配置方式为例:
- 配置目的地和源,这里可以认为是仓库的位置
DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址
DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
- 配置DMA缓存大小,可以认为是仓库的容量
DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
- 配置外设和存储器地址寄存器是否递增,这里的意思是数据是放在同一个地方还是递增往下放,源和目的单独可配
DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
- 设置外设和存储器数据宽度,仓库的单位,单位不一致放置会出问题。
DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
- 设置DMA工作模式(循环或正常(单次))
DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
- 设置优先级
DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
- 设置模式(外设到存储器,存储器到外设,存储器到存储器)
DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输
以摄像头DCMI的DMA配置为例
首先看代码:
//DCMI DMA配置
//DMA_Memory0BaseAddr:存储器地址 将要存储摄像头数据的内存地址(也可以是外设地址)
//DMA_BufferSize:存储器长度 0~65535
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryInc:存储器增长方式
void DCMI_DMA_Init(u32 DMA_Memory0BaseAddr, u16 DMA_BufferSize, u32 DMA_MemoryDataSize, u32 DMA_MemoryInc)
{
DMA_InitTypeDef DMA_InitStructure;
NVIC_InitTypeDef NVIC_InitStructure;
//RCC_AHB2PeriphClockCmd(RCC_AHB2Periph_DCMI, ENABLE);//DCMI
RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能
DMA_DeInit(DMA2_Stream1);
while (DMA_GetCmdStatus(DMA2_Stream1) != DISABLE) //等待DMA2_Stream1可配置
{
}
/* 配置 DMA Stream */
DMA_InitStructure.DMA_Channel = DMA_Channel_1; //通道1 DCMI通道
DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址为:DCMI->DR
DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输
DMA_Init(DMA2_Stream1, &DMA_InitStructure); //初始化DMA Stream
DMA_ITConfig(DMA2_Stream1,DMA_IT_TC,ENABLE);
NVIC_InitStructure.NVIC_IRQChannel= DMA2_Stream1_IRQn;
NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority=0;
NVIC_InitStructure.NVIC_IRQChannelSubPriority=0;
NVIC_InitStructure.NVIC_IRQChannelCmd=ENABLE;
NVIC_Init(&NVIC_InitStructure); //根据指定的参数初始化VIC寄存器、
}
void DMA2_Stream1_IRQHandler(void)
{
if(DMA_GetFlagStatus(DMA2_Stream1,DMA_FLAG_TCIF1)==SET)//DMA2_Steam1,传输完成标志
{
DMA_ClearFlag(DMA2_Stream1,DMA_FLAG_TCIF1);//清除传输完成中断
datanum++;
}
}
首先是手册,可以使用DCMI的DMA数据流是DMA2的流1和流7的通道1,配置流程:
- while循环等待DMA2完成一次传输后配置DMA2,这里选择的是流1的通道1。
- 之后配置外设地址和存储器地址,传输模式,数据传输量为1,即每次传1个字节。
- DCMI的地址是固定的,因此外设是非增量的,存储器是LCD,地址固定的非增量,长度为16位,外设是RGB565长度选择16位。
- 传输是循环显示的,因此要循环模式,配置FIFO和传输方式,初始化DMA2和中断
使用DMA读写数据与CPU操作的对比
我们做一个小实验,可能不一定准确,即通过DMA方式给USART发送数据进行计时计数,和通过CPU调用USART发送数据的时间进行对比,代码基础是在原子代码上修改而来。
#include "sys.h"
#include "delay.h"
#include "usart.h"
#include "sram.h"
#include "malloc.h"
#include "ILI93xx.h"
#include "led.h"
#include "timer.h"
#include "touch.h"
#include "GUI.h"
#include "GUIDemo.h"
#include "includes.h"
#include "../RESOURCES/logo/logo/Logo.h"
#include "usmart.h"
#include "spi.h"
#include "w25qxx.h"
#include "24cxx.h"
#include "main_tasks.h"
#include "ff.h"
#include "exfuns.h"
#include "fattester.h"
#include "adc.h"
#include "dma.h"
volatile uint32_t gcounter = 0;
const u8 TEXT_TO_SEND[]={"STM32F4 DMA TEST. "};
void extra_while_task(void);
//通用定时器5中断初始化
//arr:自动重装值。
//psc:时钟预分频数
//定时器溢出时间计算方法:Tout=((arr+1)*(psc+1))/Ft us.
//Ft=定时器工作频率,单位:Mhz
//这里使用的是定时器3!
void TIM5_Int_Init(u16 arr, u16 psc)
{
TIM_TimeBaseInitTypeDef TIM_TimeBaseInitStructure;
NVIC_InitTypeDef NVIC_InitStructure;
RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM5, ENABLE); ///使能TIM4时钟
TIM_TimeBaseInitStructure.TIM_Prescaler = psc; //定时器分频
TIM_TimeBaseInitStructure.TIM_CounterMode = TIM_CounterMode_Up; //向上计数模式
TIM_TimeBaseInitStructure.TIM_Period = arr; //自动重装载值
TIM_TimeBaseInitStructure.TIM_ClockDivision = TIM_CKD_DIV1;
TIM_TimeBaseInit(TIM5, &TIM_TimeBaseInitStructure);
TIM_ITConfig(TIM5, TIM_IT_Update, ENABLE); //允许定时器3更新中断
TIM_Cmd(TIM5, ENABLE); //使能定时器3
NVIC_InitStructure.NVIC_IRQChannel = TIM5_IRQn; //定时器4中断
NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority = 0x02; //抢占优先级1
NVIC_InitStructure.NVIC_IRQChannelSubPriority = 0x03; //子优先级3
NVIC_InitStructure.NVIC_IRQChannelCmd = ENABLE;
NVIC_Init(&NVIC_InitStructure);
}
//定时器5中断服务函数
void TIM5_IRQHandler(void)
{
if (TIM_GetITStatus(TIM5, TIM_IT_Update) == SET) //溢出中断
{
gcounter++;
}
TIM_ClearITPendingBit(TIM5, TIM_IT_Update); //清除中断标志位
}
//DMAx的各通道配置
//这里的传输形式是固定的,这点要根据不同的情况来修改
//从存储器->外设模式/8位数据宽度/存储器增量模式
//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7
//chx:DMA通道选择,@ref DMA_channel DMA_Channel_0~DMA_Channel_7
//par:外设地址
//mar:存储器地址
//ndtr:数据传输量
void MYDMA_Config(DMA_Stream_TypeDef *DMA_Streamx,u32 chx,u32 par,u32 mar,u16 ndtr)
{
DMA_InitTypeDef DMA_InitStructure;
if((u32)DMA_Streamx>(u32)DMA2)//得到当前stream是属于DMA2还是DMA1
{
RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能
}else
{
RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA1,ENABLE);//DMA1时钟使能
}
DMA_DeInit(DMA_Streamx);
while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){}//等待DMA可配置
/* 配置 DMA Stream */
DMA_InitStructure.DMA_Channel = chx; //通道选择
DMA_InitStructure.DMA_PeripheralBaseAddr = par;//DMA外设地址
DMA_InitStructure.DMA_Memory0BaseAddr = mar;//DMA 存储器0地址
DMA_InitStructure.DMA_DIR = DMA_DIR_MemoryToPeripheral;//存储器到外设模式
DMA_InitStructure.DMA_BufferSize = ndtr;//数据传输量
DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable;//外设非增量模式
DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc_Enable;//存储器增量模式
DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Byte;//外设数据长度:8位
DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize_Byte;//存储器数据长度:8位
DMA_InitStructure.DMA_Mode = DMA_Mode_Normal;// 使用普通模式
DMA_InitStructure.DMA_Priority = DMA_Priority_Medium;//中等优先级
DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Disable;
DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full;
DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single;//存储器突发单次传输
DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single;//外设突发单次传输
DMA_Init(DMA_Streamx, &DMA_InitStructure);//初始化DMA Stream
}
//开启一次DMA传输
//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7
//ndtr:数据传输量
void MYDMA_Enable(DMA_Stream_TypeDef *DMA_Streamx,u16 ndtr)
{
DMA_Cmd(DMA_Streamx, DISABLE); //关闭DMA传输
while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){} //确保DMA可以被设置
DMA_SetCurrDataCounter(DMA_Streamx,ndtr); //数据传输量
DMA_Cmd(DMA_Streamx, ENABLE); //开启DMA传输
}
int main(void)
{
u8 count = 0;
uint8_t buffer[256];
u8 res = 0;
POINT_COLOR = DARKBLUE;
delay_init(168); //延时初始化
NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2); //中断分组配置
uart_init(115200); //串口波特率设置
TFTLCD_Init(); //初始化LCD
KEY_Init();
LED_Init(); //LED初始化
TIM3_Int_Init(10000 - 1, 16800 - 1); //10Khz计数,1秒钟中断一次
//不需要经过OS的任务
extra_while_task();
}
#define SEND_BUF_SIZE 8000
void extra_while_task(void)
{
u32 i = 0;
u8 t=0,mask=0,j=sizeof(TEXT_TO_SEND);
u8 SendBuff[SEND_BUF_SIZE]; //发送数据缓冲区
if(1)
{
for(i=0;i<SEND_BUF_SIZE;i++)//填充ASCII字符集数据
{
if(t>=j)//加入换行符
{
if(mask)
{
SendBuff[i]=0x0a;
t=0;
}else
{
SendBuff[i]=0x0d;
mask++;
}
}else//复制TEXT_TO_SEND语句
{
mask=0;
SendBuff[i]=TEXT_TO_SEND[t];
t++;
}
}
Adc_Init(); //初始化ADC
TIM5_Int_Init(10 - 1, 16800 - 1); //10Khz计数,10个us中断一次
while(1)
{
//Get_Adc_Average(ADC_Channel_5,20);//获取通道5的转换值,20次取平均
//按DMA发送
MYDMA_Config(DMA2_Stream7,DMA_Channel_4,(u32)&USART1->DR,(u32)SendBuff,SEND_BUF_SIZE);//DMA2,STEAM7,CH4,外设为串口1,存储器为SendBuff,长度为:SEND_BUF_SIZE.
USART_DMACmd(USART1,USART_DMAReq_Tx,ENABLE); //使能串口1的DMA发送
gcounter = 0;
MYDMA_Enable(DMA2_Stream7,SEND_BUF_SIZE); //开始一次DMA传输!
while(1)
{
if(DMA_GetFlagStatus(DMA2_Stream7,DMA_FLAG_TCIF7)!=RESET)//等待DMA2_Steam7传输完成
{
DMA_ClearFlag(DMA2_Stream7,DMA_FLAG_TCIF7);//清除DMA2_Steam7传输完成标志
printf("dma over: %d\r\n",gcounter);
break;
}
}
//按CPU发送
printf("cpu start\r\n");
gcounter = 0;
for(i = 0;i<SEND_BUF_SIZE;i++)
{
while ((USART1->SR & 0X40) == 0); //循环发送,直到发送完毕
USART1->DR = (u8)SendBuff[i];
}
printf("cpu over: %d\r\n",gcounter);
while(1);//halt
}
}
}
实验结果,DMA的计数是355:
USART直接发送是392:
发送的数据量是8000个字节,相当于8k,当数据量更大时DMA的优势就很明显了。