STM32 浅谈MCU的DMA技术

浅谈MCU的DMA技术

DMA技术简介

DMA外设和存储器(或存储器和存储器)直接通过总线进行数据交换而不经过CPU的技术。在MCU中,DMA是一项十分重要的技术,它可以降低CPU的处理压力,提高外设数据的处理效率。

概念:

  • 通道:DMA的通道表示一组外设对存储器的请求,
  • 数据对齐:源和目的数据源的地址要对齐,传输宽度对齐
  • 仲裁器:协调优先权,多个外设访问同一个存储器时可通过软件设置优先级,优先级相同时由硬件决策

DMA的定义可以看出,这是一种利用总线的技术,降低CPU在数据读取和存储上面的压力,可以执行其他操作。当CPU初始化这个传输动作,传输动作本身是由DMA 控制器来实行和完成。

DMA 控制器和Cortex-M3核共享系统数据总线执行直接存储器数据传输。当CPU和DMA同时访问相同的目标(RAM或外设)时,DMA请求可能会停止 CPU访问系统总线达若干个周期,总线仲裁器执行循环调度,以保证CPU至少可以得到一半的系统总线(存储器或外设)带宽。

stm32F4中的DMA

DMA主要特性

直接存储器访问 (DMA) 用于在外设与存储器之间以及存储器与存储器之间提供高速数据传 输。可以在无需任何 CPU 操作的情况下通过 DMA 快速移动数据。这样节省的 CPU 资源可 供其它操作使用。

DMA 控制器基于复杂的总线矩阵架构,将功能强大的双 AHB 主总线架构与独立的 FIFO 结 合在一起,优化了系统带宽。

两个 DMA 控制器总共有 16 个数据流(每个控制器 8 个),每一个 DMA 控制器都用于管理 一个或多个外设的存储器访问请求。每个数据流总共可以有多达 8 个通道(或称请求)。每 个通道都有一个仲裁器,用于处理 DMA 请求间的优先级。

  • 每个数据流有单独的四级 32 位先进先出存储器缓冲区 (FIFO)

  • 可供每个数据流选择的通道请求多达 8 个。此选择可由软件配置,允许几个(several,注意不是同时启用)。在DMA_SxCR数据流配置寄存器中,CHSEL[2:0]唯一确定一个通道的使用)外设启动 DMA请求

手册上的框图为:

根据上表可以看出,一个DMA控制器管理8个数据流,每个数据流含8个通道,每个数据流在外设和存储器之间均存在一个FIFO做数据缓冲。

每个数据流都与一个 DMA 请求相关联,然而并不是每个通道都能与一个DMA请求相关联,例如DMA1:

即每个数据流选择一个通道内的DMA请求生效,源传输和目标传输在整个 4 GB 区域(地址在 0x0000 0000 和 0xFFFF FFFF 之间)都可以寻址外设和存储器。

三种传输模式

  • 外设到存储器
    • 使能这种模式(将 DMA_SxCR 寄存器中的位 EN 置 1)时,每次产生外设请求,数据流都会启动数据源到 FIFO 的传输。
    • 达到 FIFO 的阈值级别时,FIFO 的内容移出并存储到目标中,直接模式下每完成一次从外设到 FIFO 的数据传输后,相应的数据立即就会移出并存储到目标中。
    • 只有赢得仲裁后,FIFO数据才会被取走
  • 存储器到外设
    • 使能这种模式(将 DMA_SxCR 寄存器中的 EN 位置 1)时,数据流会立即启动传输,从源完全填充 FIFO。
    • 每次发生外设请求,FIFO 的内容都会移出并存储到目标中。
    • 只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。
  • 存储器到存储器
    • DMA 通道在没有外设请求触发的情况下同样可以工作。
    • 通过将 DMA_SxCR 寄存器中的使能位 (EN) 置 1 来使能数据流时,数据流会立即开始填充 FIFO,直至达到阈值级别。达到阈值级别后,FIFO 的内容便会移出,并存储到目标中。
    • 只有赢得了数据流的仲裁后,相应数据流才有权访问 AHB 源或目标端口。

上面说的这三种模式,其实简单的理解下就是数据可以先放入FIFO,等待触发时一次取走或写入,或者直接模式不用等FIFO到达阈值就操作。

DMA的配置与工作流程

DMA可以类比为仓库的货物搬移,因此需要配置以下几个基本的条件:仓库的位置,仓库的单位,仓库的大小,搬的方式。以HAL库的配置方式为例:

  • 配置目的地和源,这里可以认为是仓库的位置
DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址
DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
  • 配置DMA缓存大小,可以认为是仓库的容量
DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
  • 配置外设和存储器地址寄存器是否递增,这里的意思是数据是放在同一个地方还是递增往下放,源和目的单独可配
DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
  • 设置外设和存储器数据宽度,仓库的单位,单位不一致放置会出问题。
DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
  • 设置DMA工作模式(循环或正常(单次))
DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
  • 设置优先级
DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
  • 设置模式(外设到存储器,存储器到外设,存储器到存储器)
DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输

以摄像头DCMI的DMA配置为例

首先看代码:

//DCMI DMA配置
//DMA_Memory0BaseAddr:存储器地址    将要存储摄像头数据的内存地址(也可以是外设地址)
//DMA_BufferSize:存储器长度    0~65535
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryDataSize:存储器位宽
//DMA_MemoryInc:存储器增长方式
void DCMI_DMA_Init(u32 DMA_Memory0BaseAddr, u16 DMA_BufferSize, u32 DMA_MemoryDataSize, u32 DMA_MemoryInc)
{
	DMA_InitTypeDef DMA_InitStructure;
	NVIC_InitTypeDef NVIC_InitStructure;
	//RCC_AHB2PeriphClockCmd(RCC_AHB2Periph_DCMI, ENABLE);//DCMI 
	RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能 
	
	DMA_DeInit(DMA2_Stream1);
	while (DMA_GetCmdStatus(DMA2_Stream1) != DISABLE) //等待DMA2_Stream1可配置
	{
	}

	/* 配置 DMA Stream */
	DMA_InitStructure.DMA_Channel = DMA_Channel_1;  //通道1 DCMI通道
	DMA_InitStructure.DMA_PeripheralBaseAddr = (u32)&DCMI->DR; //外设地址为:DCMI->DR
	DMA_InitStructure.DMA_Memory0BaseAddr = DMA_Memory0BaseAddr; //DMA 存储器0地址
	DMA_InitStructure.DMA_DIR = DMA_DIR_PeripheralToMemory; //外设到存储器模式
	DMA_InitStructure.DMA_BufferSize = DMA_BufferSize; //数据传输量
	DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable; //外设非增量模式
	DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc; //存储器增量模式
	DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Word; //外设数据长度:32位
	DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize; //存储器数据长度
	DMA_InitStructure.DMA_Mode = DMA_Mode_Circular; // 使用循环模式
	DMA_InitStructure.DMA_Priority = DMA_Priority_High; //高优先级
	DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Enable; //FIFO模式
	DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full; //使用全FIFO
	DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single; //外设突发单次传输
	DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single; //存储器突发单次传输
	DMA_Init(DMA2_Stream1, &DMA_InitStructure); //初始化DMA Stream

	DMA_ITConfig(DMA2_Stream1,DMA_IT_TC,ENABLE);
	NVIC_InitStructure.NVIC_IRQChannel=	DMA2_Stream1_IRQn;
	NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority=0;
	NVIC_InitStructure.NVIC_IRQChannelSubPriority=0;
	NVIC_InitStructure.NVIC_IRQChannelCmd=ENABLE;
	NVIC_Init(&NVIC_InitStructure);	//根据指定的参数初始化VIC寄存器、
}

void DMA2_Stream1_IRQHandler(void)
{        
	if(DMA_GetFlagStatus(DMA2_Stream1,DMA_FLAG_TCIF1)==SET)//DMA2_Steam1,传输完成标志
	{  
		 DMA_ClearFlag(DMA2_Stream1,DMA_FLAG_TCIF1);//清除传输完成中断
			datanum++;
	}    											 
}

首先是手册,可以使用DCMI的DMA数据流是DMA2的流1和流7的通道1,配置流程:

  • while循环等待DMA2完成一次传输后配置DMA2,这里选择的是流1的通道1。
  • 之后配置外设地址和存储器地址,传输模式,数据传输量为1,即每次传1个字节。
  • DCMI的地址是固定的,因此外设是非增量的,存储器是LCD,地址固定的非增量,长度为16位,外设是RGB565长度选择16位。
  • 传输是循环显示的,因此要循环模式,配置FIFO和传输方式,初始化DMA2和中断

使用DMA读写数据与CPU操作的对比

我们做一个小实验,可能不一定准确,即通过DMA方式给USART发送数据进行计时计数,和通过CPU调用USART发送数据的时间进行对比,代码基础是在原子代码上修改而来。

#include "sys.h"
#include "delay.h"
#include "usart.h"
#include "sram.h"
#include "malloc.h"
#include "ILI93xx.h"
#include "led.h"
#include "timer.h"
#include "touch.h"
#include "GUI.h"
#include "GUIDemo.h"
#include "includes.h"
#include "../RESOURCES/logo/logo/Logo.h"
#include "usmart.h"
#include "spi.h"
#include "w25qxx.h"
#include "24cxx.h"
#include "main_tasks.h"
#include "ff.h"
#include "exfuns.h"
#include "fattester.h"
#include "adc.h"
#include "dma.h"

volatile uint32_t gcounter = 0;
const u8 TEXT_TO_SEND[]={"STM32F4 DMA TEST. "};
void extra_while_task(void);

//通用定时器5中断初始化
//arr:自动重装值。
//psc:时钟预分频数
//定时器溢出时间计算方法:Tout=((arr+1)*(psc+1))/Ft us.
//Ft=定时器工作频率,单位:Mhz
//这里使用的是定时器3!
void TIM5_Int_Init(u16 arr, u16 psc)
{
	TIM_TimeBaseInitTypeDef TIM_TimeBaseInitStructure;
	NVIC_InitTypeDef NVIC_InitStructure;

	RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM5, ENABLE);  ///使能TIM4时钟

	TIM_TimeBaseInitStructure.TIM_Prescaler = psc;  //定时器分频
	TIM_TimeBaseInitStructure.TIM_CounterMode = TIM_CounterMode_Up; //向上计数模式
	TIM_TimeBaseInitStructure.TIM_Period = arr;   //自动重装载值
	TIM_TimeBaseInitStructure.TIM_ClockDivision = TIM_CKD_DIV1;

	TIM_TimeBaseInit(TIM5, &TIM_TimeBaseInitStructure);

	TIM_ITConfig(TIM5, TIM_IT_Update, ENABLE); //允许定时器3更新中断
	TIM_Cmd(TIM5, ENABLE); //使能定时器3

	NVIC_InitStructure.NVIC_IRQChannel = TIM5_IRQn; //定时器4中断
	NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority = 0x02; //抢占优先级1
	NVIC_InitStructure.NVIC_IRQChannelSubPriority = 0x03; //子优先级3
	NVIC_InitStructure.NVIC_IRQChannelCmd = ENABLE;
	NVIC_Init(&NVIC_InitStructure);

}
//定时器5中断服务函数
void TIM5_IRQHandler(void)
{
	if (TIM_GetITStatus(TIM5, TIM_IT_Update) == SET) //溢出中断
	{
		gcounter++;
	}
	TIM_ClearITPendingBit(TIM5, TIM_IT_Update);  //清除中断标志位
}

//DMAx的各通道配置
//这里的传输形式是固定的,这点要根据不同的情况来修改
//从存储器->外设模式/8位数据宽度/存储器增量模式
//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7
//chx:DMA通道选择,@ref DMA_channel DMA_Channel_0~DMA_Channel_7
//par:外设地址
//mar:存储器地址
//ndtr:数据传输量  
void MYDMA_Config(DMA_Stream_TypeDef *DMA_Streamx,u32 chx,u32 par,u32 mar,u16 ndtr)
{ 
 
	DMA_InitTypeDef  DMA_InitStructure;
	
	if((u32)DMA_Streamx>(u32)DMA2)//得到当前stream是属于DMA2还是DMA1
	{
	  RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA2,ENABLE);//DMA2时钟使能 
		
	}else 
	{
	  RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA1,ENABLE);//DMA1时钟使能 
	}
  DMA_DeInit(DMA_Streamx);
	
	while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){}//等待DMA可配置 
	
  /* 配置 DMA Stream */
  DMA_InitStructure.DMA_Channel = chx;  //通道选择
  DMA_InitStructure.DMA_PeripheralBaseAddr = par;//DMA外设地址
  DMA_InitStructure.DMA_Memory0BaseAddr = mar;//DMA 存储器0地址
  DMA_InitStructure.DMA_DIR = DMA_DIR_MemoryToPeripheral;//存储器到外设模式
  DMA_InitStructure.DMA_BufferSize = ndtr;//数据传输量 
  DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable;//外设非增量模式
  DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc_Enable;//存储器增量模式
  DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Byte;//外设数据长度:8位
  DMA_InitStructure.DMA_MemoryDataSize = DMA_MemoryDataSize_Byte;//存储器数据长度:8位
  DMA_InitStructure.DMA_Mode = DMA_Mode_Normal;// 使用普通模式 
  DMA_InitStructure.DMA_Priority = DMA_Priority_Medium;//中等优先级
  DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Disable;         
  DMA_InitStructure.DMA_FIFOThreshold = DMA_FIFOThreshold_Full;
  DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single;//存储器突发单次传输
  DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single;//外设突发单次传输
  DMA_Init(DMA_Streamx, &DMA_InitStructure);//初始化DMA Stream
	

} 
//开启一次DMA传输
//DMA_Streamx:DMA数据流,DMA1_Stream0~7/DMA2_Stream0~7 
//ndtr:数据传输量  
void MYDMA_Enable(DMA_Stream_TypeDef *DMA_Streamx,u16 ndtr)
{
 
	DMA_Cmd(DMA_Streamx, DISABLE);                      //关闭DMA传输 
	
	while (DMA_GetCmdStatus(DMA_Streamx) != DISABLE){}	//确保DMA可以被设置  
		
	DMA_SetCurrDataCounter(DMA_Streamx,ndtr);          //数据传输量  
 
	DMA_Cmd(DMA_Streamx, ENABLE);                      //开启DMA传输 
}

int main(void)
{
	u8 count = 0;
	uint8_t buffer[256];
	u8 res = 0;
	POINT_COLOR = DARKBLUE;
	delay_init(168);        //延时初始化
	NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2);     //中断分组配置
	uart_init(115200);      //串口波特率设置
	TFTLCD_Init();          //初始化LCD
	KEY_Init();
	LED_Init();             //LED初始化
	TIM3_Int_Init(10000 - 1, 16800 - 1); //10Khz计数,1秒钟中断一次
	//不需要经过OS的任务
	extra_while_task();
	
}

#define SEND_BUF_SIZE 8000
void extra_while_task(void)
{
	u32 i = 0;
	u8 t=0,mask=0,j=sizeof(TEXT_TO_SEND);
	u8 SendBuff[SEND_BUF_SIZE];	//发送数据缓冲区
	if(1)
	{
		for(i=0;i<SEND_BUF_SIZE;i++)//填充ASCII字符集数据
		{
			if(t>=j)//加入换行符
			{
				if(mask)
				{
					SendBuff[i]=0x0a;
					t=0;
				}else 
				{
					SendBuff[i]=0x0d;
					mask++;
				}	
			}else//复制TEXT_TO_SEND语句
			{
				mask=0;
				SendBuff[i]=TEXT_TO_SEND[t];
				t++;
			}   	   
		}		 
		Adc_Init();         //初始化ADC
		TIM5_Int_Init(10 - 1, 16800 - 1); //10Khz计数,10个us中断一次
		while(1)
		{
			//Get_Adc_Average(ADC_Channel_5,20);//获取通道5的转换值,20次取平均
			//按DMA发送
			MYDMA_Config(DMA2_Stream7,DMA_Channel_4,(u32)&USART1->DR,(u32)SendBuff,SEND_BUF_SIZE);//DMA2,STEAM7,CH4,外设为串口1,存储器为SendBuff,长度为:SEND_BUF_SIZE.
			USART_DMACmd(USART1,USART_DMAReq_Tx,ENABLE);  //使能串口1的DMA发送     
			gcounter = 0;
			MYDMA_Enable(DMA2_Stream7,SEND_BUF_SIZE);     //开始一次DMA传输!
			while(1)
		    {
				if(DMA_GetFlagStatus(DMA2_Stream7,DMA_FLAG_TCIF7)!=RESET)//等待DMA2_Steam7传输完成
				{ 
					DMA_ClearFlag(DMA2_Stream7,DMA_FLAG_TCIF7);//清除DMA2_Steam7传输完成标志
					printf("dma over: %d\r\n",gcounter);
					break; 
		        }
		    }
			//按CPU发送
			printf("cpu start\r\n");
			gcounter = 0;
			for(i = 0;i<SEND_BUF_SIZE;i++)
			{
				while ((USART1->SR & 0X40) == 0); //循环发送,直到发送完毕
				USART1->DR = (u8)SendBuff[i];
			}
			printf("cpu over: %d\r\n",gcounter);
			while(1);//halt
		}
	}
}

实验结果,DMA的计数是355:

USART直接发送是392:

发送的数据量是8000个字节,相当于8k,当数据量更大时DMA的优势就很明显了。

posted @ 2019-11-03 17:54  回归的世界线  阅读(4106)  评论(0编辑  收藏  举报