【STM32F407的DSP教程】第29章 STM32F407移植汇编定点FFT库(64点,256点和1024点)
完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547
第29章 STM32F407移植汇编定点FFT库(64点,256点和1024点)
本章主要讲解ST官方汇编FFT库的应用,包括1024点,256点和64点FFT的实现。
29.1 汇编FFT库说明
29.2 函数cr4_fft_1024_stm32的使用(含幅频和相频响应)
29.3 函数cr4_fft_256_stm32的使用
29.4 函数cr4_fft_64_stm32的使用
29.5 实验例程说明(MDK)
29.6 实验例程说明(IAR)
29.7 总结。
29.1 汇编FFT库说明
29.1.1 描述
这个汇编的FFT库是来自STM32F10x DSP library,由于是汇编实现的,而且是基4算法,所以实现FFT在速度上比较快。
如果x[N]是采样信号的话,使用FFT时必须满足如下两条:
- N得满足4n(n =1,2, 3…..),也就是以4为基数。
- 采样信号必须是32位数据,高16位存实部,低16位存虚部(这个是针对大端模式),小端模式是高位存虚部,低位存虚部。一般常用的是小端模式。
汇编FFT的实现主要包括以下三个函数:
- cr4_fft_64_stm32 :实现64点FFT。
- cr4_fft_256_stm32 :实现256点FFT。
- cr4_fft_1024_stm32 : 实现1024点FFT。
29.1.2 汇编库的移植
注:这里以MDK为例进行说明,IAR是一样的。
这个汇编库的移植比较简单,从本章配套例子User文件夹复制fft文件夹到自己的工程:
注意路径\User\fft\src\asm下有三个文件夹,分布是arm,gcc和iar,其中arm可用于MDK,gcc可用于Embedded Studio,iar可用于IAR FOR ARM。
三个文件夹里面都是如下几个文件,只是用于不用的编译器:
然后把FFT源文件的三个FFT汇编文件和两个头文件添加上即可,添加后效果如下(注意不同编译器添相应汇编文件):
相应文件添加后还有最重要一条,要把stm32_dsp.h文件中的STM32F4的头文件:
最后别忘了添加路径:
经过上面的操作,汇编FFT库的移植就完成了。
29.2 函数cr4_fft_1024_stm32的使用(含幅频和相频响应)
cr4_fft_1024_stm32用于实现1024点数据的FFT计算。下面通过在开发板上运行这个函数并计算幅频相应,然后再与Matlab计算的结果做对比。
uint32_t input[1024], output[1024], Mag[1024];/* 输入,输出和幅值 */ float32_t Phase[1024]; /* 相位*/ /* ********************************************************************************************************* * 函 数 名: PowerMag * 功能说明: 求模值 * 形 参:_usFFTPoints FFT点数 * 返 回 值: 无 ********************************************************************************************************* */ void PowerMag(uint16_t _usFFTPoints) { int16_t lX,lY; uint16_t i; float32_t mag; /* 计算幅值 */ for (i=0; i < _usFFTPoints; i++) { lX= (output[i]<<16)>>16; /* 实部*/ lY= (output[i]>> 16); /* 虚部 */ arm_sqrt_f32((float32_t)(lX*lX+ lY*lY), &mag); /* 求模 */ Mag[i]= mag*2; /* 求模后乘以2才是实际模值,直流分量不需要乘2 */ } /* 由于上面多乘了2,所以这里直流分量要除以2 */ Mag[0] = Mag[0]>>1; } /* ********************************************************************************************************* * 函 数 名: Power_Phase_Radians * 功能说明: 求相位 * 形 参:_usFFTPoints FFT点数, uiCmpValue 阀值 * 返 回 值: 无 ********************************************************************************************************* */ void Power_Phase_Radians(uint16_t _usFFTPoints, uint32_t _uiCmpValue) { int16_t lX, lY; uint16_t i; float32_t phase; float32_t mag; for (i=0; i <_usFFTPoints; i++) { lX= (output[i]<<16)>>16; /* 实部 */ lY= (output[i] >> 16); /* 虚部 */ phase = atan2(lY, lX); /* atan2求解的结果范围是(-pi, pi], 弧度制 */ arm_sqrt_f32((float32_t)(lX*lX+ lY*lY), &mag); /* 求模 */ if(_uiCmpValue > mag) { Phase[i] = 0; } else { Phase[i] = phase* 180.0f/3.1415926f; /* 将求解的结果由弧度转换为角度 */ } } } /* ********************************************************************************************************* * 函 数 名: DSP_FFTPhase * 功能说明: 1024点FFT的相位求解 * 形 参:无 * 返 回 值: 无 ********************************************************************************************************* */ void DSP_FFTPhase(void) { uint16_t i; /* 获得1024个采样点 */ for (i = 0; i < 1024; i++) { /* 波形是由直流分量,50Hz正弦波组成,波形采样率1024 */ input[i] = 1024 + 1024*cos(2*3.1415926f*50*i/1024 + 3.1415926f/3); } /* 计算1024点FFT output:输出结果,高16位是虚部,低16位是实部。 input :输入数据,高16位是虚部,低16位是实部。 第三个参数必须是1024。 */ cr4_fft_1024_stm32(output, input, 1024); /* 求幅值 */ PowerMag(1024); /* 打印输出结果 */ for (i = 0; i < 1024; i++) { printf("%d\r\n", Mag[i]); } printf("=========================================\r\n"); /* 求相频 */ Power_Phase_Radians(1024, 100); /* 打印输出结果 */ for (i = 0; i < 1024; i++) { printf("%f\r\n", Phase[i]); } }
运行函数DSP_FFTPhase可以通过串口打印出计算的模值和相角,下面我们就通过Matlab计算的模值和相角跟cr4_fft_1024_stm32计算的做对比。
对比前需要先将串口打印出的数据加载到Matlab中,并给这个数组起名sampledata,加载方法在前面的教程的第13章13.6小结已经讲解,这里不做赘述了。Matlab中运行的代码如下:
Fs = 1024; % 采样率 N = 1024; % 采样点数 n = 0:N-1; % 采样序列 t = 0:1/Fs:1-1/Fs; % 时间序列 f = n * Fs / N; %真实的频率 %波形是由直流分量,50Hz正弦波正弦波组成 x = 1024 + 1024*cos(2*pi*50*t + pi/3) ; y = fft(x, N); %对原始信号做FFT变换 Mag = abs(y); subplot(2,2,1); MagAct = Mag *2 / N; MagAct(1) = MagAct(1)/2; plot(f, MagAct); title('Matlab计算幅频响应'); xlabel('频率'); ylabel('赋值'); subplot(2,2,2); realvalue = real(y); imagvalue = imag(y); plot(f, atan2(imagvalue, realvalue)*180/pi.*(Mag>=1024*20)); title('Matlab计算相频响应'); xlabel('频率'); ylabel('相角'); subplot(2,2,3); plot(f, sampledata1); %绘制STM32计算的幅频相应 title('STM32计算幅频响应'); xlabel('频率'); ylabel('赋值'); subplot(2,2,4); plot(f, sampledata2); %绘制STM32计算的相频相应 title('STM32计算相频响应'); xlabel('频率'); ylabel('相角');
运行Matlab后的输出结果如下:
从上面的对比结果中可以看出,Matlab和函数cr4_fft_1024_stm32计算的结果基本是一直的。幅频响应求出的幅值和相频响应中的求出的初始相角都是没问题的。
29.3 函数cr4_fft_256_stm32的使用
cr4_fft_256_stm32和cr4_fft_1024_stm32的用法是一样的,下面通过一个实例进行说明:
/* ********************************************************************************************************* * 函 数 名: DSP_FFT256 * 功能说明: 256点FFT实现 * 形 参:无 * 返 回 值: 无 ********************************************************************************************************* */ void DSP_FFT256(void) { uint16_t i; /* 获得256个采样点 */ for (i = 0; i < 256; i++) { /* 波形是由直流分量,50Hz正弦波和20Hz正弦波组成,波形采样率200Hz */ input[i] = 1024 + 1024*sin(2*3.1415926f*50*i/200) + 512*sin(2*3.1415926f*20*i/200) ; } /* 计算256点FFT output:输出结果,高16位是虚部,低16位是实部。 input :输入数据,高16位是虚部,低16位是实部。 第三个参数必须是1024。 */ cr4_fft_256_stm32(output, input, 256); /* 求幅值 */ PowerMag(256); /* 打印输出结果 */ for (i = 0; i < 256; i++) { printf("%d\r\n", Mag[i]); } }
运行函数DSP_FFT256可以通过串口打印出计算的模值,下面我们就通过Matlab计算的模值跟cr4_fft_256_stm32计算的模值做对比。
对比前需要先将串口打印出的数据加载到Matlab中,并给这个数组起名sampledata, Matlab中运行的代码如下:
Fs = 200; % 采样率 N = 256; % 采样点数 n = 0:N-1; % 采样序列 t = 0:1/Fs:1-1/Fs; % 时间序列 f = n * Fs / N; %真实的频率 %波形是由直流分量,50Hz正弦波和20Hz正弦波组成 x = 1024 + 1024*sin(2*pi*50*t) + 512*sin(2*pi*20*t) ; y = fft(x, N); %对原始信号做FFT变换 subplot(2,1,1); Mag = abs(y); MagAct = Mag *2 / N; MagAct(1) = MagAct(1)/2; plot(f, MagAct); %绘制幅频相应曲线 title('Matlab计算结果'); xlabel('频率'); ylabel('幅度'); subplot(2,1,2); plot(f, sampledata); %绘制STM32计算的幅频相应 title('STM32计算结果'); xlabel('频率'); ylabel('幅度');
运行Matlab后的输出结果如下:
从上面的对比结果中可以看出,Matlab和函数cr4_fft_256_stm32计算的结果基本是一直的,但频率泄露略多。
29.4 函数cr4_fft_64_stm32的使用
cr4_fft_64_stm32和cr4_fft_1024_stm32的用法也是一样的,下面通过一个实例进行说明:
/* ********************************************************************************************************* * 函 数 名: DSP_FFT64 * 功能说明: 64点FFT实现 * 形 参:无 * 返 回 值: 无 ********************************************************************************************************* */ void DSP_FFT64(void) { uint16_t i; /* 获得64个采样点 */ for (i = 0; i < 64; i++) { /* 波形是由直流分量,5Hz正弦波和10Hz正弦波组成,波形采样率60Hz */ input[i] = 1024 + 1024*sin(2*3.1415926f*5*i/60) + 512*sin(2*3.1415926f*10*i/60) ; } /* 计算64点FFT output:输出结果,高16位是虚部,低16位是实部。 input :输入数据,高16位是虚部,低16位是实部。 第三个参数必须是1024。 */ cr4_fft_64_stm32(output, input, 64); /* 求幅值 */ PowerMag(64); /* 打印输出结果 */ for (i = 0; i < 64; i++) { printf("%d\r\n", Mag[i]); } }
运行函数DSP_FFT64可以通过串口打印出计算的模值,下面我们就通过Matlab计算的模值跟cr4_fft_64_stm32计算的模值做对比。
对比前需要先将串口打印出的数据加载到Matlab中,并给这个数组起名sampledata,Matlab中运行的代码如下:
Fs = 60; % 采样率 N = 64; % 采样点数 n = 0:N-1; % 采样序列 t = 0:1/Fs:1-1/Fs; % 时间序列 f = n * Fs / N; % 真实的频率 %波形是由直流分量,5Hz正弦波和10Hz正弦波组成 x = 1024 + 1024*sin(2*pi*5*t) + 512*sin(2*pi*10*t) ; y = fft(x, N); %对原始信号做FFT变换 subplot(2,1,1); Mag = abs(y); MagAct = Mag *2 / N; MagAct(1) = MagAct(1)/2; plot(f, MagAct); %绘制幅频相应曲线 title('Matlab计算结果'); xlabel('频率'); ylabel('幅度'); subplot(2,1,2); plot(f, sampledata); %绘制STM32计算的幅频相应 title('STM32计算结果'); xlabel('频率'); ylabel('幅度');
运行Matlab后的输出结果如下:
从上面的对比结果中可以看出,Matlab和函数cr4_fft_64_stm32计算的结果基本是一直的,但是计算的效果都比较差,主要是因为采样点数太少。
29.5 实验例程说明(MDK)
配套例子:
V5-219_STM32F407移植ST汇编定点FFT库(64点,256点和1024点)
实验目的:
- 学习ST汇编定点FFT库(64点,256点和1024点)
实验内容:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打印1024点FFT的幅频响应和相频响应。
- 按下按键K2,串口打印256点FFT的幅频响应。
- 按下按键K3,串口打印64点FFT的幅频响应。
使用AC6注意事项
特别注意附件章节C的问题
上电后串口打印的信息:
波特率 115200,数据位 8,奇偶校验位无,停止位 1。
RTT方式打印信息:
程序设计:
系统栈大小分配:
硬件外设初始化
硬件外设的初始化是在 bsp.c 文件实现:
/* ********************************************************************************************************* * 函 数 名: bsp_Init * 功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次 * 形 参:无 * 返 回 值: 无 ********************************************************************************************************* */ void bsp_Init(void) { /* STM32F407 HAL 库初始化,此时系统用的还是F407自带的16MHz,HSI时钟: - 调用函数HAL_InitTick,初始化滴答时钟中断1ms。 - 设置NVIV优先级分组为4。 */ HAL_Init(); /* 配置系统时钟到168MHz - 切换使用HSE。 - 此函数会更新全局变量SystemCoreClock,并重新配置HAL_InitTick。 */ SystemClock_Config(); /* Event Recorder: - 可用于代码执行时间测量,MDK5.25及其以上版本才支持,IAR不支持。 - 默认不开启,如果要使能此选项,务必看V5开发板用户手册第8章 */ #if Enable_EventRecorder == 1 /* 初始化EventRecorder并开启 */ EventRecorderInitialize(EventRecordAll, 1U); EventRecorderStart(); #endif bsp_InitKey(); /* 按键初始化,要放在滴答定时器之前,因为按钮检测是通过滴答定时器扫描 */ bsp_InitTimer(); /* 初始化滴答定时器 */ bsp_InitUart(); /* 初始化串口 */ bsp_InitExtIO(); /* 初始化扩展IO */ bsp_InitLed(); /* 初始化LED */ }
主功能:
主程序实现如下操作:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打印1024点FFT的幅频响应和相频响应。
- 按下按键K2,串口打印256点FFT的幅频响应。
- 按下按键K3,串口打印64点FFT的幅频响应。
/* ********************************************************************************************************* * 函 数 名: main * 功能说明: c程序入口 * 形 参: 无 * 返 回 值: 错误代码(无需处理) ********************************************************************************************************* */ int main(void) { uint8_t ucKeyCode; /* 按键代码 */ bsp_Init(); /* 硬件初始化 */ PrintfLogo(); /* 打印例程信息到串口1 */ PrintfHelp(); /* 打印操作提示信息 */ bsp_StartAutoTimer(0, 100); /* 启动1个100ms的自动重装的定时器 */ /* 进入主程序循环体 */ while (1) { bsp_Idle(); /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 */ if (bsp_CheckTimer(0)) /* 判断定时器超时时间 */ { /* 每隔500ms 进来一次 */ bsp_LedToggle(4); /* 翻转LED2的状态 */ } ucKeyCode = bsp_GetKey(); /* 读取键值, 无键按下时返回 KEY_NONE = 0 */ if (ucKeyCode != KEY_NONE) { switch (ucKeyCode) { case KEY_DOWN_K1: /* K1键按下 */ DSP_FFTPhase(); break; case KEY_DOWN_K2: /* K2键按下 */ DSP_FFT256(); break; case KEY_DOWN_K3: /* K3键按下 */ DSP_FFT64(); break; default: /* 其它的键值不处理 */ break; } } } }
29.6 实验例程说明(IAR)
配套例子:
V5-219_STM32F407移植ST汇编定点FFT库(64点,256点和1024点)
实验目的:
- 学习ST汇编定点FFT库(64点,256点和1024点)
实验内容:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打印1024点FFT的幅频响应和相频响应。
- 按下按键K2,串口打印256点FFT的幅频响应。
- 按下按键K3,串口打印64点FFT的幅频响应。
上电后串口打印的信息:
波特率 115200,数据位 8,奇偶校验位无,停止位 1。
RTT方式打印信息:
程序设计:
系统栈大小分配:
硬件外设初始化
硬件外设的初始化是在 bsp.c 文件实现:
/* ********************************************************************************************************* * 函 数 名: bsp_Init * 功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次 * 形 参:无 * 返 回 值: 无 ********************************************************************************************************* */ void bsp_Init(void) { /* STM32F407 HAL 库初始化,此时系统用的还是F407自带的16MHz,HSI时钟: - 调用函数HAL_InitTick,初始化滴答时钟中断1ms。 - 设置NVIV优先级分组为4。 */ HAL_Init(); /* 配置系统时钟到168MHz - 切换使用HSE。 - 此函数会更新全局变量SystemCoreClock,并重新配置HAL_InitTick。 */ SystemClock_Config(); /* Event Recorder: - 可用于代码执行时间测量,MDK5.25及其以上版本才支持,IAR不支持。 - 默认不开启,如果要使能此选项,务必看V5开发板用户手册第8章 */ #if Enable_EventRecorder == 1 /* 初始化EventRecorder并开启 */ EventRecorderInitialize(EventRecordAll, 1U); EventRecorderStart(); #endif bsp_InitKey(); /* 按键初始化,要放在滴答定时器之前,因为按钮检测是通过滴答定时器扫描 */ bsp_InitTimer(); /* 初始化滴答定时器 */ bsp_InitUart(); /* 初始化串口 */ bsp_InitExtIO(); /* 初始化扩展IO */ bsp_InitLed(); /* 初始化LED */ }
主功能:
主程序实现如下操作:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打印1024点FFT的幅频响应和相频响应。
- 按下按键K2,串口打印256点FFT的幅频响应。
- 按下按键K3,串口打印64点FFT的幅频响应。
/* ********************************************************************************************************* * 函 数 名: main * 功能说明: c程序入口 * 形 参: 无 * 返 回 值: 错误代码(无需处理) ********************************************************************************************************* */ int main(void) { uint8_t ucKeyCode; /* 按键代码 */ bsp_Init(); /* 硬件初始化 */ PrintfLogo(); /* 打印例程信息到串口1 */ PrintfHelp(); /* 打印操作提示信息 */ bsp_StartAutoTimer(0, 100); /* 启动1个100ms的自动重装的定时器 */ /* 进入主程序循环体 */ while (1) { bsp_Idle(); /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 */ if (bsp_CheckTimer(0)) /* 判断定时器超时时间 */ { /* 每隔500ms 进来一次 */ bsp_LedToggle(4); /* 翻转LED2的状态 */ } ucKeyCode = bsp_GetKey(); /* 读取键值, 无键按下时返回 KEY_NONE = 0 */ if (ucKeyCode != KEY_NONE) { switch (ucKeyCode) { case KEY_DOWN_K1: /* K1键按下 */ DSP_FFTPhase(); break; case KEY_DOWN_K2: /* K2键按下 */ DSP_FFT256(); break; case KEY_DOWN_K3: /* K3键按下 */ DSP_FFT64(); break; default: /* 其它的键值不处理 */ break; } } } }
29.7 总结
本章节主要讲解了汇编FFT的1024点,256点和64点使用方法,有兴趣的可以深入了解汇编代码的实现。