NEON中采用对齐方式的VLD/VST
在ARM官方文档上给出的VLD系列的指令形式为——
而在ARM GCC中,若要使用对齐方式的话,照着上图的格式写,不管怎么写都不会正确。
下面将介绍在ARM GCC中正确使用对齐方式的NEON读写方法:
.text
.align 4
.globl _my_test
_my_test:
vld1.32 {d0}, [r0, :64]
vst1.32 {d0}, [r1, :64]
bx lr
上述的对齐方式为64位,即8字节对齐。
在ARM官方文档上给出的VLD系列的指令形式为——
而在ARM GCC中,若要使用对齐方式的话,照着上图的格式写,不管怎么写都不会正确。
下面将介绍在ARM GCC中正确使用对齐方式的NEON读写方法:
.text
.align 4
.globl _my_test
_my_test:
vld1.32 {d0}, [r0, :64]
vst1.32 {d0}, [r1, :64]
bx lr
上述的对齐方式为64位,即8字节对齐。