NEON中采用对齐方式的VLD/VST
在ARM官方文档上给出的VLD系列的指令形式为——
而在ARM GCC中,若要使用对齐方式的话,照着上图的格式写,不管怎么写都不会正确。
下面将介绍在ARM GCC中正确使用对齐方式的NEON读写方法:
.text
.align 4
.globl _my_test
_my_test:
vld1.32 {d0}, [r0, :64]
vst1.32 {d0}, [r1, :64]
bx lr
上述的对齐方式为64位,即8字节对齐。
在ARM官方文档上给出的VLD系列的指令形式为——
而在ARM GCC中,若要使用对齐方式的话,照着上图的格式写,不管怎么写都不会正确。
下面将介绍在ARM GCC中正确使用对齐方式的NEON读写方法:
.text
.align 4
.globl _my_test
_my_test:
vld1.32 {d0}, [r0, :64]
vst1.32 {d0}, [r1, :64]
bx lr
上述的对齐方式为64位,即8字节对齐。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】博客园携手 AI 驱动开发工具商 Chat2DB 推出联合终身会员
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步