一杯清酒邀明月
天下本无事,庸人扰之而烦耳。

SSE支持128bit的多指令并行,但是有个要求是处理的对象必须要在内存地址以16byte整数倍的地方开始。不过这些细节Eigen在做并行化的时候会自己处理。

但是,如果把一些Eigen的结构放到std的容器里面,比如vector,map。这些容器会把一个一个的Eigen结构在内存里面连续排放。

可以想象,如果这些Eigen的结构本身不是16byte大小,一连续排放后,自然有很多对象就不是在16byte整数倍的地方开始了。

Eigen提供了两种方法来解决:

使用特别的内存分配对象

std::map<int, Eigen::Vector4f, std::less<int>, Eigen::aligned_allocator<std::pair<const int, Eigen::Vector4f> > >

std::vector<Eigen::Vector4f,Eigen::aligned_allocator<Eigen::Vector4f> >

针对vector的时候,还需要额外添加头文件#include<Eigen/StdVector>

在对象定义的时候,使用特殊的宏

EIGEN_DEFINE_STL_VECTOR_SPECIALIZATION(Matrix2d)

注意必须在所有Eigen对象出现前使用这个宏

有这个问题的Eigen结构包括:

 1 Eigen::Vector2d
 2 Eigen::Vector4d
 3 Eigen::Vector4f
 4 Eigen::Matrix2d
 5 Eigen::Matrix2f
 6 Eigen::Matrix4d
 7 Eigen::Matrix4f
 8 Eigen::Affine3d
 9 Eigen::Affine3f
10 Eigen::Quaterniond
11 Eigen::Quaternionf

另外如果上面提到的这些结构作为一个对象的成员,比如:

1 class Foo
2 {
3   ...
4   Eigen::Vector2d v;
5   ...
6 };
7 ...
8 Foo *foo = new Foo;

这个时候需要在类定义里面使用另外一个宏:

 1 class Foo
 2 {
 3   ...
 4   Eigen::Vector2d v;
 5   ...
 6 public:
 7   EIGEN_MAKE_ALIGNED_OPERATOR_NEW
 8 };
 9 ...
10 Foo *foo = new Foo;

原因分析:对象内部的内存分配是相对与对象的地址的。如果对象的地址不是16byte对齐的,里面的成员并不会知道这个信息,所以没有办法分配16byte对其的地址。解决办法就是强制让分配对象的时候,就给一个16byte对齐的地址。

EIGEN_MAKE_ALIGNED_OPERATOR_NEW会重载new函数。

posted on 2022-07-04 14:04  一杯清酒邀明月  阅读(366)  评论(0编辑  收藏  举报