SSE支持128bit的多指令并行,但是有个要求是处理的对象必须要在内存地址以16byte整数倍的地方开始。不过这些细节Eigen在做并行化的时候会自己处理。
但是,如果把一些Eigen的结构放到std的容器里面,比如vector,map。这些容器会把一个一个的Eigen结构在内存里面连续排放。
可以想象,如果这些Eigen的结构本身不是16byte大小,一连续排放后,自然有很多对象就不是在16byte整数倍的地方开始了。
Eigen提供了两种方法来解决:
使用特别的内存分配对象
std::map<int, Eigen::Vector4f, std::less<int>, Eigen::aligned_allocator<std::pair<const int, Eigen::Vector4f> > >
std::vector<Eigen::Vector4f,Eigen::aligned_allocator<Eigen::Vector4f> >
针对vector的时候,还需要额外添加头文件#include<Eigen/StdVector>
在对象定义的时候,使用特殊的宏
EIGEN_DEFINE_STL_VECTOR_SPECIALIZATION(Matrix2d)
注意必须在所有Eigen对象出现前使用这个宏
有这个问题的Eigen结构包括:
1 Eigen::Vector2d
2 Eigen::Vector4d
3 Eigen::Vector4f
4 Eigen::Matrix2d
5 Eigen::Matrix2f
6 Eigen::Matrix4d
7 Eigen::Matrix4f
8 Eigen::Affine3d
9 Eigen::Affine3f
10 Eigen::Quaterniond
11 Eigen::Quaternionf
另外如果上面提到的这些结构作为一个对象的成员,比如:
1 class Foo
2 {
3 ...
4 Eigen::Vector2d v;
5 ...
6 };
7 ...
8 Foo *foo = new Foo;
这个时候需要在类定义里面使用另外一个宏:
1 class Foo
2 {
3 ...
4 Eigen::Vector2d v;
5 ...
6 public:
7 EIGEN_MAKE_ALIGNED_OPERATOR_NEW
8 };
9 ...
10 Foo *foo = new Foo;
原因分析:对象内部的内存分配是相对与对象的地址的。如果对象的地址不是16byte对齐的,里面的成员并不会知道这个信息,所以没有办法分配16byte对其的地址。解决办法就是强制让分配对象的时候,就给一个16byte对齐的地址。
EIGEN_MAKE_ALIGNED_OPERATOR_NEW会重载new函数。