四元数

在讨论「四元数」之前,我们来想想对三维直角坐标而言,在物体旋转会有何影响,可以扩充三维直角坐标系统的旋转为三角度系统(Three-angle system),在Game Programming Gems中有提供这么一段:

Quaternions do not suffer from gimbal lock. With a three-angle(roll, pitch, yaw) system, there are always certain orientations in which there is no simple change to the trhee values to represent a simple local roation. You often see this rotation having "pitched up" 90 degree when you are trying to specify a local yaw for right.

简单的说,三角度系统无法表现任意轴的旋转,只要一开始旋转,物体本身即失去对任意轴的自主性。

四元数(Quaternions)为数学家Hamilton于1843年所创造的,您可能学过的是复数,例如:a + b i 这样的数,其中i * i = -1,Hamilton创造了三维的复数,其形式为 w + x i + y j + z k,其中i、j、k的关系如下:

i2 = j2 = k2 = -1

i * j = k = -j * i

j * k = i = -k * j

k * i = j = -i * k

假设有两个四元数:

q1 = w1 + x1 i + y1 j + z1 k

q2 = w2 + x2 i + y2 j + z2 k

四元数的加法定义如下:

q1 + q2 = (w1+w2) + (x1+x2) i + (y1+y2) j + (z1+z2) k

四元数的乘法定义如下,利用简单的分配律就是了:

q1 * q2 =

(w1*w2 - x1*x2 - y1*y2 - z1*z2) +

(w1*x2 + x1*w2 + y1*z2 - z1*y2) i +

(w1*y2 - x1*z2 + y1*w2 + z1*x2) j +

(w1*z2 + x1*y2 - y1*x2 + z1*w2) k

由于q = w + x i + y j + z k中可以分为纯量w与向量x i + y j + z k,所以为了方便表示,将q表示为(S, V),其中S表示纯量w,V表示向量x i + y j + z k,所以四元数乘法又可以表示为:

q1 * q2 = (S1 + V1)*(S2 + V2) = S1*S2 - V1.V2 + V1XV2 + S1*V2 + S2*V1

其中V1.V2表示向量内积,V1XV2表示向量外积。

定义四元数q = w + x i + y j +z k 的norm为:

N(q) = |q| = x2 + y2 + z2 + w2

满足N(q) = 1的四元数集合,称之为单位四元数(Unit quaternions)。

定义四元数定义四元数q = w + x i + y j +zk的共轭(Conjugate)为:

q* = 定义四元数q = w - x i - y j -z k = [S - V]

定义四元数的倒数为:

1/ q = q* / N(q)

说明了一些数学,您所关心的或许是,四元数与旋转究竟有何关系,假设有一任意旋转轴的向量A(Xa, Ya, Za)与一旋转角度θ,如下图所示:

image

可以将之转换为四元数:

x = s * Xa

y = s * Xb

z = s * Xc

w = cos(θ/2)

s = sin(θ/2)

所以使用四元数来表示的好处是:我们可以简单的取出旋转轴与旋转角度。

那么四元数如何表示三维空间的任意轴旋转?假设有一向量P(X, Y, Z)对着一单位四元数q作旋转,则将P视为无纯量的四元数X i + Y j + Z k,则向量的旋转经导证如下:

Rot(P) = q p q*

四元数具有纯量与向量,为了计算方便,将之以矩阵的方式来表现四元数的乘法,假设将四元数表示如下:

q = [w, x, y, z] = [S, V]

两个四元数相乘q" = q * q'的矩阵表示法如下所示:

image

若令q = [S, V] = [cosθ, u*sinθ],其中u为单位向量,而令q'= [S', V']为一四元数,则经过导证,可以得出q * q' * q^(-1)会使得q'绕着u轴旋转2θ。

由四元数的矩阵乘法与四元数的旋转,可以导证出上面的旋转公式可以使用以下的矩阵乘法来达成:

image

讲了这么多,其实就是要引出上面这个矩阵乘法,也就是说如果您要让向量(x', y', z')(w'为0)对某个单位向量轴u(x, y, z)旋转角度2θ,则w = cosθ,代入以上的矩阵乘法,即可得旋转后的(x", y", z"),如果为了方便,转换矩阵的最下列与最右行会省略不写出来,而如下所示:

image

关于四元数的其它说明,您可以参考 向量外积与四元数 这篇文章。

关于旋转的转换矩阵导证,在Game Programming Gems第二章有详细的说明。

关于 Gimbal lock。

 

 

下面是关于四元数的一点程序的表达方法。

   1: class     CQuaternion 
   2: { 
   3: public: 
   4:     CQuaternion(const float fScalar,const Vector3& rVec) 
   5:     { 
   6:         mVector=rVec ; 
   7:         mScalar=fScalar; 
   8:     } 
   9:  
  10:     void FromAxisAngle (const Vector3& rAxis, const F32 Angle) 
  11:     { 
  12:         F32 fSin, fCos; 
  13:         //取得一个弧度角的SIN COS值 
  14:         SinCos( Angle*0.5f, fSin, fCos); 
  15:         mVector = rAxis*fSin; 
  16:         mScalar = fCos; 
  17:     } 
  18: private: 
  19:     float mScalar; 
  20:     float mVector; 
  21: } 
  22:  
  23: class CMatrix44 
  24: { 
  25: public: 
  26:     enum      { _X_,_Y_,_Z_,_W_ }; 
  27:     void QuaternionToMatrix(const CQuaternion& q) 
  28:     { 
  29:         F32 s,xs,ys,zs,wx,wy,wz,xx,xy,xz,yy,yz,zz; 
  30:         s = q.Length2(); 
  31:         s = (s>0 ? 2.f/s : 0); 
  32:  
  33:         xs = q.Vect[_X_]*s;        ys = q.Vect[_Y_]*s;        zs = q.Vect[_Z_]*s; 
  34:         wx = q.Scalar*xs;        wy = q.Scalar*ys;        wz = q.Scalar*zs; 
  35:         xx = q.Vect[_X_]*xs;    xy = q.Vect[_X_]*ys;    xz = q.Vect[_X_]*zs; 
  36:         yy = q.Vect[_Y_]*ys;    yz = q.Vect[_Y_]*zs;    zz = q.Vect[_Z_]*zs; 
  37:  
  38:         (*this)[0].Set(1.f-(yy+zz),xy+wz,      xz-wy,      0.f);  // col 0 
  39:         (*this)[1].Set(xy-wz,      1.f-(xx+zz),yz+wx,      0.f);  // col 1 
  40:         (*this)[2].Set(xz+wy,      yz-wx,      1.f-(xx+yy),0.f);  // col 2 
  41:     } 
  42:     //忽略其它无关紧要的 
  43:     //、、、、、、、 
  44: }; 

 

//========================================================

不用多说,肯定有回过神来的,也有没有回过神来的。

正如上面那某位的博客里面讲到的。

image

对于旋转轴A,绕其旋转一定的角度,则可以表示为

x = s * Xa
y = s * Xb
z = s * Xc
w = cos(θ/2)
s = sin(θ/2)

这正是我们FromAxisAngle 所做的事情。

 

而QuaternionToMatrix则是对应了

image

 

我想说明的是,数学库本身并不在于代码。而是在于数学公式,代码仅是将其用另一种符号表示出来而已。只要仔细去看,定能明白其中的道理。

 

关于文中介绍的公式推导以及万向锁,可以GOOGLE和百度。

另外,编程中还经常用到欧拉角和矩阵的转换。

 

这三个的特点。

矩阵运算的数据相对来说比较直观,容易调试和诊断。但数据存储量大,特别是旋转的时候,会浪费很多空间。

欧拉角储存小,但有万向锁,并且插值不够平滑。

四元数据量介于二者之间。但插值容易。

在骨骼动画中,可以在文件中存储欧拉角,加载后将旋转数据转换为四元数。最后动画计算时统一采用矩阵运算。

要说的东西很多,一言难尽。今天就到这里吧。

posted @ 2011-10-15 21:08  青衫湮痕  阅读(17261)  评论(2编辑  收藏  举报