[css] transform matrix

概述

/* 2D */
transform: matrix(1, 0, 0, 1, 0, 0);
/* 3D */
transform: matrix(1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1);

上面两行 css 代码其实什么变换都不会做，因为那是变换的默认状态，即没有变换。但是其中使用到了 matrix，翻译成中文叫做：矩阵。

更多的时候，我们使用类似如下语法：

transform: translateX(100px) rotateZ(30deg);

如上代码所示，一目了然，要做什么变换一看就知道了。但其实，这只是一个语法糖，其底层依然使用的是 matrix。

向量

什么是向量

向量：空间中的箭头

这个箭头由两个因素决定：方向 和 长度，
先把目光局限在二维空间下，如图：

上图中，在一个坐标系中画了四个不同长度和方向的箭头，每个箭头从原点发出，他们代表了二维空间中的四个向量，在线性代数中，向量通常以原点作为起点。

向量：是有序的数字列表

在坐标系中任意选取单位长度，这样就能够使用一个一个的刻度来标刻这个坐标系，选取特定的方向为x/y轴的正方向，那么不难看出，每一个向量，都可以用唯一的一个坐标来表示，同样的，坐标系中的每一个坐标都对应着一个唯一的箭头(向量)，如下图：

在坐标系中，由于坐标通常用来标示一个点，如 P(2, 8) 表示点 P 的坐标为 (2, 8)，为了区分点和向量，在表示向量时，通常把坐标竖着写，然后用一对儿中括号来描述，如上图中的(-2,3)

在三维空间也是一样的道理，如下图，唯一不同的是，每一个向量由 x/y/z三个数字组成的坐标来表示：

对于向量，只需要知道它是“空间中的箭头”或者“有序的数字列表”这就足够了。

基向量

基向量，也叫单位向量，是单位长度为1的向量，如下图中：i帽 和 j帽 就是这个二维坐标系的基向量：

线性变换

“变换”本质上是“函数”的一种花哨的叫法，与在数学中的概念类似，函数接收输入的内容，并输出对应的结果，如图：

变换也是同样的道理，只不过接收向量作为输入，并输出变换后的向量：

既然 “变换” 与 “函数” 本质相同，那么为什么叫变换而不叫函数？实际上可以把这个输入输出的过程，看做一个向量从初始状态到最终状态的一个变化过程，如下图：

宏观情况下，目前只讨论一个向量的变换.
二维空间的一整个平面，可以看做是由无数个向量组成(或者无数个点组成，因为每一个点唯一标识一个向量，所以这里说平面由无数个向量组成)，假如这无数个向量同时做相同的变换，那其实就可以看做是平面的变换：

变换前：

变换后：

不过，并非所有变换都叫做线性变换，线性变换必须要满足下面两个条件：

1、直线在变换后仍然为直线，不能有所弯曲
2、原点不能移动

如下变换，就不是一个线性变换，因为直线变成了曲线：

如何用数值描述线性变换？

空间的变换也可以说是向量的变换，而向量在空间中，可以用一组有序的数字列表来表示(即向量的坐标)，所以向量变换前后，必然会引起“有序数字列表的变换”，那么否可以用数字去描述变换呢？

空间中的任意一个向量都可以看做是：基向量变换后的和向量，如下图：

向量 v 的坐标是 (3,-2)，如果把 3 和 -2 看做两个标量，也就是纯数字，那么向量 v 可以看做是基向量被标量缩放后相加得到的和向量： v = 3i + (-2j)

假如有向量 v = -1i + 2j，如下图：

此时，基向量 i 的坐标是 (1, 0)【注意：为了方便，这里就用圆括号代表向量的坐标，下同】，基向量 j 的坐标是 (0, 1)，假设经过了某些变换之后，基向量 i 的坐标变为 (1， -2)，基向量 j 的坐标变为 (3， 0)，如下图：

那么变换后的向量 v 依然满足 v = -1i + 2j，如下：

以上例子所描述的事实，实际上是线性变换的性质的推论，该性质可以从几何角度表述为：线性变换后的网格平行且等距。

既然线性变换前后都满足该线性关系：v = -1i + 2j

那么很容易根据变换后 i帽 和 j帽 的坐标推算出变换后 v 的坐标：

也就是 (5, 2)

那么是否可以认为，给定任意一个向量，其坐标 (x, y)，可以通过变换后的基向量的坐标推断出该向量变换后的坐标呢？
答案是肯定的，假如基向量变换后的坐标 i帽 和 j帽 如下图：

那么任意向量 (x, y) 在经过变换后的坐标计算如下：

所以二维空间的线性变换仅由四个数字完全确定，这四个数字就是基向量 i 变换后 i帽 的坐标，以及基向量 j 变换后 j帽 的坐标，如下图：

只需要四个数字，就确定了二维空间的一个变换。通常把这四个数字放到一个 2 x 2 的格子中，称之为 2 x 2 矩阵：

现在，当再看到 2 x 2 矩阵的时候，第一几何直观反映应该是：它描述了一个二维空间的变换。

把情况一般化，如下图：

有一个 2 x 2 的矩阵 [a, c] [b, d]，其中 [a, c] 是基向量 i 变换后的坐标，[b, d] 是基向量 j 变换后的坐标，那么根据这个变换，以及线性变换的性质，可以推断出任意向量 [x, y] 变换后的坐标：

实际上，这就是数学家之所以这样定义矩阵的向量乘法的原因。

整理一下思路，首先，对于一个 2 x 2 的矩阵，第一列的两个数是对基向量 i 的变换，第二列的两个数是对基向量 j 的变换，这四个数字组成的 2 x 2 的矩阵，描述了一个对空间的线性变换，可以根据这个变换推断出任意一点(或者任意向量)变换后的坐标。

其实还可以换一个角度考虑，单纯的把 2 x 2 矩阵叫做变换，那么向量与矩阵的乘积，就可以看做是该向量应用了这个变换。其实，这就是矩阵向量乘法的几何意义。

回到 CSS 的 transform

看一下2D变换下 transform 属性的 matrix 写法：

transform: matrix(a, b, c, d, e, f);

//各个参数默认值
transform: matrix(1, 0, 0, 1, 0, 0);

transform 2D变换是一个 3 * 3 的矩阵. 因为位移(translate)，线性变换要满足其中一个特点：原点不能移动，但是位移却使原点发生了移动，所以 2 x 2 矩阵满足不了需求，只能再加一列，也就是 3 x 3 的矩阵。

把 matrix 中的 a b c d e f 放到一个 3 x 3 的矩阵中应该是这样的：

其实，在没有位移(translate)的情况下，[a, b] [c, d] 四个数字组成的 2 x 2 矩阵是完全可以描述2D变换的，现在只看由 [a, b] [c, d] 组成的 2 x 2 矩阵：

把 a b c d 四个数字使用默认值替换一下，即：a = 1，b = 0，c = 0，d = 1，如下：

通过之前的介绍，在看到这个矩阵的时候，应该知道，第一列的坐标 (1, 0) 应该是基向量 i 变换后的坐标，但是基向量 i 在变换前的坐标就是 (1, 0)，也就是说没有任何变换，同理，基向量 j 也没有任何变换，所以说，这就是 a b c d 默认值设定为下面代码所示的值的原因：

transform: matrix(a, b, c, d, e, f);
// a b c d 默认值为 1 0 0 1
transform: matrix(1, 0, 0, 1, e, f);
//e f 代表原点,默认是0 0

如果把 a 的值从 1 变为 2 那么矩阵如下：

也就是说，基向量 i 的坐标从 (1, 0) 变成了 (2, 0),是不是基向量 i 被放大为了原来的二倍？
举一个通俗的例子：原本单位长度1代表20px，被放大后单位长度1则代表40px。同样的，当把 a 的值从 1 变为 0.5 则意味着把基向量 i 缩小为原来的一半。事实上：在 transform: matrix() 中，修改 a 的值，就是在改变 x 轴方向的缩放比例：

transform: matrix(2, 0, 0, 1, 0, 0);
/* 等价于 */
transform: scaleX(2);

同理,修改 d 的值，就是改变 y 轴的缩放比例：

transform: matrix(1, 0, 0, 4, 0, 0);
/* 等价于 */
transform: scaleY(4);

那么旋转要如何修改 matrix 中的值呢？
其实，想要知道如何修改 a b c d 的值，只需要知道，旋转后基向量 i 和 j 的坐标就可以了，将旋转后的坐标对号填入就可以得到变换矩阵。

在 web 开发中的坐标系和数学中的坐标系在正方向的选取上不太一致，在大家所熟悉的坐标系中，正方向的选取如下：

而在 web 开发中，坐标系的正方向选取是这样的：

假设将其顺时针旋转 45 度，如下图：

假设，上图中旋转的是单位向量，那么旋转后单位向量 i 的坐标应该是 (cosθ, sinθ)，单位向量 j 的坐标应该是 (-sinθ, cosθ)，所以如果用矩阵表示的话，应该是这样的：

如果写到 matrix 里，自然就是下面这个样子：

transform: matrix(cosθ, sinθ, -sinθ, cosθ, 0, 0)

所以，如果要顺时针旋转 45 度，下面两种写法是等价的：

/*
 * Math.cos(Math.PI / 180 * 45) = 0.707106
 * Math.sin(Math.PI / 180 * 45) = 0.707106
 */
transform: matrix(0.707106, 0.707106, -0.707106, 0.707106, 0, 0)

/* 等价于 */
transform: rotate(45deg);

通过上面缩放和旋转的例子知道2 x 2 的矩阵确实能够描述二维空间的变换，这也就是矩阵能够操作空间的原因。在 transform 中，除了缩放(scale)、旋转(rotate) 还有倾斜(skew)，对于倾斜，类似于寻找旋转后基向量的坐标一样，只需要根据倾斜所定义的变换规则，找到基向量变换后的坐标就可以了，实际上倾斜对应如下规则：

transform: matrix(1, tan(θy), tan(θx), 1, 0, 0);

无论缩放(scale)、旋转(rotate) 还是倾斜(skew)，都不会是原点发生改变，所以使用 a b c d 四个数字组成的矩阵完全可以描述，但是还有一个位移(translate)，这时，就不得不提到 e f 了，e f 分别代表了 x y 方向的位移：

transform: matrix(1, 0, 0, 1, 100, 200)

/* 等价于 */
transform: translateX(100px) translateY(200px);

至此，transform 使用 3 x 3 矩阵来描述二维空间变换的方式。

除了2D变换，还有3D变换，在 transform 中，使用 4 x 4 的矩阵描述3D变换，但实际上，三维空间的线性变换只需要一个 3 x 3 的矩阵就可以描述了，那么为什么搞了一个 4 x 4矩阵呢？实际上这和在将二维空间的变换使用 3 x 3 矩阵的道理是一样的，那就是位移。

看一下3D变换的 matrix 默认值：

transform: matrix(a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p);
transform: matrix(1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1);

这十六个数字就是 4 x 4 矩阵的 16 个数值：

如果换成对应数字，是这样的：

类似于 2D 变换一样，其中由

组成的 3 x 3 矩阵用来描述空间的 3D 线性变换，如：rotateX rotateY scaleZ 等等，注意：rotateZ 是 2D 变换。

而 m n o 则分别用来描述位移：translateX translateY translateZ。

关联阅读

矩阵计算

posted @ 2018-06-20 22:09 晴明桑阅读(675) 评论(0) 编辑收藏举报

刷新页面返回顶部