超平面详解

参考文献

[1] https://blog.csdn.net/denghecsdn/article/details/77313758

以下是我阅读其之后的一些总结。

超平面的定义

n 维空间中的超平面由下面的方程确定[1]:

\[w^Tx+b=0 \]

其中,

\[\begin{aligned} x &= \left [ \begin{matrix} x_1 & x_2 & \cdots & x_n \end{matrix} \right ]^T\\ w &= \left[ \begin{matrix} w_1&w_2&\cdots&w_n \end{matrix} \right]^T \end{aligned} \]

\(w\)为法向量表示超平面的方向,\(b\)为一个实数表示超平面到原点的距离。

现在让我们来看看\(w\)\(b\)的具有上述意义的原因

\(w\)为什么是超平面的方向

什么是平面

由各个分量的线性组合构成的点的集合,这个平面的自由度比空间的自由度小1

超平面是纯粹的数学概念,不是物理概念,它是平面中的直线、空间中的平面的推广,只有当维度大于3,才称为“超”平面。 [1]

什么是自由度

可以简单的理解为:

至少要给定多少个分量的值才能确定一个点 [1]

例如三维空间中的只要给定了任意两个分量的值,剩下的那个就是确定了的(超平面的表达式为各分量的线性组合),所以三维空间中的(超)平面的自由度为2,也就是说,至少需要确定2个分量的值才能确定一个点。

超平面的另一种定义

给定向量空间 \(R_n\) 中的一个点 \(p\) 和一个非零向量\(n\) ,满足:$$n*(i-p)=0$$

则称点集\(i\)为通过点\(p\)的超平面,\(n\)为通过超平面的法向量。

现在让我们来看看这个公式是怎么来的。
给定向量\(\textbf {a}=\left[\begin{matrix} a_1&a_2&\cdots&a_{n-1}\end{matrix}\right]\),\(b\neq 0\space \and\in R\),\(c \in R\),超平面\((\textbf {a},b,c)\)则可以表示为:

\[\textbf {a}·\textbf {x}+\frac{1}{b}y+c=0 \]

tip: y的系数为\(\frac{1}{b}\)只是为了后面式子的简洁。
则:$$y=-\textbf {a}·b\textbf {x}-bc$$

\((\textbf {x},y)\)则可以表示为:

\[\begin{aligned} (\textbf {x},y) &= (\textbf {x},-\textbf {a}·b\textbf {x}-bc)\\ &= \textbf{x}(1,-\textbf {a}·b)+(\textbf{0},-bc) \end{aligned} \]

这个超平面(直线)的意义为:

过点$(\textbf{0},-bc)$,方向(方向向量)为$(1,-\textbf{a}·b)$的超平面(直线)

我们令\(n=(\textbf{a},\frac{1}{b}),i=(\textbf{x},y)\),则:

\[n·i+c=0 \]

我们在超平面(直线)\((\textbf{a},b,c)\)上取一个点\(p_0\),即令\(i=p_0\),那么:$$c=-n·p_0$$
则有:

\[\begin{aligned} n·i-n·p_0 &= 0\\ n·(i-p_0)&=0 \end{aligned} \]

\[\because i \in (\textbf{a},b,c) \and p_0 \in (\textbf{a},b,c) \]

\[\therefore i-p_0 \in (\textbf{a},b,c) \]

根据向量点积的几何意义知\(n\bot(\textbf{a},b,c)\),所以对于超平面\(\textbf {a}·\textbf {x}+\frac{1}{b}y+c=0\),其法向量\(n=\left[\begin{matrix} \textbf{a}&\frac{1}{b} \end{matrix}\right]\).
一般的,对于超平面\(\textbf {w}·\left[\begin{matrix} \textbf {x}&y\end{matrix}\right]+c=0\),其法向量为\(\textbf {w}\).

posted @ 2022-09-23 08:49  Hisi  阅读(391)  评论(0编辑  收藏  举报