0805群论
方程
一元高次方程
一元二次方程是好解的。
一元三次方程 \(x^3+ax^2+bx+c=0\),首先将 \(x\) 替换为 \(x-\dfrac{a}{3}\) 消掉 \(ax^2\),变成 \(x^3+bx+c=0\)。
因为 \((p+q)^3=p^3+q^3+3pq(p+q)\),
所以如果设 \(x=p+q\),那么方程变成 \(x^3=p^3+q^3+3pqx\)。
所以,如果能找到 \(p,q\) 满足
就可以得到 \(x=p+q\)。
然后考虑解
就是解一元二次方程,求出 \(p^3\) 和 \(q^3\)。因为 \(p,q\) 有直接的关系存在,所以存在三组解,也就找到了 \(x\) 的三个根。
一元四次方程 \(x^4+ax^3+bx^2+cx+d=0\),也考虑消掉 \(ax^3\)
然后给左边配上系数 \(t\),使得 \((x^2+t)^2=(2t-b)x^2-cx-d+t^2\)。
我们只需要 \(t\) 使得右边的方程是完全平方式,即 \(\delta=0\)。
找到这样的 \(t\) 需要解一元三次方程,然后左边右边都是平方形式,开根即可。
韦达定理和根的轮换
我们发现,一元二次、三次、四次方程虽然都有解法,但是它们互相之间的联系并不紧密,甚至可以说没有相似之处。
古巴比伦人就通过韦达定理将一元二次方程化为以下形式:
然后利用完全平方公式 \((a+b)^2=(a-b)^2+4ab\) 得到
就变成了线性方程组,解出来即可。
考虑推广,我们发现三次方程可以由韦达定理转成如下形式:
我们发现,这三个方程都是轮换式,也就是交换 \(x_1,x_2,x_3\) 不会对答案有任何影响。
而有显而易见的证明:轮换式上的乘法是封闭的,轮换式和轮换式的乘积依旧是轮换式。
而上述的三个轮换式可以通过变换生成任意的三元轮换式。
因此,如果一个式子是轮换式,就一定能通过上述的三个式子表出。
范德蒙德方程组和轮换对称式
考虑对一元 \(n\) 次方程作韦达定理,会得到 \(n\) 个不同次的轮换式。这些轮换式即可以表出任意的 \(n\) 元轮换式。
然后我们发现,对于以下三元方程组:
虽然它的后两项都不是轮换对称的,但是我们将其立方,就变成
显然,我们将 \((2)^3\) 和 \((3)^3\) 者相加,得到
将 \((2)(3)\) 相乘,得到
这两个都是标准的轮换式,可以用韦达定理的方程表出,也就可以解。
而且我们惊奇的发现,\(p^3+q^3=a,pq=b\) 的形式在这里再一次出现了。
很快的,这一切可以开始推广,从二次,到三次,到四次……一元高次方程被劈开做了多元一次方程组,线性方程组则被简单粗暴的解决。我们似乎找到了通解。
但是,当我们着手用这一方法解五次方程时,我们却发现,想要通过韦达定理的右侧常数解出范德蒙德方程组的右侧常数,需要解一个六次方程。
发生什么了呢?我们就止步于此了吗?
方程上的群
方程上,有群的结构存在。
首先,我们考虑集合 \(\mathbb Q(\sqrt 2)=\{a+b\sqrt 2|a,b\in \mathbb Q\}\)。
这个集合是用 \(1,\sqrt 2\) 做加减乘除运算所能得到的所有数的集合。
我们考虑变换 \(\sigma(a)\),使得
\(\sigma(a+b)=\sigma(a)+\sigma(b)\)
\(\sigma(ab)=\sigma(a)\sigma(b)\)
\(\sigma(1)=1\)
在 \(\mathbb Q(\sqrt 2)\) 中,这样的变换只有两个。
一个是恒等变换 \(id(x)=x\)
一个是共轭变换 \(\phi(a+b\sqrt 2)=a-b\sqrt 2\)
其实,上述条件也证明了该变换是可逆的。
那我们来看 \(x^3=2\) 的根,它们分别是 \(\sqrt[3]2,\sqrt[3]2\omega,\sqrt[3]2\omega^2\)。
考虑变换时这三个根分别被变换到哪里去了。
容易发现,根只能变换到根,因为加法和乘法被保留了,所以 \(\sigma(x)^3=\sigma(2)=2\),所以 \(\sigma(x)\) 也一定是方程的根。
我们发现,对于这三个根的分裂域,三个根的变换就决定了变换本身,而三个根必然双射到三个根,因此一共的变换有 \(3!=6\) 种。
考虑方程的所有根 \(x_1,x_2,x_3,\cdots,x_n\),我们现在只关心它们之间的变换。我们会发现,首先,所有的 \(n\) 阶变换构成群。
\(S_n=\{\{\sigma(1),\sigma(2)\cdots ,\sigma (n)\}|\sigma(i)\in [n],\sigma(i)\neq \sigma(j)(i\neq j)\}\)
也就是,设 \(\sigma: [n]\rightarrow [n]\) 是一个双射,\(S_n\) 是所有符合条件的 \(\sigma\) 关于变换的复合构成的群。
容易证明,\(|S_n|=n!\),也即 \(n\) 的排列的个数。
然后我们考虑解方程。我们发现,对于一个普通的 \(n\) 次方程,它一定有 \(n\) 个根。这些根的变换揭示了它们之间的轮换关系。
可以发现,随着 \(n\) 的增加,合法的变换集合 \(H\) 是 \(S_n\) 的一个子群。当 \(H\) 变复杂到一定程度,就不太好解了。
但是有的高次方程是好解的,比如 \(x^5=1,x^{17}=1\),这是为什么呢?
我们发现,在 \(x^5=1\) 这个方程中,有一个特殊的根是 \(x=1\),去掉这个根之后,方程变成了 \((x-1)(x^4+x^3+x^2+x^1)=0\)。而 \(x=1\) 和别的根是没有轮换关系的,所以就是在解一个四次方程。
这就揭示我们:一个方程是否好解,要看它根之间轮换关系的规模。
什么东西天生适合作为群呢?
我们发现,群最难以论证的一点是 结合律,而“可逆映射”或者说“置换”却天生的明显的满足结合律。所以,置换群是最自然得到的群。恒等变换就是天生的幺元,逆映射就是天生的逆元。相较于加法,“可逆映射”没有交换律,更能代表更加一般的群。
群的作用
我们首先来讲群的作用。我们将置换群 \(G\) 作用于集合 \(X\),对于任意的 \(g\in G,x\in X\),都会得到一个新的元素 \(g(x)\)。
首先来看简单的群作用。
对于在模质数 \(p\) 剩余系 \(\{1,2,3,\cdots,p-1\}\) 下,定义模意义下乘法所构成的群 \(G\),我们尝试将群 \(G\) 的一个子群 \(H=\{h_0,h_1,h_2\cdots ,h_{k-1}\}\) 左乘于 \(\{1,2,3,\cdots,p-1\}\)(其实就是将置换群 \(\{\phi_i(x)=h_i x\}\) 作用于该集合)。
我们发现,对于 \(b\) 来说,被作用之后的所有结果的集合就是 \(\{bh_0,bh_1,\cdots,bh_{k-1}\}\)。这些结果再进行作用依旧是这个集合里面的数。换句话说,将群 \(H\) 作用于 \(X\) 后,集合被划分成 \(X=X_1\cup X_2\cup X_3\cdots \cup X_m\),每个集合再进行作用还是这个集合里的数,不可能再突破这个集合。
\(O_x=\{gx|g\in G\}\) 被我们称作 \(x\) 在 \(G\) 下的轨道,在 \(G\) 中的变换下,所有的轨道是封闭的,从 \(O_x\) 中的任意点可以通过 \(G\) 中的一个变换得到 \(O_x\) 中的另一个点,但不能得到 \(O_x\) 之外的点。
Cayley 定理
Cayley 定理:任何群 \(G\) 都同构于变换群 \(S_{|G|}\) 的子群
设当前的群是 \(G\),对 \(a\in G\) 定义 \(G\) 上的变换 \(L_a(g)=ag\)。
首先,存在 \(L_e\) 为恒等变换,\(L_e(g)=eg=g\)。
其次,\(L_a\) 存在逆变换,\(L_a^{-1}(L_a(g))=a^{-1}(ag)=g\)。
因此,\(L_a\) 的集合中有若干 \(|G|\) 阶变换,存在单位元和逆元。
而 \(L_a(L_b(g))=a(bg)=(ab)g=L_{ab}(g)\),显然是封闭的。所以 \(L_a\) 的集合就是一个群,且是 \(S_{|G|}\) 的子群。而 \(L_a\) 中的每一个置换都唯一对应 \(G\) 中的每个元素,每个置换的组合都对应 \(G\) 中的运算,所以 \(\{L_a\}\) 和 \(G\) 是同态的。
因此 \(G\) 同构于变换群 \(S_{|G|}\) 的子群 \(\{L_a\}\)。
pn 阶群存在 p 阶元
证明:对于质数 \(p\),\(pn\) 阶的群一定存在 \(a^p=e\)。
考虑 \(X=\{(x_1,x_2,\cdots ,x_p)|x_1x_2\cdots x_p=e\}\),容易发现,因为我们可以任选前 \(p-1\) 个元素,然后固定 \(x_p\) 为 \(x_1x_2\cdots x_{p-1}\) 的逆元,所以 \(|X|=|G|^{p-1}\),\(p||X|\)。
我们考虑 \(p\) 阶变换群 \(S_p\) 在 \(|X|\) 上的作用,每次会通过变换 \(\sigma\in S_p\) 把 \((x_1,x_2,\cdots,x_p)\) 变换成 \((x_{\sigma(1)},x_{\sigma(2)},\cdots,x_{\sigma(p)})\)。我们把 \(\{\sigma\}\) 作用在 \(X\) 上,因为 \(p\) 是素数,所以轨道长度只能是 \(1\) 或 \(p\)。如果轨道长度是 \(1\),就是 \(a^p=e\)。而显然存在 \(e^p=e\),所以轨道长度为 \(1\) 的轨道集合不为空,就至少存在 \(a^p=e\)。
卢卡斯定理
卢卡斯定理:
\(\begin{pmatrix}n\\m\end{pmatrix}\equiv\begin{pmatrix}\lfloor \tfrac{n}{p}\rfloor\\\lfloor\tfrac{m}{p}\rfloor\end{pmatrix}\begin{pmatrix}n\bmod p\\m\bmod p\end{pmatrix}(\bmod p)\)
生成函数证明:
\(\begin{pmatrix}pz+a\\py+b\end{pmatrix}=[x^{py+b}](1+x)^{pz+a}\) \((a,b<p)\)
\(=[x^{py+b}](1+x)^{pz}(1+x)^a=[x^{py+b}](1+x^p)^z(1+x)^a\)
注意到因为前者只有 \(p\) 的倍数处有值,后者不超过 \(p-1\),所以两者的卷积只能取在 \(i=py,j=b\)。
\(=[x^{py}](1+x^p)^z[x^{b}](1+x)^a=\begin{pmatrix}z\\y\end{pmatrix}\begin{pmatrix}a\\b\end{pmatrix}\)
组合数学证明:
我们考虑对 \(n\) 个格子的染色,我们将其划分成 \(p\times \lfloor\dfrac{n}{p}\rfloor\) 的大部分和 \(n\bmod p\) 的小部分。而所有的方案就是 \(\begin{pmatrix}n\\m\end{pmatrix}\)。
然后我们考虑对所有的方案的大部分进行置换群的作用。具体地,我们将 \(p\) 列进行置换,显然的,在这一置换下,所有的涂色方案被划分成若干个轨道。而因为 \(p\) 是质数,所以轨道的长度只能是 \(1\) 或者 \(p\)。对于长度为 \(p\) 的轨道,里面的染色方案的总和一定是 \(p\) 的倍数。
那么,我们只需要对轨道长度为 \(1\) 的答案进行计数。而轨道答案为 \(1\) 意味着每一行都是相同的。
因为小部分最多只能承担 \(p-1\) 个,所以大部分显然是 \(\lfloor\dfrac{n}{p}\rfloor\) 行选择 \(\lfloor\dfrac{m}{p}\rfloor\) 行,小部分就是 \(n\bmod p\) 个选择 \(m\bmod p\) 个。证毕。
群的中心
假如对群中的一个元素 \(x\) 和任意的元素 \(a\),有 \(xax^{-1}=a\),这意味着什么呢?我们发现 \(xa=ax\),也就是 \(x\) 和任意元素都是交换的。
考虑集合 \(C(G)\) 表示所有符合上述条件的 \(x\)。
\(C(G)\) 构成群。\(ea=ae=e\),所以单位元在 \(C(G)\) 中。如果 \(x\) 在 \(C(G)\) 中,那么 \(xa=ax\),\(x^{-1}xax^{-1}=x^{-1}axx^{-1}\),\(ax^{-1}=x^{-1}a\),因此 \(x^{-1}\) 也在 \(C(G)\) 中。
Burnside
我们考虑研究置换群的性质。
首先我们来考虑三角形上的变换,三角形有六种变换,旋转 60 度和翻折 180 度分别是其中的三阶元和二阶元。
而变换其实就对应了三角形上顶点的变换。
旋转 60 度:\(\{1,2,3\}\rightarrow \{2,3,1\}\)
翻折 180 度:\(\{1,2,3\}\rightarrow \{1,3,2\}\)
我们发现,在旋转 60 度的操作下,三个点都被移动了。但是在翻折 180 度的情况下,\(1\) 是不动的。
也就是,如果我们把 \((1,2,3)\) 和 \((1,3,2)\) 单独拿出来,也构成群。在这个群 \(G\) 的作用下,\(\{1,2,3\}\) 被划分成两个轨道 \(\{1\}\{2,3\}\)。
使得 \(x\) 是不动点的所有变换集合称作 \(H_x\)。明显的,\(H_x\) 构成一个群。
我们来研究另一个变换群。
考虑一个六边形项链,我们可以旋转 \(60\)、\(120\) …… \(300\) 度,或者沿着六条对称轴分别翻转,一共 \(12\) 种变换。
我们考虑对六边形 \(n\) 染色,然后考虑每种变换方案下哪些染色方案是不动点。
对于旋转 \(60\) 度,有 \(n\) 种(所有点同色)。
旋转 \(120\) 度,有 \(n^2\) 种(两个等价类)。
沿对角对称轴翻转,有 \(n^4\) 种。
沿中点对称轴翻转,每个是 \(n^3\) 种。
轨道稳定子定理
\(H_x\) 是 \(G\) 中让 \(x\) 为不动点的变换全体,\(O_x\) 是 \(x\) 在 \(G\) 下的轨道。
首先,\(H_x\) 是 \(G\) 的子群。
恒等变换显然让 \(x\) 为不动点,所以有单位元。
\(x\) 一直保持 \(x\),不可能变更,运算封闭。
如果 \(x\rightarrow x\),那么在逆映射中 \(x\rightarrow x\),存在逆元。
因此,\(H_x\) 是 \(G\) 的子群。
根据群论中的拉格朗日定理,\(|H_x|\) 是 \(|G|\) 的因子,且将 \(G\) 划分成 \(\dfrac{|G|}{|H_x|}\) 个陪集。
轨道稳定子定理:
\(|G|=|H_x||O_x|\)
考虑在 \(H_x\) 中,\(x\) 是不动点。所以将 \(H_x\) 作用于 \(O_x\) 中的每一个元素 \(y\),会构成若干个双元组 \((g,y)\)。我们将 \(y\) 在 \(g\) 中的映射一路追溯,直到找到一个 \(p\) 使得 \(y\) 经过若干次步骤映射到 \(p\),而 \(p\) 映射到 \(y\)。因为 \(H_x\) 中的映射都是双射,所以一定存在这样的点。
然后我们将 \(p\rightarrow x,x\rightarrow y\),也就把每个双元组对应到 \(G\) 中的一个变换。
对于 \(G\) 中的一个变换,考虑 \(p\) 和 \(y\) 分别是变换到 \(x\) 和 \(x\) 变换到的元素。将 \(x\rightarrow x,p\rightarrow y\),又能唯一的对应到双元组 \((g,y)\)。
而对于不同的 \(y\),建立的映射中,\(g(x)\) 是不同的,所以不会有重复。
那么,也就证明它们之间存在双射。
也就是,\(|G|=|H_x||O_x|\)
Burnside 引理
考虑证明轨道个数等于 \(\dfrac{1}{|G|}\sum_{g\in G}|X^g|\)(\(X^g\) 是在 \(g\) 下的不动点集合)
\(\sum_{g\in G}X^g=\sum_{g\in G}\sum_{x\in X^g}1\)
\(=\sum_{x}\sum_{g\in H_x}1=\sum |H_x|\)
\(=\sum \dfrac{|G|}{|O_x|}\)
考虑把 \(|G|\) 提出去,变成 \(|G|\sum \dfrac{1}{|O_x|}\)。
因为每个 \(x\) 会在自己的轨道里贡献一次 \(\dfrac{1}{|O_x|}\),所以每个轨道内的贡献总和是 \(1\),这就是轨道的个数。
我们也可以从别的方向考虑,我们考虑 \((x,g)\) 的配对。如果 \(g\) 让 \(x\) 不动,那么平面上 \((x,g)\) 就是 \(1\)。一开始,我们从 \(g\) 轴的角度考虑,总和就是 \(\sum_{g\in G}|X^g|\)。
但是如果我们从 \(x\) 轴的角度再考虑一次,每个 \(x\) 上的答案就是 \(|H_x|\)。而每个轨道内部的元素因为是等价的,所以 \(|H_x|\) 都是一样的。所以实际上就是对每个轨道计算一次 \(|H_x||O_x|\)。这就是 \(轨道个数\times |G|\) 了。
同样得到了 \(Burnside\) 引理。