有限域上的挂谷集合与 Nikodym 集合
引入
有限域上的挂谷 (Kakeya) 集合是 \(\mathbb R^2\) 情况的挂谷集合 (又称 Besikovitch 集合) 的类比.
设 \(q\) 元有限域 \(\mathbb F\), 称一个集合 \(K\subset \mathbb F^n\) 是挂谷集合, 当对于任意方向 \(\ell \in \mathbb F^n\), 都存在 \(a\in \mathbb F^n\), 使得 \((a + \ell t) \in K, \forall t\in \mathbb F\), 换句话说, 就是 \(K\) 包含任意一条方向上的直线.
称一个集合 \(N\subset \mathbb F^n\) 是 Nikodym 集合, 当对于任意 \(a\in \mathbb F^n\), 要么 \(a\in N\), 要么存在一条过 \(a\) 的直线 \(\ell\), 使得 \(\ell \subset N \cup \{a\}\).
我们想要问的是, 挂谷集合和 Nikodym 集合至少要有多大? 对于固定的 \(n\) 而言, 人们一度认为得到一个 \(\Omega(q^n)\) 的下界是很难的, 但在 2008 年, Zeev Dvir 给出了简单一个漂亮的证明, 而后又被诸多人改进.
多项式方法
我们首先给出 Nikodym 集合的一个下界.
定理 1. \(|N| \geq c_n q^n\), 其中
\[c_n = \frac 1{n!}. \]
首先回忆 Schwartz–Zippel 引理:
Schwartz–Zippel 引理. 对于域上的一个 \(n\) 元 \(d\) 次非零多项式 \(F\), 以及一个集合 \(S\), \(F\) 在 \(S^n\) 上的零点数量不超过 \(d |S|^{n-1}\).
我们先不回顾这个引理的证明, 因为之后需要证明一个更强的结果.
一般来说我们都取 \(S = \mathbb F\), 这样我们就可以知道, 一个 \(< q\) 次多项式如果处处为 \(0\), 那么它一定是零.
现在我们证明定理 1.
证明. 考虑全体度数 \(<q-1\) 的多项式构成的线性空间 \(V =\mathbb F[X]_{<q-1}\), 令同态 \(\phi \colon V \to \mathbb F^N\) 定义为 \(\phi(F)_a = F(a)\), 也就是多项式求值. 考虑检查 \(\ker \phi\), 也就是在 \(N\) 上消没的多项式.
如果 \(a\in N\), 根据定义, 我们有 \(F(a)=0\). 如果 \(a\notin N\), 根据 Nikodym 集的定义, 我们有一条直线 \(\ell(t)\) 使得 \(\ell(0)=a\), 且 \(F(\ell(t))=0, \forall t\neq 0\). 注意 \(\ell\) 是一次函数, 所以 \(F(\ell(t))\) 是 \(<q-1\) 次多项式, 但我们已知它有了 \(q-1\) 个零点.
这说明 \(F(\ell(t))\) 整个就是零多项式, 带入 \(0\) 也必然是 \(0\), 我们有 \(F(a) = 0\).
综上, \(F\) 在整个 \(\mathbb F^n\) 上消没, 而 \(F\) 又是度数小于 \(q\) 的, 这说明 \(F\) 只能是零.
综上, \(\phi\) 是单射, 必然有 \(\dim V \leq |N|\), 简单数数可以知道
因此 \(|N| \geq q^n/n!.\square\)
相比之下, 挂谷集合的证明更具有技巧性一些. 或者说, 这个证明本质上需要一些其他方面的洞察来帮助.
定理 2 (Dvir) \(|K| \geq c_n q^n\), 其中
\[c_n = \frac 1{n!}. \]
证明. 考虑求值 \(\phi \colon \mathbb F[X]_{<q} \to \mathbb F^K\).
对于任何一个非零多项式 \(F\in \ker \phi\), 将它写成各齐次部分的和 \(F = F_0 + \cdots + F_d\), 其中 \(F_d\neq 0\).
对于任意 \(\ell\in \mathbb F^n\), 根据挂谷集合的定义, 有 \(a\in \mathbb F^n\) 使得 \(F(\ell t + a)\) 处处为 \(0\), 进而是零多项式. 考察 \(F(\ell t + a)\) 的 \(d\) 次项系数, 它只能被 \(F_d\) 贡献, 而且等于 \(F_d(\ell)\), 所以 \(F_d(\ell) = 0\). 由于这对一切 \(\ell\) 都成立, 所以 \(F_d = 0\), 矛盾.
所以 \(\phi\) 是单射, 我们有
观察最高次项的这个洞察可以用射影几何的角度来解释. 射影空间可以看做以仿射空间所有过原点的直线来当做点, 而一个多项式的最高齐次部分刻画了 "无穷远处" 的性质.
带重数的多项式方法
我们这里定义 \(F\in \mathbb F[X_1,\dots,X_n]\) 在点 \(a\) 处的重数 \(\mu(F,a)\) 是最大的正整数 \(\delta\) 使得 \(F \in (X_1-a_1,\dots,X_n-a_n)^\delta = \mathfrak{m}_a^\delta\), 或者等价地说, 对于任意 \(e\in \mathbb N^n\) 使得 \(\sum e_i < \delta\), 定义
有 \(F^{(e)}(a) = 0\).
为了利用重数, 我们需要更强的 Schwartz–Zippel 引理.
加强版 Schwartz–Zippel 引理. 对于域上的一个 \(n\) 元 \(d\) 次非零多项式 \(F\), 以及一个集合 \(S\), \(F\) 在 \(S^n\) 上的重数总和不超过 \(d |S|^{n-1}\).
证明. 方法大同小异, 考虑进行归纳. 归纳的基础是 \(n=1\) 的情况, 这个时候多项式有唯一分解, 正确性是显然的.
接下来, 将多项式写成 \(F = \sum_i X_1^{d-i} F_i\), 其中 \(F_i\) 是关于 \(X_2,\dots,X_n\) 的不超过 \(i\) 次多项式. 我们取最小的 \(i\) 使得 \(F_i\) 非零. 我们考虑首先枚举 \(a_2,\dots,a_n\). 假设 \(F_i\) 在 \((a_2,\dots,a_n)\) 处的重数是 \(m\), 也就是说存在一个 \(e' = (e_2,\dots,e_n)\) 使得 \(F_i^{e'}(a_2,\dots,a_n)\neq 0\), 那么\(f(X_1) = F^{(0,e')}(X_1,a_2,\dots,a_n)\) 是 \(d-i\) 次多项式, 在 \(a_1\in S\) 处的重数为 \(e_1\) 的话, 则 \(a_1,\dots,a_n\) 处 \(F\) 的重数不超过 \(e_1 + e_2 + \cdots + e_n\). 求和得到重数之和 \(\leq (d-i)|S|^{n-1} + |S| \cdot i|S|^{n-2} = d\cdot |S|^{n-1}\). \(\square\)
注意这个不等式对于 \(d \geq |S|\) 也是有意义的.
现在我们可以证明一些更强的估计了.
定理 3.
\[|N| \geq \left(\frac{q}{2}\right)^n. \]
证明. 我们先考虑一个多项式 \(F\) 次数不超过 \(d\), 且在每个 \(N\) 的点上的消没次数都至少是 \(m\).
我们选定 \(v < m\), 对于任意一个点 \(a\notin N\), 我们知道有 \(\ell \neq 0\) 使得 \(\ell t + a\) 在其他点上交于 \(N\). 那么考虑对于任意 \(|e| < v\), Hasse 导数有 \(F^{(e)}\) 在 \(N\) 上消没次数 \(\geq m-v\), 如果 \((m-|e|)(q-1) > d-|e|\), 那么 \(F^{(e)}(a\ell + t)\) 就是 \(0\) 多项式, 必然有 \(F^{(e)}(a) = 0\) 了, 因此在 \(a\) 处的消没次数至少是 \(v+1\).
进一步地, 根据强 Schwartz–Zippel 引理, 如果一个多项式处处消没次数 \(\geq v\), 我们就有 \((\deg F)q^{n-1} \geq (v+1)\cdot q^n\), 进而 \(d \geq (v+1)\cdot q\). 所以如果我们再加上 \(d < (v+1)\cdot q\), 这样的多项式就是不存在的了.
综上, 如果我们的参数满足
映射 \(\phi \colon \mathbb F[X_1,\dots,X_n]_{\leq d} \to (\mathbb F[X_1,\dots,X_n]_{<m})^{N}\) 就是单射, 因此
取
的时候 \(d\) 可以达到最大值, 此外有无穷多的 \(m\) 使得这个 \(v\) 是整数, 这个时候
进而
结合定理 2 和 3 的证明经验, 我们可以得到类似的对于挂谷集合的估计
定理 4 (Dvir, Kopparty, Saraf, Sudan)
\[|K| \geq \left(\frac{q}{2-1/q}\right)^n. \]
Hilbert 函数
定义 \(A=\mathbb F[X_1,\dots,X_n]\), 对于理想 \(I\), 定义 \(I_{\leq d}\) 是 \(I\) 中度数 \(\leq d\) 的部分, 构成一个线性空间, 对此可以定义仿射 Hilbert 函数
接下来我们简记作 \(H_I(d)\). 对于点集 \(X\subset \mathbb F^n\), 我们定义 \(H(X,d) = H_{I(X)}(d)\).
我们需要用到 FKG 不等式来证明一个需要的结论, FKG 不等式本身的证明我们略去.
FKG 不等式 (Fortuin–Kasteleyn–Ginibre) 对于分配格 \(L\) 上的对数超模 (log supermodular) 函数 \(\mu(x)\mu(y) \leq \mu(x\land y)\mu(x\lor y)\), 有
\[\langle f \rangle \langle g \rangle \leq \langle fg\rangle \langle 1\rangle, \]其中 \(f,g\) 是 \(L\) 上的单调递增函数, 且 \(\langle f\rangle = \sum_x f(x)\mu(x)\).
引理. 对于点集 \(X\subset \mathbb F^n\), 有 \(H(\mathbb F^n, d) |X| \leq H(X, d) q^n\).
证明. 这个证明的方法是将 \(H(X, d)\) 转化成一个具体的几何对象上的点数. 考虑一个单项式的分级序, 比如 \(a < b\) 当 \(|a| < |b|\), 或 \(|a|=|b|\) 且 \(a\) 字典序小于 \(b\).
一个基本的事实是, \(H(X,d)\) 就是形如 \(|a| \leq d\) 且 \(X_1^{a_1}\cdots X_n^{a_n}\) 不是任何一个 \(I\) 中的多项式的首项 (按照分级序确定) 的倍数, 我们记这些 \(a\) 构成集合 \(S\), 那么 \(H(X,d)=|S|\). 此外, 由于 \(X\subset \mathbb F^n\), 有 \(I(X)\supset I(\mathbb F^n) = (X_1^q-X_1,\dots,X_n^q-X_n)\), 进而有 \(S \subset \{0,\dots,q-1\}^n\).
我们考虑 \(\{0,1,\dots,q-1\}^n\) 上的分配格 \(\geq\), 显然 \(f(x) = [x\in S]\) 是单调递增的, \(g(x) = [|x| \leq d]\) 也是单调递增的. 所以根据 FKG 不等式, 取 \(\mu = 1\), 有
带入得到 \(|X| H(\mathbb F^n,d) \leq H(X,d) q^n\). \(\square\)
回忆 Zariski 闭包 \(\overline X = V(I(X))\) 是把所有在 \(X\) 上零化的多项式的零点集取交, 我们考虑 \(Z_d(X) = V(I(X)_{\leq d})\), 这能一定程度上类比我们对于之前做的操作.
定理 5 (聂, Wang)
\[H(\mathbb F^n, d) |Z_d(X)| \leq q^n |X|. \]
证明. 首先, 根据前述引理, 有
接着, 注意到 \(Z_d(X) \supset X\), 所以 \(I(Z_d(X)) \subset I(X)\), 进而 \(I(Z_d(X))_{\leq d} \subset I(X)_{\leq d}\). 另一方面, 如果 \(f\in I(X)_{\leq d}\), 那么按照定义, \(f\) 也零化了 \(Z_d(X)\), 所以 \(I(X)_{\leq d} = I(Z_d(X))_{\leq d}\), 所以
最后, 注意到 \(H(X,d)\) 随着 \(d\) 的增加而增加, 收敛到 \(|X|\), 我们有 \(H(X,d)\leq d\). 结合这三个不等式或等式就得到了 \(H(\mathbb F^n, d) |Z_d(X)| \leq q^n |X|\). \(\square\)
挂谷问题的 Statistical 版本是指将控制从 "对所有都成立" 改成 "对很多成立", 由于多项式只要确定了足够多的点就能确定本身, 可以预见的是这也是能有一定的控制的.
我们考虑运用定理 5, 对于集合 \(Y\), 如果 \(x\in X\) 都存在一条直线经过 \(x\) 以及至少 \(Y\) 上的 \(d\) 个点, 那么对于任何一个次数 \(<d\) 的多项式零化 \(Y\), 我们必然有 \(x\) 也被这个多项式零化, 因此 \(X\subset Z_{d-1}(Y)\), 进而有
由于 \(d \leq q\) 时有 \(H(\mathbb F^n, d-1)\), 我们有 \(H(\mathbb F^n, d-1) = \binom{n+d-1}{n} \geq d^n/n!\), 对于 \(d = \gamma q\), 我们有
带重数的 Hilbert 函数
记 \(H^m(X,d) = \operatorname{{^a}HF}_{I(X)^m}(d)\), 注意 \(I(X)^m\) 对有限集来说也就是在 \(X\) 每个点上消没次数至少是 \(m\) 的多项式.
接下来, 我们还可以把原先定义的 \(Z_d(X)\) 拓展到 \(Z_d^{\ell,m}(X)\), 定义为
也就是说, \(y\in Z_d^{\ell,m}(X)\), 当任何在 \(X\) 上消没次数 \(\geq m\) 的次数 \(\leq d\) 的多项式都在 \(y\) 上消没次数 \(\geq \ell\).
对于结合重数论证, 我们可以对 Statistical 版本的挂谷问题有更好的上界.
定理 6 (聂, Wang) 对于 \(X, Y\subset \mathbb F^n\), 每个 \(x\in X\) 都有一条次数不超过 \(\Lambda\) 的曲线 \(C_x(t)\) 过 \(x\), 且交 \(Y\) 于至少 \(\tau\) 个点, 假设 \(\tau > \Lambda\), 那么
\[|X| \leq \left(1 + \frac{\Lambda(q-1)}{\tau}\right)^n |Y|. \]
证明. 先假设选取的 \(d, \ell, m\) 满足 \(\Lambda d < \tau(m-\ell + 1) + \Lambda(\ell - 1)\), 我们证明此时 \(X\subset Z_d^{\ell, m}(Y)\): 对于任意一个 \(x\in X\), 根据定义, 有次数不超过 \(\Lambda\) 的 \(C_x(t)\) 经过 \(Y\) 至少 \(\tau\) 次. 那么对于任意一个多项式 \(f \in I^m(Y)_{\leq d}\), 而对于任意 \(i=|e| < \ell\), 我们欲证明 \(f^{(e)}(C_x(0)) = f^{(e)}(x)=0\).
考虑 \(f^{(e)}(C_x(t))\) 是一个 \(\Lambda(d-i)\) 次多项式, 它在 \(\tau\) 个位置具有 \(\geq m-i\) 阶重数, 为了保证它是 \(0\), 只需 \(\Lambda(d-i) < \tau(m-i)\), 也即 \(\Lambda d -\tau m <(\Lambda-\tau)i\), 为了使得所有 \(i<\ell\) 都满足, 只需 \(\Lambda d -\tau m <(\Lambda-\tau)(\ell-1)\), 整理一下可以发现这是前面所设的条件足够导出的.
因此我们一定有 \(x\in V^\ell(I^m(X)_{\leq d})\), 那么就有 \(X\subset Z_d^{\ell, m}(Y)\) 了.
又设 \(d\geq (\ell - 1)q + n(q-1)\), 考虑 \(H^\ell(X, d)\), 考虑 \(I(X)^\ell \supset I(\mathbb F^n)^\ell = (X_1^q-X_1,\dots,X_n^q-X_n)^\ell\), 这说明 \((X_1^q-X_1,\dots,X_n^q-X_n)^\ell\) 被
张成, 所以在数点的时候, 如果 \(X_1^{d_1}\cdots X_n^{d_n}\) 满足
就有 \(X_1^{d_1}\cdots X_n^{d_n}\) 一定偏序某个生成元. 我们进一步把条件放宽成
就得到了 \(\sum_i d_i > n(q-1) + (\ell-1) q\) 一定可以被排除. 所以所有的点都包含在 \(d\leq (\ell -1)q + n(q-1)\) 中, 我们就有
接下来, 由于 \(X\subset Z_d^{\ell, m}(Y)\), 我们有 \(H^\ell(X,d) \leq H^\ell(Z_d^{\ell, m}(Y), d)\), 而
显然 \(I^\ell(V^\ell(\bullet)) \supset \bullet\), 所以
最后, 必然有
综合整个不等式链条, 我们得到了
而
我们所设的条件下 \(m/\ell\) 由不等式
控制, 易见 \(m/\ell\) 趋近于 \(\Lambda(q-1)/\tau + 1\), 所以就有
和前面不带 Hilbert 函数的推论做比较, 比如取 \(\tau = \gamma q\) 和 \(\Lambda = 1\), 我们就有