《计算机与人工智能应用数学》学习笔记
作业 50%,期中期末各 25%。
Lecture 1: Probability Theory Basics
概率空间 probablity space
随着概率问题变得越来越复杂,我们需要概率的精确的数学定义。
离散情况下,概率空间
- 样本空间 universe
是非空有限集。 - 概率函数 probability function
且 。
三门问题 Monte Hall problem
一个经典问题。
一个门后有大奖,选定一个门之后会得知一个不是当前门的没有大奖的门。
- 如果不切换,那么概率是一开始选中的概率
。 - 如果在剩下两个门随机选,那么概率是
。 - 如果切换,那么概率是一开始没选中的概率
。
在描述概率空间时需要小心:直觉有可能导致错误的结果!
基本计数规则 basic counting rule
生日悖论 birthday paradox
, 。 根据经典不等式
可知
是对 的良好近似。给定概率 ,计算 的 可以用 近似。
基本计数规则 basic counting rules:对于均匀的概率函数,
- 加法原理 addition rule:如果
是 的无交并,则 。 - 乘法原理 multiplication rule:如果
的每个元素可以和 一一对应,其中 ,则 。
37% 法则 the 37% rule
是均匀随机的 的排列。在不知道之后的数的情况下依次决定每个数是否选择,最多选一个数,希望选中 。 策略
:跳过前 个数,选择第一个 使得 。分析其概率:
- (加法原理)设
是使得策略成功的排列, 为 中使得 的排列,则 是 的无交并。 - (乘法原理)使得
的排列有 个,落在 中要求 ,概率是 。 综上,
求导可知在
时最优,最优值为 。
基本概率工具 essential probability tool
#1 布尔不等式 Bool's inequality, union bound:对有限多个事件
这些很简单的不等式可以给出很惊人的结论。
拉姆齐数 Ramsey number:点数不小于
的图一定存在 个点的团或 个点的独立集。 。 Ramsey 定理:对任意
,存在 使得对任意 个点的图,图上有大小为 的完全图或独立集。 。 作业:证明
。具体是先证明 然后归纳。 Theorem
Paul Erdos 1947.
Proof
设
。 对于大小为
的点集 ,在随机图上 形成完全图的概率为 。根据布尔不等式,至少存在一个完全图或独立集的概率不超过
概率方法 probabilistic method:通过概率分析而非显式构造来证明一个数学对象的存在性。由 Paul Erdos 创立。
#2a 条件概率 conditional probability:给定
在逻辑上,
#2b 链式法则 chain rule:
将链式法则应用在生日悖论上:设
分配律 distributive law:设
若
Lecture 2: Statistics on a Probability Space
条件概率(续)conditional probability continued
两个事件
当
排列的环长 cycle length in a permutation
设
表示 的包含 的环长。注意到 而
。由链式法则,对任意 ,
团的贪心算法 greedy clique algorithm
贪心地检查每个点能否和当前的团形成团。
设
是最终得到的团,则对于随机图, 上界
在集合已经有
个元素时,新加入一个点的概率为 。 设
,设 表示第 个加入的点是 的事件,由分配律, 考虑到
于是
上界的
中, 可以是增长任意缓慢的函数,只要 。 下界见本章最后。
N 门问题 n doors problem
每个人只允许打开
扇门。 一个人的成功概率是
,但是两个人都成功的概率可以大于 。策略:两个人事先约定门的排列 ,每个人从自己对应的门开始找。成功的概率是两个人的宠物所在环长均不超过 的概率,是 。 所有人都成功的概率等于没有环长超过
的概率,使用组合数学得到 。
随机变量 random variable
一个 随机变量 是一个函数
定义期望的和
#3 期望的线性性 law of linear expectation:若
环的个数的期望 expected number of cycles
设
表示环的数量,则 。由期望的线性性,
条件期望 conditional expectation:
#4 期望的分配律 distributive law for expectation:设
几何分布的期望 mean of the geometric distribution
抛掷一枚正面概率为
的硬币,设 是第一次抛出正面的次数。
随机变量
标准差 standard deviation:
因此方差通常也写作
几何分布的方差 variance of the geometric distribution
称
此时
方差衡量了随机变量的分散程度。
尾部估计 tail estimate
概率工具其五。
马尔可夫不等式 Markov's inequality:
设
Proof
另一种形式为
切比雪夫不等式 Chebyshev's inequality:
Proof
对
使用 Markov 不等式,得到
界不是很紧,但适用范围非常广泛。
团的贪心算法的下界 lower bound of the greedy clique problem
设
表示第 个加入的结点编号, 。 Observation
是概率为 的几何分布。 设
,那么问题等价于 根据期望的线性性,
因为
是独立随机变量,所以 若
,那么 。于是 由 Chebyshev 不等式,
Lecture 3: Tail bounds continued
切比雪夫不等式 Chebyshev's inequality
使用 Chebyshev 不等式时,需要计算
随机图的最大团(下界) largest clique of a random graph (lower bound)
设
, 是所有大小为 的子集。 对每个
设随机变量 , 当且仅当 是团。考虑 , 表示 ,则 。 考虑以下两个命题:
- 当
时, 。 。 若命题成立,则根据 Chebyshev 不等式,
Proof (2)
对
, 和 是独立的。于是 其中最后一步用到引理(作业)
而
,所以 (2) 成立。
概率估计的几何解释
设随机变量
计算得
如果使用 Markov 不等式,则会得到很差的结果,因为标准差和均值不在同一个数量级。
考虑
如果
当
当
现在我们考虑更激进的估计方法:指数函数。
切诺夫界 Chernoff bound
因为
切诺夫界 Chernoff bound:设随机变量
Proof
设
。 由 Markov 不等式,
根据经典不等式
, 最小化
,得到 ,所以 根据
得到 于是
类似可以证明
取
Corollary 1
Corollary 2
当
时,
Chernoff 界的平均值形式:对于
其中最后一个不等号成立是因为
霍夫丁不等式 Hoeffding's inequality:设
还讲了一个关于鞅的 Azuma 不等式。
LAZYTAG
Lecture 4: Advanced Applications
熵 extropy
信息熵 是定量化地描述随机性的工具。随机变量
当
接下来主要研究二元随机变量。
熵和二项系数 entropy and binomial coefficients
设
是整数。 Proof
对于上界,直接二项展开。
对于下界,考虑相邻两个二项系数的差,则
可知当
时差非负,所以当 时取到最大值,其大于平均值 ,再使用类似上界的方法即可。
熵衡量了多少 unbiased,独立的 bits 可以从随机变量中取出。
extraction function
Theorem
如果想保证均匀随机但如果映射到太长的序列,会导致总概率大于 1
Compression
将一个随机变量的结果压缩到更短的长度上,使得期望长度小于随机变量结果的长度,但不能有一个压缩是另一个压缩的前缀。Huffman tree
对于
,对任意 ,当 足够大时,存在 使得期望长度不超过 ,且对任意 都有期望长度至少 。
Shannon’s Theorem
the problem of reliable communication over a noisy channel.
有
给定
香农定理:
对任意
,当 足够大时,对任意 ,存在 编码解码使得错误率不超过 。 对任意
,不存在 解码编码使得错误率不超过 。 最简单的编码方式:对每个
都有若干 Enc,考虑 Hamming distance。 设
,则 分布在 个 附近。 有
的概率, 那么有
的概率 . 设
表示 且对任意 , 。 我们希望
对每个 都很大。 Lemma
的大小不超过 ,其中当 时 。 作业,气笑了。
均匀随机选
,考虑不成功的概率,使用 union bound 小技巧:
- 第一步:先选
个,平均下来是好的。 - 第二步:丢掉最差的那一半。
不要对所有 pair 都用 union bound,设
。 Lemma
这里的期望对所有
和 。 那么一定有一个
是好于平均的,即 于是让
只保留最好的那部分,即 最小的那些,于是对任意 , 。
Hypercude networking routing problem
transmit message, a cable transmit 1 messgage in 1 sec
在超立方体上考虑问题。
rounting task 是一个排列。希望找到一个合理时间内能够完成的传输方式。
bit-fixing algorithm:找到第一个不同的位然后翻转。长度是
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具
· Manus的开源复刻OpenManus初探