模拟退火学习笔记

本篇参考了一下Chhokmah小姐姐的博客

概念：

其实基于爬山，爬山是一个非常笨的贪心，爬山本质是按照一个方向找最高点，不过找到一个比两边都高的点就会停下，这显然是错的，结果却由此诞生了一个模拟退火。

模拟退火\((Simulate\ Anneal,SA)\)是一种通用概率演算法，用来在一个大的搜寻空间内找寻命题最优解，是解决\(TSP\)问题的有效方法之一。其出发点基于物理中固体物质的退火过程。模拟退火是一种通用的优化算法，其物理退火过程由加温过程、等温过程、冷却过程三部分组成。

基本上就是选一个初解，然后简单变化得到新解，如果可以更新就更新，不能就按概率更新，然后持续操作，最后收敛到最优解。

来自\(Chhokmah\)的解释：

我们还是爬山算法，还是判断当前答案是不是更优，但是我们加的操作是：如果不是更优，那么我们就来一个继续迭代的概率，这个概率会随着整体的程序越变越小。

做一个比喻：
爬山算法是一个瞎的兔子，要跳到最高的山峰，他跳着跳着发现路开始向下了，他就不跳了。
模拟退火是一个喝醉的兔子，要跳到最高的山峰，他一直在跳，越跳越清醒，最后调到了最高的地方。

参数：

\(T_0\)：冷却初始温度
\(T\)：当前的温度
\(T_k\)：冷却目标温度
\(\alpha\)：表示温度的降低后相对原温度的比值，一般是\(0.95\sim0.99\)，让物体慢慢降温
\(x\)：当前解
\(x'\)：当前的解
\(\Delta\)：表示答案的变化值

每次比较差值随机出来的答案是不是在范围内，越到后面随机的答案就越小。

陷入局部最优增大\(T_0\)和\(\alpha\)，精度不够减小\(T_k\)。有的时候也会采取在\(T\)降至\(T_k\)以下时多次寻找新答案，感觉上会提高正确性，这一点感性理解一下，毕竟都是玄学。

实现：

由一个产生函数从当前解中产生一个位于解空间的新解，然后由当前解通过简单变换产生新解。

伪代码：

生成初解x
while(T>Tk)
    随机生成新解x'
    delta=f(x')-f(x)
    if 答案更优
        更新最优答案
    else if exp(-delta/T)>rand(0,1)
        更新当前答案
    T=T*alpha

例题：

P1337 [JSOI2004]平衡点 / 吊打XXX

正解是个物理题。不过模拟退火也能做，算一下势能，如果平衡的话势能会最小，如果没到最小那么向势能指向方向移动更优，然后模拟退火一波，不断调整即可。

P3878 [TJOI2010]分金币

两部分的话默认前一半是第一部分的，后面是第二部分，然后算一下两个的差，随机再修改交换，退火就完事了。虽说折半搜索好像也可以。

P2503 [HAOI2006]均分数据

这个题似乎用退火最容易过，随机拿出来一个放到其他地方，开始可以找最低的位置放，其次可以随机调整其他的，复杂度很低，一发就过了。

posted @ 2019-04-09 15:10 __BLUESKY007 阅读(493) 评论(5) 编辑收藏举报

刷新页面返回顶部

BLUESKY007

退役文化课选手.jpg

模拟退火学习笔记

概念：

参数：

实现：

伪代码：

公告