随机化算法属于省选芝士体系

0x01 前置芝士

你只需要会 rand 就可以啦!

当然如果你想理解的更透彻也可以先看看 爬山算法

0x02 关于退火

退火是一种金属热处理工艺,指的是将金属缓慢加热到一定温度,保持足够时间,然后以适宜速度冷却。目的是降低硬度,改善切削加工性;消除残余应力,稳定尺寸,减少变形与裂纹倾向;细化晶粒,调整组织,消除组织缺陷。准确的说,退火是一种对材料的热处理工艺,包括金属材料、非金属材料。而且新材料的退火目的也与传统金属退火存在异同。

也就是你可以理解为,金属在逐渐降温的过程中,它含的某种物质会趋于恒定。

换成 OI 的话说,如果每个温度对应一个答案,则随着温度越来越小,答案波动的范围就会越来越小,最后答案趋于恒定。例如下面这个经典图片,便是利用这个思想,最后得到了一个多峰函数的最值。模拟退火就是用于求解多峰函数的最值问题。

不过是不是看起来很玄学?现在我们来细化一下模拟退火思想。

0x03 模拟退火

你如果仔细看,刚刚那个图中答案好像和温度没有直接联系,也就是说答案是随机的。这个说法不太完全,答案和温度确实没有太大联系,但温度却可以限定答案所在的范围。

首先我们引入几个参数:当前最优解 \(A_0\),新的解 \(A\),上一个被接纳的解 \(A_1\),解的“变动量” \(ΔA\)(即 \(A\) 与 \(A_0\) 的差值,这里规定为 \(A - A_0\)),开始的温度 \(T_0\),当前温度 \(T\),最终的温度 \(T_{esp}\)。温度变动量 \(q\)。接纳:指对于一个解,我们认为它有可能是正确答案,或者说与正确答案有联系。

以下均以求多峰函数最大值为例来模拟整个过程。

首先在一开始,我们找到一个你认为接近正确答案的解 \(A_1\),将 \(A_0\) 初始置为 \(A_1\)。然后你需要在温度限制的范围内,去合理的再取到一个解,即 \(A\)。至于这个温度限制的范围其实很简单,你只需要求到一个满足条件的随机数即可。例如:你有一个横坐标,如果你要再求到一个横坐标,你就可以写成。

double cx = now.x + ((rand() << 1) - RAND_MAX) * t;
// RAND_MAX 是 <stdlib.h> 中的一个宏,也就是随机数的最大值。
// 通过 (rand << 1) - RAND_MAX 我们就得到了一个可能为正可能为负的随机数

这样的话,你就会发现随着 \(T\) 的不断减小,新的解与上一个解的差距就越小,即达到了我们的目的。

现在我们有了 \(A\),自然就可以求到所谓 \(ΔA\)。

得到 \(ΔA\)后:

  • \(ΔA > 0\) :也就是说当前解大于当前最优解,因为我们是求最大值,所以此时显然更新 \(A_0\),并更新 \(A_1 = A\)。

  • \(ΔA \leq 0\) :这就比较麻烦了,首先这样的情况是肯定不能更新 \(A_0\) 的。但我们考虑一下 \(A_1\),如果接纳 \(A\),那么我们下次就是从 \(A\) 开始扩展新的点,这很明显有可能不是最优的(你从多峰函数的一个峰的半山腰跌到了一个山谷)。但也有可能是更优的,因为你现在接纳的这个点,它可能不在最终答案的那一座峰上,所以你需要跳往另一座峰,也就是你需要接纳 \(A\)。这下该怎么办呢?有一个非常玄学的东西,叫:Metropolis接受准则。它告诉我们有一定概率去接纳 \(A\),而这个概率只需比较 \(\exp(-delta / t) * RAND\_MAX\) 和 \(rand()\) 的大小即可。

在做完这些操作后,我们让 \(T = T \times q\)。

好了,我们现在又有了一个 \(A_1\),这个 \(A_1\) 可能等于 \(A_0\) 也可能等于 \(A\)。我们将这个 \(A_1\) 再去执行上述操作,反复执行,随着温度的减小,我们就可以求到一个趋于恒定的答案了!

当然还有几个未处理的地方。

首先:

  1. \(T_0\) 的取值:根据题目而定,我通常使用 \(2000\) 到 \(5000\) 的一个整数。
  2. \(q\) 的取值:在前人的总结中,\(q\) 近似于 \(0.996\)。
  3. \(T_{esp}\) 的取值:这也需要视题目而定,如果这个值越小,按理说答案精度就越大,所以如果你不怕超时就可以开的小一点。

最后,关于时间复杂度,因为此算法使用了大量随机数,所以其时间复杂度近似于 \(O(rp)\)。

0x04 例题

LINK

一句话题意:给定 \(n\) 个坐标,求这 \(n\) 个坐标的 费马点

定义 \(sum\) 表示一个坐标到 \(n\) 个点的距离和。

首先,你会发现答案是一个函数,因为一个坐标只对应一个 \(sum\)。于是我们其实就是要求这个多峰函数 \(sum\) 的最小值。

那么就是模拟退火嘛。读者可以在根据下面这个代码理解一下实现。

值得注意的是,这道题函数 \(sum\) 的“横坐标”是一个坐标。

#include <bits/stdc++.h>
using namespace std; int read() {
int k = 1, x = 0;
char s = getchar();
while (s < '0' || s > '9') {
if (s == '-')
k = -1;
s = getchar();
}
while (s >= '0' && s <= '9') {
x = (x << 3) + (x << 1) + s - '0';
s = getchar();
}
return x * k;
} const int MAXN = 5e3 + 5;
const double q = 0.996;
// 温度变动量
struct node {
double x, y;
node() {}
node(double X, double Y) {
x = X;
y = Y;
}
} a[MAXN], now, anst;
// now 初值为 A1,在这里是 (0, 0)
double ans = 1e18;
// 答案初值 int n;
double f(double x, double y) {
double ret = 0;
for (int i = 1; i <= n; i++) ret += sqrt((x - a[i].x) * (x - a[i].x) + (y - a[i].y) * (y - a[i].y));
return ret;
} void Make_Fire() {
double t = 3000;
while (t > 1e-16) {
double cx = now.x + ((rand() << 1) - RAND_MAX) * t;
double cy = now.y + ((rand() << 1) - RAND_MAX) * t;
// 求到 A 的横坐标,在这里是 (cx, cy)
double cnt = f(cx, cy);
// 求到 A
double delta = cnt - ans;
// 求到差
if (delta < 0) { // 如果差是小于 0 的
now = node(cx, cy);
// 接纳它
anst = node(cx, cy);
// 根据题目需要,更新答案的坐标
ans = cnt;
// 跟新答案
} else if (exp(-delta / t) * RAND_MAX > rand())
// 玄学接受准则
now = node(cx, cy);
// 接纳它
t *= q;
// 降温
}
} int main() {
srand(998244353);
n = read();
ans = 1e18;
for (int i = 1; i <= n; i++)
scanf("%lf %lf", &a[i].x, &a[i].y);
for (int i = 1; i <= 5; i++) Make_Fire();
printf("%.2lf %.2lf\n", anst.x, anst.y);
return 0;
}

Note -「模拟退火」的更多相关文章

  1. Note -「多项式」基础模板(FFT/NTT/多模 NTT)光速入门

      进阶篇戳这里. 目录 何为「多项式」 基本概念 系数表示法 & 点值表示法 傅里叶(Fourier)变换 概述 前置知识 - 复数 单位根 快速傅里叶正变换(FFT) 快速傅里叶逆变换(I ...

  2. Note -「群论」学习笔记

    目录 前置知识 群 置换 Burnside 引理与 Pólya 定理 概念引入 引例 轨道-稳定子(Orbit-Stabilizer)定理 证明 Burnside 引理 证明 Pólya 定理 证明 ...

  3. Note -「线性规划」学习笔记

    \(\mathcal{Definition}\)   线性规划(Linear Programming, LP)形式上是对如下问题的描述: \[\operatorname{maximize}~~~~z= ...

  4. Note -「计算几何」模板

      尚未完整测试,务必留意模板 bug! /* Clearink */ #include <cmath> #include <queue> #include <cstdi ...

  5. loj#2076. 「JSOI2016」炸弹攻击 模拟退火

    目录 题目链接 题解 代码 题目链接 loj#2076. 「JSOI2016」炸弹攻击 题解 模拟退火 退火时,由于答案比较小,但是温度比较高 所以在算exp时最好把相差的点数乘以一个常数让选取更差的 ...

  6. Note -「Lagrange 插值」学习笔记

    目录 问题引入 思考 Lagrange 插值法 插值过程 代码实现 实际应用 「洛谷 P4781」「模板」拉格朗日插值 「洛谷 P4463」calc 题意简述 数据规模 Solution Step 1 ...

  7. Note -「动态 DP」学习笔记

    目录 「CF 750E」New Year and Old Subsequence 「洛谷 P4719」「模板」"动态 DP" & 动态树分治 「洛谷 P6021」洪水 「S ...

  8. Note -「圆方树」学习笔记

    目录 圆方树的定义 圆方树的构造 实现 细节 圆方树的运用 「BZOJ 3331」压力 「洛谷 P4320」道路相遇 「APIO 2018」「洛谷 P4630」铁人两项 「CF 487E」Touris ...

  9. Note -「Dsu On Tree」学习笔记

    前置芝士 树连剖分及其思想,以及优化时间复杂度的原理. 讲个笑话这个东西其实和 Dsu(并查集)没什么关系. 算法本身 Dsu On Tree,一下简称 DOT,常用于解决子树间的信息合并问题. 其实 ...

随机推荐

  1. 使用 Python 来自动回微信

    准备 Python3 Python Itchat库(可以通过pip install itchat来安装) (可选)Python Pymongo库(可以通过pip install pymongo来安装) ...

  2. windodws pyusb hub端口对应连接的usb设备

    源码: 1 #!/usr/bin/python 2 import sys 3 import usb.core 4 # find USB devices 5 dev = usb.core.find(fi ...

  3. 定时 ——setTimeout | setInterval

    使用场景,setTimeout 只调用一次,setInterval 会重复调用,直到清除或重载. <div id="countDown"></div> &l ...

  4. 面试官:Kafka是什么,它有什么特性与使用场景?

    哈喽!大家好,我是小奇,一位热爱分享的程序员 小奇打算以轻松幽默的对话方式来分享一些技术,如果你觉得通过小奇的文章学到了东西,那就给小奇一个赞吧 文章持续更新 一.前言 不知不觉进入了五月份了,天气越 ...

  5. python常用标准库(math数学模块和random随机模块)

    常用的标准库 数学模块 import math ceil -- 上取整 对一个数向上取整(进一法),取相邻最近的两个整数的最大值. import math res = math.ceil(4.1) p ...

  6. vue中使用echarts的两种方法

    在vue中使用echarts有两种方法一.第一种方法1.通过npm获取echarts npm install echarts --save 2.在vue项目中引入echarts 在 main.js 中 ...

  7. 使用 Postman 实现 API 自动化测试

    背景介绍 相信大部分开发人员和测试人员对 postman 都十分熟悉,对于开发人员和测试人员而言,使用 postman 来编写和保存测试用例会是一种比较方便和熟悉的方式.但 postman 本身是一个 ...

  8. MVC 调试页面路径变成 Views/Controller/Action.cshtml问题

    MVC在路由里面已经写好了路径,但是调试时地址栏还是会变成 Views/Controller/Action.cshtml,导致报404错误,找不到路径. 原因可能是你将某一页面设为了起始页,导致每次运 ...

  9. MIT 6.824(Spring 2020) Lab1: MapReduce 文档翻译

    首发于公众号:努力学习的阿新 前言 大家好,这里是阿新. MIT 6.824 是麻省理工大学开设的一门关于分布式系统的明星课程,共包含四个配套实验,实验的含金量很高,十分适合作为校招生的项目经历,在文 ...

  10. Keil软件下用Jlink无法识别芯片

    Keil软件下用Jlink无法识别芯片 硬件:正点原子探索者 软件:keil J-Link固件版本:V9.40 J-Link V6.94b驱动:下载地址 跟着视频教程走,发现的第一个问题就是这个,记录 ...