Something About TSP (1)

旅行商问题（traveling-salesman problem）

问题描述

通常我们讨论的都是对称旅行商问题（SYMMETRIC traveling-salesman problem），即距离矩阵保持对称（A 到 B 与 B 到 A 距离相等）。
严格意义上的旅行商问题的要求是：遍历所有点，保证每个点刚好访问一次，求最短的遍历路径。

基本思路

解决这种问题的算法分为两种：精确算法（Exact algorithms）和启发式方法（heuristic methods）。
精确算法的复杂度过高（n的指数级），短时间可解决的问题约在60个点（1971）。
一般采用启发式方法去解决能得到一个相对满意的结果。

解决这个问题的灵感来自于另一个问题：图分割问题。
问题描述很简单：将图分为两个点的个数相同的部分，并满足两个部分间的距离最短。

我们可以将这两个问题抽象成同一种问题：
从集合 S 中寻找满足限制条件 C 并能使目标函数 f 最小化的子集 T 。

接下来，我们就可以将启发式算法的思路总结出来：

找到一个可行解，即一个满足条件 C 的子集 T
尝试在 T 上做一些改变，寻找比 T 更优（能使得 f 更小）的子集 T’
如果找到子集 T’ 更优（使得 f(T’) < f(T) ），用 T’ 替换 T 并重复上一
如果找不到，T 就是局部最优解。再次重复第一步直到时间到某一上限或答案已经足够满意。

在 TSP 问题中，这个问题的具体化就是：

从所有边构成的集合 S 中找出一个可行回路 T
每次从 T 中找出 k 条边，从 S-T 中找出另外的 k 条边，保证这 k 条边交换后能形成回路且费用更小
如果找到则进行交换
如果找不到，则 T 就是局部最优解。再次重复直到时间到达某一上限或答案足够满意

启发式算法的核心

这种算法好坏主要看两点：

第一步中找到的初始解的好坏
第二步中的替换算法的好坏

KL算法重点关注第二个点。

第二步中有一个难题，是 k 的值具体应该取多少？

如果遍历 k 那无疑是一件很恐怖的事，所以我们尝试用一些方法：

生成随机初始解 T
- 令 i = 1
- 选择第 i 步的“最不合适”对：xi 和 yi，使得 {x1, x2, …… , xi} 和 {y1, y2, …… , yi} 交换后缩短的距离值最大（具体原则在下面给出）
- 如果找不到不合适对，则进入下一步，否则重复本步骤
如果一个更优解已经找到，则将 x 和 y 两个集合交换，得到新的 T，重复上一步骤；若找不到更优解，则进入下一步
如果需要的话重复第一步

那我们采用怎样的方法去找“最不合适”对呢？
首先，我们要保证每次交换后都能得到一个可行的交换，所以我们保证 x1、y1、x2、y2 …… 依次首尾相连（且 yn 最后一个节点为 x1 的第一个节点），如下图所示：

其次，假设 gi 表示 xi 与 yi 交换后减少的代价，那么我们不必在某一个 gi 为负数时立刻停止，我们只在 g1+g2+……+gi ≤ 0 时认为找不到“不合适”对。

当然，我们要保证不重新选取被去掉的边。

Kernighan-Lin 算法

具体描述

Step 1: 生成随机回路 T
Step 2: 令 G* = 0，任选一个点 t1 作为起始点，从 t1 出发选取回路 T 中的一条边 x1 ，假设另一端为 t2，令 i = 1
Step 3: 从 t2 出发，选取任一不在 T 中的边 y1，假设另一端为 t3，满足 g1 > 0 。若不存在这样的 y1，则跳至 Step 6 (d)
Step 4: 令 i = i + 1，选择 xi （T 中以 t(2i-1) 为出发点的路径）和 yi，具体说明如下：
- (a) 若 xi 连接的是 t(2i) 和 t1 ，则完成一次查找
- (b) yi 应当从 t(2i) 出发；若没有可行边，则跳转至 Step 5（显然，我们优先考虑最近的点）
- (c) x 和 y 不能有交集
- (d) G > 0
- (e) yi 的选择应保证 t(2i+1) 在 T 中有其他邻接点
- (f) 在选定 yi 前，我们观察是否连接 t(2i) 和 t1 比选择的 yi 是更好的选择（费用减少更多）。令 yi* 表示边 ( t(2i), t1 )，gi* = |xi| - |yi*| 。若 G(i-1) + gi* > G* 则更新 G* 的值为 G(i-1) + gi* 并记 i 为 k。
Step 5: 当找不到 xi 和 yi 满足 4(c)-(e) 或 Gi ≤ G* 时，结束上一循环。若 G* > 0，更新 T’ ，且 f(T’) = f(T) - G*。以 T’ 为初始回路重复从 Step 2 开始的这一过程。
Step 6: 如果 G* = 0，按下列方式处理：
- (a) 重复 Step 4 和 5，按升序选择满足 g1 + g2 > 0 的 y2 ，跳回 Step 2
- (b) 如果 Step 4 (b) 中所有 y2 的选项都使得 G 为负，则返回 Step 4 (a) 尝试选择另一个 x2
- (c) 如果仍然无法得到解，跳至 Step 3，按升序找新的 y1
- (d) 如果找不到合适的 y1，跳至 Step 2，尝试另一条 x1
- (e) 如果仍然失败，跳回 Step 2，重新选择 t1

生成的最终路径：

一些优化

避免校验时间（Avoiding Checkout Time）

如果回路 T 无法再次被改进，则 T 是一个局部最优解。当下次再次得到回路 T 时，避免再次检验。
可节约 30-50% 的运行时间。

预测（Lookahead）

为避免出现选择的 yi 使得 x(i+1) 太小最终导致无用的搜索，在选择 yi 时选择使得 |x(i+1)|-|yi| 最大的 yi。

减少重复搜索（Reduction）

因为很多时候，大部分重要的优化都是相同的，所以我们在找出至少两个局部最优解后，求这些最优解的交集，并以这些边作为初始回路的一部分。
数据测试发现，两个普通的局部最优解有 85% 是相似的，甚至 7-8 个最优解也有 60-80% 是相似的。

缺陷

无法进行不连续交换。
e.g.:

初始随机解的生成优化

根据初始随机解的生成方式的不同，衍生出不同的方法，其中包括：

最近插入法(nearest insertion，NI)
凸包法（connex hull insertion，CHI)
最远插入法(farthest insertion，FI)
最邻近法(nearest neighbor algorithm，NN)
节约算法（clark wright algorithm，CW)
贪婪算法（greedy algorithm，GA)
最小双生树法（double spanning tree，DST)
部分算法性能如下：

论文来自

An Effective Heuristic Algorithm for the Traveling-Salesman Problem
　　—— S. Lin and B. W. Kernighan
Lin-Kernighan 算法初始解的启发式构造策略
　　—— 曾华，崔文，付连宁，吴耀华