旅行商问题 (TSP)，结合示例讲解

Mohammed Islam Hadjoudj

Expert Operations Research Engineer

1. 什么是旅行商问题？

旅行商问题 (TSP) 是计算机科学和运筹学领域的一个经典算法问题。问题陈述看似简单易懂：

“给定一系列城市以及每对城市之间的距离，求出恰好访问每个城市一次并返回出发城市的最短可能路线？”

用图论的语言来说，TSP 被表述如下：给定一个完全加权图（其中顶点代表城市，边代表道路，权重代表距离），找到一个总权重最小的哈密顿回路 (Hamiltonian Cycle)。哈密顿回路是一个闭合的环路，它恰好访问图中的每个顶点一次。

虽然计算一条路线的距离只涉及简单的加法，但在所有可能的路线中找到绝对最短的路线才是使这个问题臭名昭著的困难所在。

七座城市标记为 A 到 G，以完全图的形式展示，其中每一对城市都由一条浅色的候选道路相连。最短的往返路线以粗蓝色闭合回路高亮显示，从起点城市 A 出发并回到 A，恰好访问每座城市一次，构成长度约为 1016 个单位的哈密顿回路。 — 浅色线条是城市之间所有可能的道路（一个完全图）。TSP 选择那条粗回路：访问全部七座城市一次并返回起点的最短路线。

2. 维度的诅咒：组合爆炸

为什么我们不能只用计算机检查每一条路线，计算每条路线的总距离，然后挑出最短的呢？这种方法称为暴力破解 (Brute Force)。

暴力破解的问题在于一种被称为组合爆炸的数学现象。可能的路线数量随着城市数量的增加呈阶乘级增长。

如果你有 5 个城市，则有 (5 - 1)! / 2 = 12 条可能的路线。人类可以在几分钟内用纸笔计算出来。
如果你有 10 个城市，则有 181,440 条可能的路线。现代计算机可以在不到一毫秒的时间内计算出来。
如果你有 20 个城市，则有 60,822,550,204,416,000 条可能的路线。这需要标准计算机花费几年时间来计算。
如果你有 61 个城市，可能的路线数量比可观测宇宙中的原子还要多。

因为可能解的数量以天文数字般的 O(n!) 速度增长，所以对于任何数量较多的城市，暴力破解 TSP 在物理上是不可能的，无论超级计算机变得多快。

一张对数刻度的柱状图，展示 TSP 可能路线的数量如何随城市数量增长：5 座城市有 12 条路线，10 座有 181,440 条，15 座约为 4.4×10¹⁰，20 座约为 6.1×10¹⁶，25 座约为 3.1×10²³。随着数量激增，柱子从绿色变为红色。 — 不同路线的数量为 (n-1)!/2。注意对数坐标轴：每增加五座城市就会增加好几个数量级。

3. P 与 NP 和 NP 困难

旅行商问题被归类为 NP 困难 (NP-Hard)。要理解这意味着什么，需要简要了解计算复杂性理论，特别是 P 与 NP 问题。

P（多项式时间）： 可以由计算机相对快速地（在多项式时间内）解决的问题。例子包括对数组进行排序或找到只有两点之间的最短路径（Dijkstra 算法）。
NP（非确定性多项式时间）： 这类问题，如果你得到一个潜在的解决方案，你可以快速地（在多项式时间内）验证该解决方案是否正确。

TSP 的决策版本（“是否存在短于长度 L 的路线？”）属于 NP 完全 (NP-Complete)。优化版本（“绝对最短的路线是什么？”）属于 NP 困难 (NP-Hard)。这意味着计算机科学家坚信，没有一种算法可以在多项式时间内为 TSP 的所有情况找到精确的最短路线。如果有人发现了一种快速的 TSP 精确算法，他们将证明 P = NP，赢得 1,000,000 美元的千禧年大奖，从根本上改变计算机安全和数学的基础。

4. 精确算法：等待完美路线

尽管有 NP 困难的分类，研究人员还是开发出了巧妙的算法，比暴力破解快得多地找到精确的最优解，尽管当城市数量变大时它们仍然会遇到困难。

Held-Karp 算法（动态规划）

Held-Karp 算法开发于 1962 年，利用动态规划在 O(n^2 * 2^n) 时间内精确解决 TSP。虽然 2^n 仍然是指数级的（因此对于大量输入非常慢），但它比暴力破解的 O(n!) 时间快得多。

Held-Karp 的工作原理是将问题分解为重叠的较小规模的子问题。它计算从起点到部分城市的子集的最短路径，将该结果存储在内存中（记忆化），并重新使用它来构建更大子集的路径。然而，因为它必须存储每个城市子集的结果，所以它需要 O(n * 2^n) 的内存，这在处理能力之前很快就成为限制因素。

分支定界法 (Branch and Bound)

分支定界法是另一种精确方法。它使用树结构系统地枚举候选解。在探索树的一个分支（部分路线）之前，它会计算一个“边界”（对可能由该分支产生的最短路线的乐观估计）。如果这个边界已经比目前找到的最佳路线差，算法就会“修剪”这个分支，完全跳过数百万条无用路线的评估。

可视化 TSP 求解器

观看不同的算法如何处理同一张城市地图。看暴力算法如何挣扎，而启发式算法在几秒钟内找到近乎完美的路线。

打开 TSP 可视化工具

5. 启发式和近似：足够好，足够快

在现实世界中，联邦快递或亚马逊等公司不需要绝对在数学上完美的路线。一条 99% 最优但可以在 5 秒内计算出来的路线，比一条需要 5,000 年才能计算出来的 100% 最优路线有价值得多。这就是启发式算法的用武之地。

最近邻算法 (贪心算法)

最简单的启发式算法是最近邻算法 (Nearest Neighbor)：从一个随机城市开始，前往最近的未访问城市，并重复此过程直到返回家。它的速度令人难以置信，只需 O(n^2)，但它可能会导致“贪心陷阱”，即早期采取小步跳跃迫使旅行商在最后阶段进行跨越全国的巨大跳跃。它产生的路线通常比最佳路线长 25%。

2-Opt 优化

2-Opt 是一种局部搜索算法。它需要一条现有的、可能很乱的路线，并试图将其理顺。它查看路线中的两条边（道路）。如果道路相互交叉，2-Opt 会删除这两条边，并以消除交叉的方式重新连接城市。通过反复消除交叉点，2-Opt 可以将优化不佳的路线变成高效的路线。

两个面板展示同样的七座城市。在“之前”面板中，路线有两条边 B 到 E 和 C 到 F 交叉成一个红色的 X，长度约为 1313。在“之后”面板中，2-opt 移除了这些边并将其重新连接为绿色的 B 到 C 和 E 到 F，得到一条不交叉的回路，长度更短，约为 1016。 — 一次 2-Opt 操作：交换两条交叉的边，使路径不再自我重叠，将路线从约 1313 缩短到约 1016。

蚁群优化 (ACO)

受大自然的启发，ACO 模拟了蚂蚁群寻找食物的过程。模拟的“蚂蚁”随机在图上游走。当蚂蚁完成一次旅行时，它会在其遍历的边缘留下“信息素”。旅行越短，留下的信息素就越强。随着时间的推移，随后的蚂蚁会被概率性地吸引到信息素较强的边缘。通过这种分散的正反馈循环，蚁群会收敛到高度优化的路线上。

6. TSP 的实际应用

TSP 的数学应用远不止于推销员开车。

物流与配送： 最明显的应用。路线安排送货卡车、校车或垃圾收集的公司依靠大规模 TSP 求解器来节省数百万美元的燃料和时间。
制造（印刷电路板钻孔）： 为了制造主板，机器钻必须钻出数以万计的小孔。将孔视为“城市”，解决 TSP 可将钻头必须移动的距离最小化，从而大幅加快生产速度。
天文学： 捕捉不同恒星或星系图像的望远镜必须指向天空中的各个位置。将观测计划表述为 TSP，可最大程度地减少望远镜重新定位所花费的时间。
DNA 测序： 在生物信息学中，当拼凑支离破碎的 DNA 链时，“城市”是 DNA 片段，“距离”是衡量它们匹配程度的指标。解决 TSP 的变体有助于找到完整基因组的最可能序列。

常见问题

什么是旅行商问题 (TSP)？

旅行商问题是指寻找一条最短的路径，访问一系列给定的城市各一次，最后再返回出发城市。

为什么 TSP 难以精确求解？

TSP 是一个 NP-难问题。随着城市数量的增加，可能的路线总数呈阶乘 O(n!) 级增长，导致“组合爆炸”。即使对于 20 个城市，路线数量也已经达到了千万亿级别。

什么是 2-Opt 优化启发式算法？

2-Opt 是一种局部搜索算法，它通过不断选择路线中两条相交的边并将其删除，然后重新连接以消除交叉，从而缩短和优化旅行商的行进路线。

旅行商问题 (TSP) 详解

目录