引言

感谢组织者举办了如此激动人心的比赛。我也想向其他参与者表达谢意。在比赛的最后阶段，大家一起争夺金牌的过程非常刺激，也是一段愉快的经历。我从 Notebooks 和讨论区中学到了很多，这对取得这个结果有很大的帮助。非常感谢。

总结

我的改进始于一个公开分享的提交文件，其得分为 250.10105，分享于此笔记本。因此，ID=0,1,2 已经在排行榜上达到了最优解，我只需要处理 ID=3,4,5。这让我能够节省计算资源用于探索。感谢 @veniaminnelin 分享了这个笔记本。我也想对这个笔记本所引用的笔记本作者表示感谢。

我所有的解决方案完全依赖于模拟退火（Simulated Annealing），而如何生成邻域解是一个关键因素。我将在下面详细描述。

由于使用“交换（swap）”会相对破坏原始解，因此选择“插入（insert）”作为生成邻域解的方法是改进的起点。
我使用的方法如下：

d j = |i - j|, p(j) = (1/d j) / \sum j (1/d j)

与 ID-4 一样，我使用公开笔记本中的解作为初始解，并尝试基于距离的概率插入，将分数提高到了 31.66。
接下来，使用 31.66 的解作为初始解，我运行了几次搜索，结合了随机插入、基于距离的概率插入、字母顺序插入和部分排列，最终将分数提高到了 30.70。
在检查此时的解时，我观察到有三个按字母顺序排列的块。因此，我修改了初始解（源自当时的最佳解），使这些块的数量 ranging 从一到四，然后执行与之前相同的搜索。结果发现，拥有两个块时性能最佳，将分数提高到了 28.57。
最后，我将随机插入改为变长随机插入。在 28.57 的解中，我注意到一些不符合字母顺序的序列（例如"card game"和"wrapping paper"）。我认为如果最优解中存在由三个或更多单词组成的单个语义单元，仅靠随机插入将无法处理它们。通过这一更改，我能够达到 28.52 分。（事实上，似乎停用词部分中的"and and and"需要放在块之间。）
参数：
- 每次运行迭代次数 (n_iterations)：50,000~100,000
- 冷却计划 (Cooling Schedule)：线性递减 (Linear Decrease)
- 初始温度 (start_temp)：0.1~1
- 结束温度 (end_temp)：0.01~0.1
- 批大小 (batch_size)：16, 24