返回列表

[23rd solution] TanakaAI`s part.

638. Santa 2024 - The Perplexity Permutation Puzzle | santa-2024

开始: 2024-11-21 结束: 2025-01-31 自然语言处理 数据算法赛
[第 23 名解决方案] TanakaAI 的部分。

[第 23 名解决方案] TanakaAI 的部分。

作者: Tanaka Ai24
发布日期: 2025-02-01
竞赛排名: 23

首先,我要感谢所有的团队成员 @felixmneumann , @asimandia , @veniaminnelin , 和 @ivanisaev。我还要感谢所有出色的竞争对手,我从他们那里学到了很多。顺便说一句,这是我的第一枚奖牌,也是我第一次团队合作经历。

总体方法

像许多人一样,我使用大规模运行来生成良好的候选解决方案,然后进行较小的局部运行来优化这些候选方案。大规模运行主要使用模拟退火(SA),并具有固定某些索引(位置)的功能。有两个小型运行:一个采用了局部窗口搜索(感谢 @jazivxt 的 Notebook),另一个涉及替换整个句子中的 n-gram(n 最大为 4)。

具体方法

对于 ID 4,我计算并将字符串和困惑度(ppx)存储在 CSV 文件中,以节省重新计算的成本(虽然这不是最快的方法),这生成了一个 3 GB 的文件。一旦困惑度低于 70,我就固定前 10 个和后 4 个单词,让 SA 运行。

同比赛其他方案