12th Place Solution - Overview with code files | 优胜方案

第12名方案 - 概述与代码文件

作者： Manuel Campos
发布时间： 2020年7月24日

首先，我要感谢所有促成这次比赛的人和组织。大写地感谢所有团队，你们的奉献和努力我希望有助于改善前列腺癌的诊断，从而改善人们的生活。确实，我向获胜者表示最诚挚的祝贺。

正如你可以想象的那样，我非常高兴。在几行文字中，我与大家分享我在这次挑战中的快速概览。

我想在这里评论通常包含在致谢部分的内容，但我保留这个特殊部分以突出那些使我的最终解决方案变得更好的竞争对手的工作，1) 因为他们的能力在我最初的知识中不存在，或者 2) 因为他们的表现随着我的经验一起提高。我的意思是，没有优先顺序，

(Salman) @micheomaano:
(Qishen Ha) @haqishen:
1. Train EfficientNet-B0 w/ 36 tiles_256 [LB0.87]
2. PANDA Inference w/ 36 tiles_256
(RAHUL SINGH INDA) @rsinda:
1. Panda Inference EfficientNet-b1
(Iafoss) @iafoss: 比赛中最好的加速器，领先于TPU。

我分享了我的推理内核的原始副本，没有额外的清理，以及一个数据集，其中包含用于获得最终提交的每个模型所需的权重，

对于我所有的训练，我使用了 Kaggle / Google (Colaboratory) 提供的免费 TPU 资源。非常感谢。

非常接近 Salman 的训练内核，我只是重新运行其代码以完成交叉验证。我运行了一个折叠直到 60 个 epoch 以查看损失的演变，其余的直到 40 个 epoch。

单独来看，折叠的行为在最终损失值和停止改进的次数方面或多或少相似。问题在于它们的合并并没有提高其中一些在 LB 上的单独表现，并且当它们被引入外部集成时，它们的表现也不均匀。

标签的噪音是一个可能的原因，正如讨论中已经讨论过的那样，或者可能是 qwk 指标对 mse 即使是很小的变化

12th Place Solution - Overview with code files