351. Categorical Feature Encoding Challenge | cat-in-the-dat
逻辑回归
参数设置:C=0.095, class_weight={0: 1, 1: 1.4}, tol=0.00001, solver='liblinear', penalty='l2'
在训练集和测试集中均未找到的特征将被归为一类,称为“other”(其他)。
对于 nom_9,存在许多稀疏特征(特征计数很小)。为了防止过拟合,我们也将这些稀疏特征归入上述的“other”类中。
nom_9 中计数小于 3 的特征(这是一个需要调整的参数)将被视为稀疏特征。