8.2周周星(第二名)分享
- 方案是融合模型(仅用了id信息),用两个NN模型加权融合,值得一提方案并不复杂单模差不多在0.717左右,并且两个模型就是dropout的差别(融合收益很大)。
2.网络结构部分借鉴transformer设计思路,效果出奇的好。
3.embedding大小挺重要,这里需要优化代码效率问题,现阶段我也是采用的keras.utils.Sequence实现的,在batch内部进行merge,一个模型预测完测试集仅需30s左右。
4.尝试过加很多特征,发现并没有用,我对模型优化侧重点更多还是id部分。