6.21周周星(第八名)分享
### 树模型
1、目前我这边的树模型并没有加入两个bgm相关id的任何特征,只用了另外3个id的历史统计,交叉,embedding等前面大佬们分享过的特征
2、feed表内的三种文本和tag都是有效的提分手段,幅度在1个百分点左右,tag的话我是直接取概率最高的当类别做统计(当然还可以有别的方式值得尝试),keyword还没开始研究,这部分可以看看历史ctr比赛的代码
3、不同树模型融合能提分,单树模型K折也能提分,但总分提升幅度不大,特别是后两个小项几乎没变
4、即使是滑窗也可以把前面几天的数据加上训练,说不定会有惊喜
### 神经网络
1、线下使用前十三天训练,第十四天作为验证,线上利用前十四天数据作为训练
2、四个子任务收敛不同步,拆分模型能在mmoe的基础上提几个千
3、nn多训练几个取平均之后,模型效果会稳定很多