5.31周周星（第一名）分享 - WXOPEN Club

之前看群里一直在讨论使用神经网络，也看到了有大佬分享的pytorch的baseline。但是本人对pytorch不太熟悉，于是自己也从github上找到一份tensorflow的deepfm开源，使用了几个id特征和id序列特征，在最后一天上做验证，跑出来线下0.643左右的结果，提交了一下线上0.637的分数，和开源的分数差不多，说明复现成功了。

然后我又相同的代码重新跑了一下，什么鬼，怎么就只有0.637了，神经网络波动怎么这么大。我不信邪，一口气又跑了好多遍，这里面有0.642，有0.641，最高的居然达到了0.647。哈哈，真是力大出奇迹。

想着既然这些分数波动这么大，我如果把他们取平均一下，应该会稳定很多。最终我把这八个模型等权取平均了一下，线上居然有0.653的分数！

后来群里有人说让试验lightgbm，提示说不要像deepfm那样把id直接输入给lightgbm。

根据提示，我对各种id以及交互id统计了一系列的交互数量，以及转化率等1000个左右的特征，庆幸自己有一台还不错的机器，不然还真跑不动。目前自己的lightgbm模型线上已经达到0.668分左右。

目前榜上的分数是我融合了lightgbm和deepfm之后的分数。我相信前排真正的大佬们还没开始融合，所以还是有投机取巧的成分，期待以后真正的大佬的分享吧。大家加油。

wcai 1楼•16 天前

大佬1000个特征预测要多少ms