5.31周周星(第一名)分享
发布于 3 年前 作者 tanggang 1886 次浏览 来自 分享

之前看群里一直在讨论使用神经网络,也看到了有大佬分享的pytorch的baseline。但是本人对pytorch不太熟悉,于是自己也从github上找到一份tensorflow的deepfm开源,使用了几个id特征和id序列特征,在最后一天上做验证,跑出来线下0.643左右的结果,提交了一下线上0.637的分数,和开源的分数差不多,说明复现成功了。

然后我又相同的代码重新跑了一下,什么鬼,怎么就只有0.637了,神经网络波动怎么这么大。我不信邪,一口气又跑了好多遍,这里面有0.642,有0.641,最高的居然达到了0.647。哈哈,真是力大出奇迹。

想着既然这些分数波动这么大,我如果把他们取平均一下,应该会稳定很多。最终我把这八个模型等权取平均了一下,线上居然有0.653的分数!

后来群里有人说让试验lightgbm,提示说不要像deepfm那样把id直接输入给lightgbm。

根据提示,我对各种id以及交互id统计了一系列的交互数量,以及转化率等1000个左右的特征,庆幸自己有一台还不错的机器,不然还真跑不动。目前自己的lightgbm模型线上已经达到0.668分左右。

目前榜上的分数是我融合了lightgbm和deepfm之后的分数。我相信前排真正的大佬们还没开始融合,所以还是有投机取巧的成分,期待以后真正的大佬的分享吧。大家加油。

1 回复

大佬1000个特征 预测要多少ms

回到顶部