标签xg下的文章 - DeTechn Blog

xg

为什么xgboost训练会那么快，主要优化点是什么？

当数据集大的时候使用近似算法：在特征分裂时，根据特征k的分布确定个候选切分点。根据这些切分点把相应的样本放入对应的桶中，对每个桶的进行累加，最后通过遍历所有的候选分裂点来找到最佳分裂点。我们对这么多个桶进行分支判断，显然比起对n个样本...

29 月前 / 0 条评论 / 1091 阅读 / 0 赞