python - lightGBM 中的分类特征是如何编码的?

标签 python machine-learning encoding decision-tree lightgbm

LightGBM 支持分类变量。我想知道它是如何编码的。它似乎不是一种热编码,因为该算法非常快(我尝试使用花费大量时间进行一种热编码的数据)。

最佳答案

https://github.com/Microsoft/LightGBM/issues/699#issue-243313657

The basic idea is sorting the histogram according to it's accumulate values (sum_gradient / sum_hessian), then find the best split on the sorted histogram, just like the numerical features.

关于python - lightGBM 中的分类特征是如何编码的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49730159/

相关文章:

python - 在c中嵌入Python,然后在c++程序中运行它不起作用

python - TensorFlow - nn.max_pooling 极大地增加了内存使用量

machine-learning - 了解 "Deep MNIST for Experts"

perl - 如何将 UTF-8 字符串与 Perl 的 printf 正确对齐?

php - 如何在mysql表中插入汉字?

python - 类型错误 : object of type 'Response' has no len() [BeautifulSoup]

python - "GenerateMatrix"SymPy 中的等效命令

python - Django:首次提交后奇怪的表单集行为

machine-learning - 机器学习平台的选择

asp.net - 将图像数据从 ASP.NET 下载到 iPhone 的最佳方法是什么?