我正在尝试找到 sklearn LabelEncoder 的等效项或OrdinalEncoder在 Azure ML Studio 中。我了解转换为指标值模块执行 One-hot 编码,但我找不到任何可以执行标签编码的内容。
我拥有的是一个包含六个唯一字符串值的列,我需要的是用 0 到 6 之间的整数表示该数据。
现在,我正在使用执行 Python 脚本模块来执行此操作,但我想知道是否有内置模块可以执行此操作。
最佳答案
有Feature Hashing使用 Vowpal Wabbit 库将字符串转换为整数编码特征的模块。它构建一个字典,并根据该字典将其项目转换为哈希值。因此,您将拥有以下格式的数据,而不是字符串列:
Hashing feature 1 Hashing feature 2 Hashing feature 3
1 0 0
关于azure - Azure 机器学习工作室中的标签编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56076313/