tensorflow - sklearn.preprocessing 中的 LabelEncoder 是否有类似的方法?

标签 tensorflow machine-learning scikit-learn data-science

为了对sex等分类数据进行编码,我们通常在scikit learn中使用LabelEncorder()。但是,如果我要使用 Tensorflow 而不是 Scikit Learn,执行此类任务的等效函数或方法是什么?我知道我们可以使用 tensorflow 轻松进行一个热编码,但随后它将创建标签为 1001 > 而不是 10

最佳答案

TensorFlow中有一个名为tf.feature_columns的包,其中包含 4 种从输入数据创建分类列的方法:

  • categorical_column_with_hash_bucket(...):将输入值哈希到固定数量的类别
  • categorical_column_with_identity(...):如果您有数字输入并且希望将值本身视为分类列
  • categorical_column_with_vocabulary_list(...):根据固定(内存)单词列表输出类别
  • categorical_column_with_vocabulary_file(...):与 _list 相同,但从文件中读取词汇表

该包还提供了更多将输入数据输入模型的方法。有关概述,请参阅此 blogpost由包的开发人员编写。

关于tensorflow - sklearn.preprocessing 中的 LabelEncoder 是否有类似的方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48459222/

相关文章:

python - Scikit-学习 TransformerMixin : 'numpy.ndarray' object has no attribute 'fit'

python-3.x - 由于用户权限,TensorFlow 安装被拒绝

python - 用于序列二元分类的 Keras LSTM 模型

python - 理解 keras 日志输出时出现问题

machine-learning - 多类情况的混淆矩阵,所有评估指标的估计

scikit-learn - 同时预测

python - 使用向量查找的 Tensorflow 变换张量

TensorFlow - MNIST 数据中的训练准确性没有提高

machine-learning - 用于实值数据的受限玻尔兹曼机 - 高斯线性单位 (glu) -

machine-learning - 无法计算成本函数中 1 个变量的成本