python - 如何将用户输入转换为独立虚拟变量

标签 python pandas prediction dummy-variable

我有一个如下所示的数据集

Plant   Brand   Volume
A         HL      12
B         AG      14
A         FP      50000
G         TT      08

为了训练模型,我用 pd.get_dummies 方法制作了它们(Plant-Brand) 它扩展为 186 列,如下所示;

Plant_A    Plant_B ...  Brand_HL    Brand_AG   ...
   1          0            1           0
   0          1            0           1
   1          0            0           0
   0          0            0           0

我的模型运行良好,但我需要根据用户输入来使用该模型

用户应仅手动提供 plantID、Brand 和 Volume 我需要转换这些值并以相同的格式(186 列)写入,以便预测独立值

y_pred = model.predict(X_user)

如何将 4 维转换为 186 维?有什么方法可以快速做到这一点吗?

提前致谢,

最佳答案

你可以使用:

np_array = np.asarray(df) # df is your pandas DataFrame

np_array.resize((new_num_rows, new_num_columns))

但您必须记住 old_num_rows * old_num_columns 应等于 new_num_rows * new_num_columns

关于python - 如何将用户输入转换为独立虚拟变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57321552/

相关文章:

r - 我可以将单个变量的任意函数的参数拟合到数据吗?

python - sklearn 中的自定义变压器

python - 如何只返回 datetime.datetime 类型的日期部分?

python - 如何将 scipy optimization 与您自己的函数一起使用?

java - 如何访问 WEKA 模型文件的源代码

python - Pandas:按索引和值迭代带有日期时间索引的系列

python - 使用元素树向子树添加新元素

python - Python 2.4 中的 SHA256 哈希

python - Pandas 数据框记录过滤符号是如何实现的?

python - 将列级别由内而外