在 Tensorflow 中已经有一个通过交叉列创建特征的函数 tf.feature_column.crossed_column
,但它更多地用于类别数据。数字数据怎么样?
例如,已有 2 列
age = tf.feature_column.numeric_column("age")
education_num = tf.feature_column.numeric_column("education_num")
如果我想像这样根据年龄和教育数字创建第三和第四个特征列
my_feature = age * education_num
my_another_feature = age * age
如何做到这一点?
最佳答案
您可以声明自定义数字列并将其添加到 input function 中的数据框中。 :
# Existing features
age = tf.feature_column.numeric_column("age")
education_num = tf.feature_column.numeric_column("education_num")
# Declare a custom column just like other columns
my_feature = tf.feature_column.numeric_column("my_feature")
...
# Add to the list of features
feature_columns = { ... age, education_num, my_feature, ... }
...
def input_fn():
df_data = pd.read_csv("input.csv")
df_data = df_data.dropna(how="any", axis=0)
# Manually update the dataframe
df_data["my_feature"] = df_data["age"] * df_data["education_num"]
return tf.estimator.inputs.pandas_input_fn(x=df_data,
y=labels,
batch_size=100,
num_epochs=10)
...
model.train(input_fn=input_fn())
关于python - 如何通过将另外两个 tf.feature_column 相乘来创建 tf.feature_column?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46904972/