我正在尝试通过简单的 tf.contrib.learn.LinearRegressor
开始使用 TensorFlow。我的数据集是一个时间序列,我想使用 T-n, ..., T-1
处的步骤作为特征,使用 T-0
作为标签。所有值都是 float ,所以我很自然地认为我应该将每个时间步长转换为 real_valued_column
功能。
但是,这些列具有 dimension=
属性,在 TF 网站 they use 上的 Iris 数据集示例中以四个维度为特征的单列。我本以为这里的四个属性(萼片宽度/长度、花瓣宽度/长度)中的每一个都应该成为它自己的特征,因此它是自己的real_valued_column
。我的理解有错吗?这些方法有什么区别?
最佳答案
每朵花都由它的四个属性表示,所以你的特征矩阵确实有 4 列。但是为了训练分类器,你不能单独采用每个特征,因为它们可能与花所属的类相关。因此维度设置为维度= 4。将real_valued_column视为一组列(它们的数量就是维度),它们形成一个特征矩阵。
关于machine-learning - Tensorflow:拥有多个特征列和拥有一个具有多个维度的特征列有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44339009/