假设我们的输入数据由离散值和文本字符串组成,输出应该是一组标签。
为了将其转换为可以输入神经网络的数据,我无法弄清楚如何处理文本输入。
仅使用文本输入,我假设 RNN 可以生成思想向量,但我有点不确定如何提供其余的输入数据。
最佳答案
如果您使用 RNN 来处理文本输入,那么 RNN 的输出可以与离散特征的 one-hot 编码连接起来。然后可以将连接的向量输入输出层(例如,逻辑计算跨多标签的交叉熵损失)。
类似地,如果您使用嵌入层来映射输入文本,您也可以为离散特征学习另一个嵌入。然后可以将两个嵌入的特征系列连接起来以输入到输出层。
关于machine-learning - 处理文本数据以进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39971803/