我正在构建一个简单的机器学习模型,该模型将银行交易作为输入(请参阅下面的功能),并且我想预测支出类别(标签)。我已经完成了一些初学者教程,例如 ML Crash Course , Text Classification Guides , Word Embeddings , 和更多。
以下是示例性输入数据:
Date;Sender / Recipient;IBAN / Account#;BIC / Bank Code;Text;Amount;Category
02.07.2019;Tesco Market;HSVSDDMM;Grocery Market London Heathrow - Thank you for purchase;-48.06;Groceries
我的目标是预测类别
,例如杂货
等。通过 TensorFlow,我已经取得了如此大的进步:
from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf
import pandas as pd
URL = "transactions-0263445.csv"
dataframe = pd.read_csv(URL, sep=';')
# Build the keras Sequential model
model = Sequential()
model.add(...)
model.add(Activation(...))
# Train and evaluate the model
如何构建sequential model ?我对指定输入形状感到困惑。
最佳答案
这似乎是一个分类问题,但您的问题对我来说有一些问题,在将所有数据转储到模型中之前您需要采取一些步骤。
问题是我没有看到数据的预处理,您使用了所有功能吗?它们需要缩放吗?您需要对一些数据进行编码吗?在创建模型之前有很多事情需要考虑。
在这种情况下,我猜你的主要特征是文字? 这是一个关于如何执行此操作的很好的指南: https://medium.com/data-from-the-trenches/text-classification-the-first-step-toward-nlp-mastery-f5f95d525d73
然后您可以构建和训练: https://developers.google.com/machine-learning/guides/text-classification/step-4
彻底检查这些内容,你将能够得到你目前所缺少的东西。
关于python - 银行交易分类的 Tensorflow 实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57001614/