python - 银行交易分类的 Tensorflow 实现

标签 python tensorflow machine-learning

我正在构建一个简单的机器学习模型,该模型将银行交易作为输入(请参阅下面的功能),并且我想预测支出类别(标签)。我已经完成了一些初学者教程,例如 ML Crash Course , Text Classification Guides , Word Embeddings , 和更多。

以下是示例性输入数据:

Date;Sender / Recipient;IBAN / Account#;BIC / Bank Code;Text;Amount;Category
02.07.2019;Tesco Market;HSVSDDMM;Grocery Market London Heathrow - Thank you for purchase;-48.06;Groceries

我的目标是预测类别,例如杂货等。通过 TensorFlow,我已经取得了如此大的进步:

from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf
import pandas as pd
URL = "transactions-0263445.csv"
dataframe = pd.read_csv(URL, sep=';')


# Build the keras Sequential model
model = Sequential()
model.add(...)
model.add(Activation(...))

# Train and evaluate the model

如何构建sequential model ?我对指定输入形状感到困惑。

最佳答案

这似乎是一个分类问题,但您的问题对我来说有一些问题,在将所有数据转储到模型中之前您需要采取一些步骤。

问题是我没有看到数据的预处理,您使用了所有功能吗?它们需要缩放吗?您需要对一些数据进行编码吗?在创建模型之前有很多事情需要考虑。

在这种情况下,我猜你的主要特征是文字? 这是一个关于如何执行此操作的很好的指南: https://medium.com/data-from-the-trenches/text-classification-the-first-step-toward-nlp-mastery-f5f95d525d73

或者您自己的链接: https://medium.com/data-from-the-trenches/text-classification-the-first-step-toward-nlp-mastery-f5f95d525d73

然后您可以构建和训练: https://developers.google.com/machine-learning/guides/text-classification/step-4

彻底检查这些内容,你将能够得到你目前所缺少的东西。

关于python - 银行交易分类的 Tensorflow 实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57001614/

相关文章:

python - 如何将 .netrc 文件附加到 python 请求获取方法?

numpy - tensorflow 2.5.0 有要求 h5py~=3.1.0,但你会有 h5py 3.3.0 不兼容

python - 关于 pexpect 模块的新手澄清

python - 如何在tensorflow/keras中使用常量滤波器执行卷积

python - 带有 Svg 图像的 pyQt 悬停事件

tensorflow - 直接导入 Keras 还是通过 TensorFlow?我应该卸载其中一个吗?

python - 类型错误: 'retval_' 在主分支中具有 dtype int32,但在 else 分支中具有 dtype float32

python - 如何在巨大的数据集中查找和转换 pandas 数据框中的缺失值?

r - 向 tdm 矩阵添加虚拟变量

python - 了解二元分类器的精度和召回结果