machine-learning - Keras 文本预处理 - 将 Tokenizer 对象保存到文件以进行评分

标签 machine-learning neural-network nlp deep-learning keras

我已经按照以下步骤(大致)使用 Keras 库训练了一个情感分类器模型。

使用 Tokenizer 对象/类将文本语料库转换为序列

使用 model.fit() 方法构建模型

评估此模型

现在为了使用这个模型评分，我能够将模型保存到文件中并从文件中加载。但是我还没有找到将 Tokenizer 对象保存到文件的方法。如果没有这个，我每次需要对一个句子进行评分时都必须处理语料库。有没有解决的办法？

最佳答案

最常见的方法是使用 pickle 或 joblib .这里有一个关于如何使用 pickle 的示例。为了节省Tokenizer :

import pickle

# saving
with open('tokenizer.pickle', 'wb') as handle:
    pickle.dump(tokenizer, handle, protocol=pickle.HIGHEST_PROTOCOL)

# loading
with open('tokenizer.pickle', 'rb') as handle:
    tokenizer = pickle.load(handle)

关于machine-learning - Keras 文本预处理 - 将 Tokenizer 对象保存到文件以进行评分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44758405/

上一篇：vim - 如何在 Vim 中使用相同的文本一次又一次有效地粘贴多行？

下一篇：salesforce - 第一个错误 : INVALID_CROSS_REFERENCE_KEY, 分配给 ID:所有者不能为空:[OwnerId]

相关文章：

python - 导入错误 : No module named arff

python - AdaBoost ML算法python实现

python - Pytorch-索引错误 : index out of range in self

python - 关于评论摘要的 NLP 项目

python - Keras Tokenizer 方法究竟做了什么？

python - 如何在keras中将三维数组转换为五维数组

machine-learning - 如何在caffe中将hdf5格式转换为caffemodel格式？

python - Keras:向密集层添加一批常量输入

machine-learning - 深度神经网络中正则化和 dropout 对 NaN 的巨大损失值

python - 将 CudaNdarraySharedVariable 转换为 TensorVariable