python - 当我尝试使用 keras 标记我的 txt 字符串数组时出现参数错误

标签 python machine-learning keras tokenize

我正在尝试标记我的字符串数组,并将它们转换为正式的序列。但是,当我尝试运行以下代码时,出现错误。

tokenizer = Tokenizer(num_words=20000)
tokenizer.fit_on_texts(txt)
sequences = tokenizer.texts_to_sequences(txt)

这是我的错误消息:

__init__() got an unexpected keyword argument 'num_words'

有人能告诉我为什么吗?我应该如何修复它?另外,我的 txt 数组的长度约为 5000,第 10 个字符串如下所示:

[“话虽如此,我今年将接种流感疫苗,我会鼓励周围老人或 child 的任何人也接种它”,“RT @EWJJr:禽流感和 pig 流感之间的区别:针对禽流感你会得到推文。对于 pig 流感,你会得到药膏。/这太糟糕了,但这是好事”,“伊利诺伊州在 4 周内获得 pig 流感疫苗”,“RT @EWJJr:禽流感和 pig 流感之间的区别:对于禽流感,你会得到推文。对于 pig 流感,你会得到药膏。/这太糟糕了,但这是好事”,“你一定是在开玩笑吧..我周围的每个人都生病了,我开玩笑说生病了,并 mock 流感疫苗......我现在很受伤.. 废话”,“带阿什去做体检,我们都被注入(inject)了流感疫苗!!! WTF?','RT @WatchBirds Bird News:米苏拉水禽接受了禽流感检测','注入(inject)流感疫苗然后照顾 child 。','我知道这不是“ pig 流感”!没有在泥里大便、在泥里打滚的冲动。不是“禽流感”——挡风玻璃或雕像上没有粪便。”,“@thatoneguybob 我知道我害怕我会感染 pig 流感”]``

最佳答案

我怀疑您正在使用 Keras 1.x。升级到 Keras 2.x 应该可以解决这个问题。

关于python - 当我尝试使用 keras 标记我的 txt 字符串数组时出现参数错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43164582/

相关文章:

keras - 了解 Keras LSTM 权重

python - 将名称之间的制表符替换为空格

python - Tensorflow v1.14 中内核约束的使用

python - Relu 性能比 sigmoid 差?

python - pytorch预测稳定性

tensorflow - 如何实现keras的summergewhith模式

python - 如何解释 keras "predict_generator "输出?

python - pygame中的碰撞问题

python - 一个 TKinter 控件中的多个事件

python - 使用 Python 从字符串中提取值