pandas - 快速文本错误 : predict processes one line at a time (remove '\n' )

标签 pandas fasttext

您好,我有一个包含文本的数据框列。我想使用 fasttext 模型从中进行预测。 我可以通过传递 array of text 来实现这一点到 fasttext 模型。

import fasttext
d = {'id':[1, 2, 3], 'name':['a', 'b', 'c']}
df = pd.DataFrame(data=d)

我从系列中删除了'\n'

name_list = df['name'].tolist()
name_list = [name.strip() for name in name_list]

并进行预测 model.predict(name_list)

但是,我得到了 ValueError: predict processes one line at a time (remove '\n')

我在列表中没有 '\n' 并且 '\n' in name_list 返回 False

我还找到了一个 post有类似的问题,但仍然有同样的错误。

predictions=[]
for line in df['name']:
    pred_label=model.predict(line, k=-1, threshold=0.5)[0][0]
    predictions.append(pred_label)
df['prediction']=predictions

最佳答案

在给出 model.predict(name_list) 之前,尝试给出一个 for 循环:

for item in name_list:
   item = item.replace("\n"," ")
   model.predict(item)

关于pandas - 快速文本错误 : predict processes one line at a time (remove '\n' ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65820960/

相关文章:

machine-learning - fastText 的官方 python 绑定(bind)中是否有方法 .predict

python - 如何在 Gensim 中获取上下文单词列表

gensim - FastTextKeyedVectors vectors、vectors_vocab 和 vectors_ngrams 实例变量之间的区别

python - 根据条件用数据填充 NaN

python - 如何将我的输出附加到 python 中的特定位置?

nlp - 如何将 gensim Word2Vec 模型转换为 FastText 模型?

python - 使用 gensim 从 fasttext 库中高效地加载预训练词嵌入的内存

python - 删除字符串中包含除 A、C、T、G、N 之外的其他字母的行

python - 如何区分 'PASS' 和 'FAIL' 作为 pandas 中的 bool 值?

python - 如何将 Pandas 数据框列映射到嵌套字典