我正在阅读 Excel,其中一列中有自由文本。现在从 pandas 读取该文件后,我想限制具有文本的列从每行开始仅读取 N 个单词。我尝试了一切,但没能成功。
data["text"] = 我要去学校,我从市场买了一些东西。
但我只想盯着5个字读。这样它看起来就像下面这样。
data["text"] = 我要去上学。
我希望对 data["text"] 列的每一行执行相同的操作。
我们将非常感谢您的帮助。
最佳答案
def first_k(s: str, k=5) -> str:
s = str(s) # just in case something like NaN tries to sneak in there
first_words = s.split()[:k]
return ' '.join(first_words)
然后,应用该函数:
data['text'] = data['text'].apply(first_k)
关于python-3.x - 如何从python3中的每行读取起始N个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55324724/