python-3.x - 如何从python3中的每行读取起始N个单词

我正在阅读 Excel，其中一列中有自由文本。现在从 pandas 读取该文件后，我想限制具有文本的列从每行开始仅读取 N 个单词。我尝试了一切，但没能成功。

data["text"] = 我要去学校，我从市场买了一些东西。

但我只想盯着5个字读。这样它看起来就像下面这样。

data["text"] = 我要去上学。

我希望对 data["text"] 列的每一行执行相同的操作。

我们将非常感谢您的帮助。

最佳答案

def first_k(s: str, k=5) -> str:
    s = str(s)  # just in case something like NaN tries to sneak in there
    first_words = s.split()[:k]
    return ' '.join(first_words)

然后，应用该函数:

data['text'] = data['text'].apply(first_k)

关于python-3.x - 如何从python3中的每行读取起始N个单词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55324724/

上一篇：dask - 对于大于内存的 dask 数组，大小 =(M, N) : How to re-chunk from chunks=(1, N) 到 block =(M, 1)？

下一篇：youtrack - 有没有办法使用新的 YouTrack REST API 进行过滤？

相关文章：

python - BottlePy - 如何从钩子(Hook)中找到当前路线？

python - 用户定义的通用类型和 collections.abc

python - 检查环境变量是否存在的好习惯是什么？

python - 如何获取 Pandas 中分组中最大数据的列的值？

python-3.x - 使用最后 n 个值的平均值或中位数填充数据框不同列中的缺失值

python - 使用列表而不是 numpy 数组

Python:pandas apply 与 map

csv - 读取具有多个 header 的 CSV

python - 使用 python/pandas 将数据标准化并绘制为堆积条形图

python - 如何将字典导入到DataFrame中？