python-3.x - 如何从python3中的每行读取起始N个单词

标签 python-3.x pandas

我正在阅读 Excel,其中一列中有自由文本。现在从 pandas 读取该文件后,我想限制具有文本的列从每行开始仅读取 N 个单词。我尝试了一切,但没能成功。

data["text"] = 我要去学校,我从市场买了一些东西。

但我只想盯着5个字读。这样它看起来就像下面这样。

data["text"] = 我要去上学。

我希望对 data["text"] 列的每一行执行相同的操作。

我们将非常感谢您的帮助。

最佳答案

def first_k(s: str, k=5) -> str:
    s = str(s)  # just in case something like NaN tries to sneak in there
    first_words = s.split()[:k]
    return ' '.join(first_words)

然后,应用该函数:

data['text'] = data['text'].apply(first_k)

关于python-3.x - 如何从python3中的每行读取起始N个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55324724/

相关文章:

python - BottlePy - 如何从钩子(Hook)中找到当前路线?

python - 用户定义的通用类型和 collections.abc

python - 检查环境变量是否存在的好习惯是什么?

python - 如何获取 Pandas 中分组中最大数据的列的值?

python-3.x - 使用最后 n 个值的平均值或中位数填充数据框不同列中的缺失值

python - 使用列表而不是 numpy 数组

Python:pandas apply 与 map

csv - 读取具有多个 header 的 CSV

python - 使用 python/pandas 将数据标准化并绘制为堆积条形图

python - 如何将字典导入到DataFrame中?