python - 如何计算 Pandas 数据框单元格中的单词总数并将它们添加到新列中?

标签 python pandas dataframe count words

情感分析中的一项常见任务是获取 Pandas 数据框单元格中的单词数量,并根据该数量创建一个新列。我该怎么做?

最佳答案

假设n个单词的句子中有n-1个空格,还有另外一种解法:

df['new_column'] = df['count_column'].str.count(' ') + 1

这个解决方案可能更快,因为它不会将每个字符串拆分成一个列表。

如果count_column包含空字符串,则结果需要调整(见下方注释):

df['new_column'] = np.where(df['count_column'] == '', 0, df['new_column'])

关于python - 如何计算 Pandas 数据框单元格中的单词总数并将它们添加到新列中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46429033/

相关文章:

python - python 中的百分位数

python - 导入 azure.search.documents 时,Azure 函数未部署(时间触发器)

python - CNTK 2 排序小批量源

python - 检查一个 DataFrame 中的一行是否存在于另一个 DataFrame 中,仅基于特定的列

Python Pandas 遍历行并访问列名

python - 如何将DataFrame转换为xlsx文件而不保存它?

python - 如何在不使用类的情况下自动调整 QLabel 像素图保持比率?

python - 将月份转换为离散时间段

python - 如何有效地将元组同时应用于 Pandas 数据框中的多个列

python - 如果值列表不在数据框列中(每个值),则返回 true