python - 计算每个数据框行中的表情符号数量

标签 python pandas dataframe emoji

正文

0 🤔 🙈 我是 se 😌 ds💕👭👙 你好 👩🏾‍🎓

1 🤔 🙈 我是 se 😌 ds💕👭👙 你好

2 🤔 🙈 我是 se 😌 ds

3 🤔 🙈 像我一样

我想在上面的数据框 (df) 中添加一列,根据每行中表情符号的数量称为“表情符号计数”。

例如,第一行的计数为 7,因为这一行中有 7 个表情符号。

我知道要根据“文本”列中的信息创建一个新列,我会输入:

df["Emoji Count"] = df["Text].....

我能够创建一个计算表情符号数量的函数,但我无法将其应用于我的数据框:

def split_count(info):

    emoji_list = []
    data = regex.findall(r'\X', info)
    for word in data:
        if any(char in emoji.UNICODE_EMOJI for char in word):
            emoji_list.append(word)

    return len(emoji_list)

最佳答案

只是做:

df["Emoji Count"] = df.Text.apply(split_count)

df["Emoji Count"] = df['Text'].apply(split_count)

这会将您的函数应用于每个单元格,并将结果分配回表情符号计数列。

关于python - 计算每个数据框行中的表情符号数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62733426/

相关文章:

python - 数据未出现在 python 绘图上

pandas - 将文件中的项目动态添加到 ComboBox

r - 按关键列合并两个 data.frames

python - Pandas 切 : how to convert categorical labels to strings (otherwise cannot export to Excel)?

python - 通过 bash 文件运行 anaconda

python - 在 IPython Notebook 中显示决策树

python - 如何使用 numpy.savetxt 保存和加载复数数组?

Python:将图像调整为固定大小,忽略初始纵横比

python - 将 Pandas DataFrame 定义为复合 bool 条件

r - 使用鼠标功能时出错 : nothing left to impute