python - 如何计算 Pandas 数据帧上的非字母数字字符

标签 python pandas text feature-extraction non-alphanumeric

这是我的数据

No  Body
1   DaTa, Analytics 2
2   StackOver. 67%

这是我的预期输出
No  Body                 Non Alphanumeric   
1   DaTa, Analytics 2    1       
2   StackOver. 67%       2  

我只计算非字母数字,如 ! @ # & ( ) % – [ { } ] : ; ', ? / *空间和数字不算数

最佳答案

您可以使用:

df['Non Alphanumeric'] = df['Body'].str.findall(r'[^a-zA-Z0-9 ]').str.len()

或者:
df['Non Alphanumeric'] = df['Body'].str.count(r'[^a-zA-Z0-9 ]')

print (df)
   No               Body  Non Alphanumeric
0   1  DaTa, Analytics 2                 1
1   2     StackOver. 67%                 2

关于python - 如何计算 Pandas 数据帧上的非字母数字字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49231812/

相关文章:

c# - 写入文件出来正方形

javascript - JavaScript 中的正则表达式帮助

python - Tkinter 按钮在按下时保持凹陷状态

python - 为什么这个 Python 函数不返回 future ?

python - 为什么加载libc共享库有 "' LibraryLoader' object is not callable”错误?

python - 将 pickle 文件写入 AWS 中的 s3 存储桶

python - PyGTK 窗口始终位于所有 'always on top` 窗口之上

python - 如何在 python 中的两个不同的 y Axis 上绘制两个变量?

python - 根据行条件替换 nan 值

file - 如何在 Groovy 中抓取一行的一部分