python - 如何将规范化函数应用于 pandas 字符串系列？

我想将以下函数应用于数据框系列:

unicodedata.normalize('NFKD', c.lower().decode('utf-8')).encode('ascii','ignore')

我(有点)理解如何执行 db.cname.str.lower() 之类的操作，但我无法泛化到字符串访问器之后的任何其他函数。

如何将normalize 函数应用于该系列的所有成员？

最佳答案

如果 c 是您的字符串列。 map 用于按元素应用函数(当然你不必像这样将它们全部链接在一起)

df[c] = (df[c].str.lower()
              .str.decode('utf-8')
              .map(lambda x: unicodedata.normalize('NFKD', x))
              .str.encode('ascii', 'ignore'))

关于python - 如何将规范化函数应用于 pandas 字符串系列？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31766313/

上一篇：python - 如何在 Flask 蓝图中使用装饰器和函数

下一篇：python - 优化基于另一个字段从一个字段中提取子字符串的循环

python - 如何将 x 轴从普通数字更改为日期和时间格式？

delphi - Delphi错误E2064左侧无法分配给

python - 当参数具有相同的名称时如何恢复内置？

python - 查找仅限于多个范围的重复项 - Pandas

python - 循环更新帧时的 LineCollection 动画

python - 从字符串数据 pandas 中提取关键字

c++ - 如何在 Visual Studio 中处理混合的 unicode 和非 unicode 项目

c++ - Orwell Dev-C++ 中的 Unicode 字符串

python - 我怎样才能刮掉所有击球手的名字？