python - 如何将规范化函数应用于 pandas 字符串系列?

标签 python pandas unicode

我想将以下函数应用于数据框系列:

unicodedata.normalize('NFKD', c.lower().decode('utf-8')).encode('ascii','ignore')

我(有点)理解如何执行 db.cname.str.lower() 之类的操作,但我无法泛化到字符串访问器之后的任何其他函数。

如何将normalize 函数应用于该系列的所有成员?

最佳答案

如果 c 是您的字符串列。 map 用于按元素应用函数(当然你不必像这样将它们全部链接在一起)

df[c] = (df[c].str.lower()
              .str.decode('utf-8')
              .map(lambda x: unicodedata.normalize('NFKD', x))
              .str.encode('ascii', 'ignore'))

关于python - 如何将规范化函数应用于 pandas 字符串系列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31766313/

相关文章:

python - 如何根据PANDAS中的groupby字段在for循环中写入to_excel动态文件名?

python - 如何将 x 轴从普通数字更改为日期和时间格式?

delphi - Delphi错误E2064左侧无法分配给

python - 当参数具有相同的名称时如何恢复内置?

python - 查找仅限于多个范围的重复项 - Pandas

python - 循环更新帧时的 LineCollection 动画

python - 从字符串数据 pandas 中提取关键字

c++ - 如何在 Visual Studio 中处理混合的 unicode 和非 unicode 项目

c++ - Orwell Dev-C++ 中的 Unicode 字符串

python - 我怎样才能刮掉所有击球手的名字?