我想将以下函数应用于数据框系列:
unicodedata.normalize('NFKD', c.lower().decode('utf-8')).encode('ascii','ignore')
我(有点)理解如何执行 db.cname.str.lower()
之类的操作,但我无法泛化到字符串访问器之后的任何其他函数。
如何将normalize
函数应用于该系列的所有成员?
最佳答案
如果 c
是您的字符串列。 map
用于按元素应用函数(当然你不必像这样将它们全部链接在一起)
df[c] = (df[c].str.lower()
.str.decode('utf-8')
.map(lambda x: unicodedata.normalize('NFKD', x))
.str.encode('ascii', 'ignore'))
关于python - 如何将规范化函数应用于 pandas 字符串系列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31766313/