我有一个如下所示的数据框:
Name | City
Apple | Tokyo
Papaya | Pune
TimGru334 | Shanghai
236577 | Delhi
我需要遍历每个值并需要在 Python 中标记数据。详细解释:
- 对于值“Apple”,应将其转换为“ccccc”,其中 c 表示一个字符。
- 对于“TimGru334”,应将其转换为“ccccccddd”
- 考虑值“236577”,应将其转换为“dddddd”,其中 d 表示数字/数字。
有人可以帮帮我吗?
P.S:我是这个平台的新手,所以如果我有任何错误,请原谅。 提前致谢:)
最佳答案
使用 Series.replace
- 首先是非数字值,然后是数字值 - 列表中值的顺序很重要:
df['Name'] = df['Name'].replace(['\D', '\d'], ['c','d'], regex=True)
print (df)
Name City
0 ccccc Tokyo
1 cccccc Pune
2 ccccccddd Shanghai
3 dddddd Delhi
如果需要替换所有列:
df = df.replace(['\D', '\d'], ['c','d'], regex=True)
print (df)
Name City
0 ccccc ccccc
1 cccccc cccc
2 ccccccddd cccccccc
3 dddddd ccccc
关于python - 在 Python 中标记数据(将数据转换为模式),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56984028/