python - 在 Python 中标记数据(将数据转换为模式)

标签 python python-3.x pandas

我有一个如下所示的数据框:

Name      | City

Apple     | Tokyo
Papaya    | Pune
TimGru334 | Shanghai
236577    | Delhi

我需要遍历每个值并需要在 Python 中标记数据。详细解释:

  • 对于值“Apple”,应将其转换为“ccccc”,其中 c 表示一个字符。
  • 对于“TimGru334”,应将其转换为“ccccccddd”
  • 考虑值“236577”,应将其转换为“dddddd”,其中 d 表示数字/数字。

有人可以帮帮我吗?

P.S:我是这个平台的新手,所以如果我有任何错误,请原谅。 提前致谢:)

最佳答案

使用 Series.replace - 首先是非数字值,然后是数字值 - 列表中值的顺序很重要:

df['Name'] = df['Name'].replace(['\D', '\d'], ['c','d'], regex=True)
print (df)
        Name      City
0      ccccc     Tokyo
1     cccccc      Pune
2  ccccccddd  Shanghai
3     dddddd     Delhi

如果需要替换所有列:

df = df.replace(['\D', '\d'], ['c','d'], regex=True)
print (df)
        Name      City
0      ccccc     ccccc
1     cccccc      cccc
2  ccccccddd  cccccccc
3     dddddd     ccccc

关于python - 在 Python 中标记数据(将数据转换为模式),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56984028/

相关文章:

python - 如果在另一个列表中,则从列表中删除项目(列表的列表)

python - 如何避免浮点错误?

python - 为文件夹中的文件生成字典元素列表

python - 加入/合并两个 Pandas 数据框并填充

python - 在子集上使用 dropna 进行清理

python - 规范化 json 列并与数据帧的其余部分连接

python - 一个 TKinter 控件中的多个事件

python - 使用 Paramiko 运行数据库脚本失败并显示退出代码

python - PIP 在 Windows 8 上的何处存储/保存 Python 3 模块/包?

Python key 错误 'sapi5'