python - 数据框:如何删除字符串中的点

我想直接在 CatBoost 模型中使用分类特征，并且需要在 Catboost 模型中将我的对象列声明为分类。我的数据框中有一列，它是一个包含 nace 代码的对象，如下所示:

NACE_代码

5632      81.101
8060      41.200
15147     43.120
24644     68.100
29144     86.909
37122         68
39853         43
59268         43
108633    70.220
108693    56.102
175820    43.320
184606    41.200
Name: NACE_code, dtype: object

Python 不接受此列作为分类列。相反，它告诉我这是一个 float ，因为某些值带有点。我对 python 比较陌生，我尝试了不同的方法来删除这些值中的点，但我最后一次尝试将所有这些不带点的值更改为 NAN。

df['NACE_code'].str.replace(r"(\d)\.", r"\1")

5632      81101
8060      41200
15147     43120
24644     68100
29144     86909
37122       NaN
39853       NaN
59268       NaN
108633    70220
108693    56102
175820    43320
184606    41200
Name: NACE_KODE, dtype: object

如何让我的专栏看起来像这样？我很感激我能得到的任何帮助!

5632      81101
8060      41200
15147     43120
24644     68100
29144     86909
37122       68
39853       43
59268       43
108633    70220
108693    56102
175820    43320
184606    41200

最佳答案

# The following code should work:
df.NACE_code = df.NACE_code.astype(str)
df.NACE_code = df.NACE_code.str.replace('.', '')

关于python - 数据框:如何删除字符串中的点，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/71466999/

上一篇：foundry-code-repositories - 如何在 Foundry 中测试多输出 pyspark 转换

下一篇：ruby - 有人可以解释一下 vertices.flatten!在 SketchUp Ruby 中对我来说？

相关文章：

python - 简单 Python 代码中的 Str 对象错误

python - 沿 axis=1 对值进行排序，NaN 位于行开头

通过创建新行替换数据框中一行的值，但保留修改后的原始行

python - 如何在 python 中将单行拆分为具有特定列号的多列？

python - sympy 符号矩阵平方根

python - 使用 groupby 重新采样 Pandas Dataframe

python - 如何在Python多模块的覆盖范围中排除目录

string - perl中的子字符串比较

javascript - 如何将字符串转换为数组？

Python:对元组列表进行排序时的平局断路器(第一个元素的最大值，以及第二个元素的第一次出现)