python - 如何从一列中的所有数字中删除\xa3？

我有一个数据框列，它是使用pd.read_csv从csv文件中读取的。当我查看这些数字时，它们看起来都是这样的:

df['Amount'][0]
Out[4]: '\xa3128.23'

也就是说，它们前面有 \xa3，因此也不会被解释为 float 。

如何剥离 \xa3 并使它们 float ？

最佳答案

我认为需要replace :

df['Amount'].str.replace('\xa3', '').astype(float)

或者lstrip通过£:

df['Amount'].str.lstrip('£').astype(float)

正如 @csevier 指出的那样，似乎存在编码问题，解决方案是:

df = pd.read_csv("your_data_set_path", encoding='utf-8')

然后:

df['Amount'] = df['Amount'].str.lstrip('£').astype(float)

关于python - 如何从一列中的所有数字中删除\xa3？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50785963/

相关文章：

python - 在 Pandas 数据框中创建 value_counts 列