我有一个数据框列,它是使用pd.read_csv
从csv文件中读取的。当我查看这些数字时,它们看起来都是这样的:
df['Amount'][0]
Out[4]: '\xa3128.23'
也就是说,它们前面有 \xa3
,因此也不会被解释为 float 。
如何剥离 \xa3
并使它们 float ?
最佳答案
我认为需要replace
:
df['Amount'].str.replace('\xa3', '').astype(float)
或者lstrip
通过£
:
df['Amount'].str.lstrip('£').astype(float)
正如 @csevier 指出的那样,似乎存在编码问题,解决方案是:
df = pd.read_csv("your_data_set_path", encoding='utf-8')
然后:
df['Amount'] = df['Amount'].str.lstrip('£').astype(float)
关于python - 如何从一列中的所有数字中删除\xa3?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50785963/