python - 将pandas DataFrame中带逗号的数字字符串转换为 float

标签 python pandas

我有一个 DataFrame,其中包含作为千位标记的逗号字符串形式的数字。我需要将它们转换为 float 。

a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']]
df=pandas.DataFrame(a)

我猜我需要使用 locale.atof。确实

df[0].apply(locale.atof)

按预期工作。我得到了一系列的花车。

但是当我将它应用到 DataFrame 时,我得到了一个错误。

df.apply(locale.atof)

TypeError: ("cannot convert the series to ", u'occurred at index 0')

df[0:1].apply(locale.atof)

给出另一个错误:

ValueError: ('invalid literal for float(): 1,200', u'occurred at index 0')

那么,如何将这个 DataFrame 字符串转换为 float 据帧?

最佳答案

如果您是 reading in from csv那么您可以使用 thousands arg :

df.read_csv('foo.tsv', sep='\t', thousands=',')

这种方法可能比单独执行操作更有效。


您需要 set the locale第一:

In [ 9]: import locale

In [10]: from locale import atof

In [11]: locale.setlocale(locale.LC_NUMERIC, '')
Out[11]: 'en_GB.UTF-8'

In [12]: df.applymap(atof)
Out[12]:
      0        1
0  1200  4200.00
1  7000    -0.03
2     5     0.00

关于python - 将pandas DataFrame中带逗号的数字字符串转换为 float ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22137723/

相关文章:

python - 尝试随机化数据集时出现奇怪错误

python - 如何在批处理/Python中编辑XML文件

python - 减少 Python 中 xgboost 增量训练的错误率

python - 从 CSV 读取数据时,如何在 Dask 中添加索引列?

python - 使用 str.contains 选择包含搜索词列表中所有字符串的数据帧行

python - 如何pandas解析之前保存的json

python - 如何提取Matlab的datenum的小数部分?

javascript - 从 Node.js 运行 python 脚本

python - 按列表选择列(列是列表的子集)

python - Pandas :从一行创建多行 'dummy data'