我有一个 DataFrame,其中包含作为千位标记的逗号字符串形式的数字。我需要将它们转换为 float 。
a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']]
df=pandas.DataFrame(a)
我猜我需要使用 locale.atof。确实
df[0].apply(locale.atof)
按预期工作。我得到了一系列的花车。
但是当我将它应用到 DataFrame 时,我得到了一个错误。
df.apply(locale.atof)
TypeError: ("cannot convert the series to ", u'occurred at index 0')
和
df[0:1].apply(locale.atof)
给出另一个错误:
ValueError: ('invalid literal for float(): 1,200', u'occurred at index 0')
那么,如何将这个 DataFrame
字符串转换为 float 据帧?
最佳答案
如果您是 reading in from csv那么您可以使用 thousands arg :
df.read_csv('foo.tsv', sep='\t', thousands=',')
这种方法可能比单独执行操作更有效。
您需要 set the locale第一:
In [ 9]: import locale
In [10]: from locale import atof
In [11]: locale.setlocale(locale.LC_NUMERIC, '')
Out[11]: 'en_GB.UTF-8'
In [12]: df.applymap(atof)
Out[12]:
0 1
0 1200 4200.00
1 7000 -0.03
2 5 0.00
关于python - 将pandas DataFrame中带逗号的数字字符串转换为 float ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22137723/