我有一个数据框:
df = pd.DataFrame({'a':[1,2,3], 'b':['2017/01/01', '2017/01/02','2016/12/31'], 'c':['aaa', 'bbb', 'ccc'], 'd':[4,5,6]})
我有一个格式化程序列表:
formatter = [4.2, '%Y%m%d', None, 8.2]
我想将 a 列格式化为 float '4.2f',b 列格式化为 strftime('%Y%m'),c 列按原样格式化(字符串,无需格式化),d 列格式化为 float ' 8.2f'。如何将此格式化程序列表传递给数据框 df?
谢谢
最佳答案
如果您从格式化程序列表切换到基于列的 map ,则可以在数据帧上使用 style.format
。
类似于
import pandas as pd
import datetime
def time_formatter(data):
return datetime.datetime.strptime(data, "%Y/%m/%d").date().strftime('%Y%m%d')
df = pd.DataFrame({'a':[1,2,3], 'b':['2017/01/01', '2017/01/02','2016/12/31'], 'c':['aaa', 'bbb', 'ccc'], 'd':[4,5,6]})
formatter = {'a':'{:4.2f}', 'b': time_formatter, 'd':'{:8.2f}'}
df.style.format(formatter)
将输出
a b c d
0 1.00 20170101 aaa 4.00
1 2.00 20170102 bbb 5.00
2 3.00 20161231 ccc 6.00
编辑:
必须有一种更简洁的方法,但要实际使用您可以执行以下操作的格式更新数据帧:
df['a'] = df['a'].map('{:4.2f}'.format)
df['d'] = df['d'].map('{:8.2f}'.format)
df['b'] = df['b'].map(time_formatter)
或者使用更通用(且神秘)的方式:
formatter = {'a':'{:4.2f}'.format, 'b': time_formatter, 'd':'{:8.2f}'.format}
for f in formatter.items():
column = f[0]
df[column] = df[column].map(f[1])
关于Python-将数据框列格式化为不同的数据类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44784545/