我有五个数据集,其中添加了“年份”列,如下所示:
newyork2014['Year'] = 2014
newyork2015['Year'] = 2015
newyork2016['Year'] = 2016
newyork2017['Year'] = 2017
newyork2018['Year'] = 2018
但是,我想知道是否有一种更Pythonic的方式来做到这一点,也许是用一个函数?我不想将实际的数据帧更改为字符串,但我想“字符串化”数据帧的名称。这就是我的想法:
def get_year(df):
df['Year'] = last four digits of name of df
return df
最佳答案
创建数据框时您可能需要进行一些调整,需要指定一个名称
newyork2014.name='newyork2014'
def get_year(df):
df['Year'] = df.name[-4:]
return df
get_year(newyork2014)
Out[42]:
ID Col1 Col2 New Year
2018-06-01 A 10 100 0.5 2014
2018-06-02 B 5 25 2.1 2014
2018-06-03 A 25 25 0.6 2014
关于python - 使用数据框中的部分名称创建一个新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52573418/