我有一个 Pandas 数据框,其中一列的每个元素都有字符串数组。
所以像这样的事情。
col1 col2
0 120 ['abc', 'def']
1 130 ['ghi', 'klm']
现在,当我使用 to_csv 将它存储到 csv 时,它看起来很好。
当我使用 from_csv 读回它时,我似乎读回了。
但是当我分析每个单元格中的值时,数组是
'[' ''' 'a' 'b' 'c' 等等。
所以本质上它不是将其作为数组读取,而是将其读取为一组字符串。有人可以建议我如何将此字符串转换为数组吗?
我的意思是说数组已像字符串一样存储
'[\'abc\',\'def\']'
最佳答案
如其他问题所述,您应该使用 literal_eval
这里:
from ast import literal_eval
df['col2'] = df['col2'].apply(literal_eval)
在行动:
In [11]: df = pd.DataFrame([[120, '[\'abc\',\'def\']'], [130, '[\'ghi\',\'klm\']']], columns=['A', 'B'])
In [12]: df
Out[12]:
A B
0 120 ['abc','def']
1 130 ['ghi','klm']
In [13]: df.loc[0, 'B'] # a string
Out[13]: "['abc','def']"
In [14]: df.B = df.B.apply(literal_eval)
In [15]: df.loc[0, 'B'] # now it's a list
Out[15]: ['abc', 'def']
关于python - 在 pandas/python 中,读取存储为字符串的数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48109936/