python - 机器学习: working with array of objects in preprocessing

标签 python dictionary machine-learning data-preprocessing

我们在项目预处理中遇到了一个问题,即某些列包含这样的对象数组(字典)

<表类=“s-表”> <标题> A 列 B 列 <正文> 电影1 [{"iso_639_1": "en", "name": "English"}, {"iso_639_1": "zh", "name": "\u666e\u901a\u8bdd"}] 电影2 [{"iso_639_1": "da", "name": "丹麦"}, {"iso_639_1": "en", "name": "English"}, {"iso_639_1": "no", "name": "Norsk"}, {"iso_639_1": "ru", "name": "P\u0443\u0441\u0441\u043a\u0438\u0439"}]

因此向我们提出解决此问题的想法可能会有所帮助

不知道如何处理这样的问题

最佳答案

尝试:

from ast import literal_eval

# optional: apply literal_eval if values in "Column B" are strings
#df['Column B'] = df['Column B'].apply(literal_eval)

df = df.explode('Column B')
df = pd.concat([df, df.pop('Column B').apply(pd.Series)], axis=1)
print(df)

打印:

  Column A iso_639_1     name
0   movie1        en  English
0   movie1        zh      普通话
1   movie2        da    Dansk
1   movie2        en  English
1   movie2        no    Norsk
1   movie2        ru  Pусский

关于python - 机器学习: working with array of objects in preprocessing,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76036812/

相关文章:

python - 傅立叶空间平移

python - Django中两个模型之间的ManyToMany关系

python - 在 python 中反转字典不起作用

python - 如何根据相似的值和键对Python字典进行排序?

python - 如何在 python 中使用嵌套字典?

python-3.x - 使用groupby后在Python中填充缺失的元素

python - Django View 中的 "request"是什么

python - 如何使用 python 生成器表达式创建一个 oneliner 多次运行一个函数并获得列表输出

tensorflow - 在tf-slim中实现混合精度训练

python - 在 python 中执行 OneHotEncoder 后保留列名的最佳方法是什么?