python - 过滤列表列的列表，然后在 Python 中逐行拆分(分解)

假设我在具有列表列表的数据框中有一列:

   id                                                pos
0   1  [[['Malaysia','NR'], [':','PU'], ['Natural','JJ'], ['selling price','NN']]]
1   2  [[['Spot Price','NN'], [':','PU'], ['cotton','NN'], ['India', ' NR']]]

或字典格式:

[{'id': 1,
  'pos': "[[['Malaysia','NR'], [':','PU'], ['Natural','JJ'], ['selling price','NN']]]"},
 {'id': 2,
  'pos': "[[['Spot Price','NN'], [':','PU'], ['cotton','NN'], ['India', ' NR']]]"}]

如果列表的第二个元素是 NR，我该如何过滤或 NN然后 split (爆炸)pos按行列如下:

   id          words part_of_speech
0   1        Malasia             NR
1   1  selling price             NN
2   2     Spot price             NN
3   2         cotton             NN
4   2          India             NR

我怎么能在 Python 中做到这一点？谢谢。
试用代码:

l = [[['Malaysia','NR'], [':','PU'], ['Natural','JJ'], ['selling price','NN']]]
for elem in l[0]:
    print(elem[1])

出去:

NR
PU
JJ
NN

最佳答案

你可以用 explode 试试这个:

x = df.explode('pos').explode('pos')
x = x[['id']].reset_index(drop=True).join(pd.DataFrame(x['pos'].tolist()).set_axis(['words', 'part_of_speech'], axis=1))
x.loc[x['part_of_speech'].isin(['NN', 'NR'])]

   id          words part_of_speech
0   1       Malaysia             NR
3   1  selling price             NN
4   2     Spot Price             NN
6   2         cotton             NN
7   2          India             NR
>>>

对于具有任意长度的数据帧，此解决方案可以轻松缩放，它不会一一分配列，而是一次分配列。所以它适用于任意长度的子列表。

关于python - 过滤列表列的列表，然后在 Python 中逐行拆分(分解)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69171596/

上一篇：git - git bisect 如何告诉我哪个 merge 破坏了主分支？

下一篇：java - 使用 Jackson 将 XML 属性添加到手动构建的节点树

相关文章：

python - 根据与其他 2 列相关的条件创建一列

在未提供的列表中查找值的 pythonic 方法

python - 类型错误 : 'module' object is not callable when running pip3 with sudo on CentOS 7

excel - 根据文件中的工作表名称从 pandas 数据框创建 csv 文件

python - Tkinter 文本小部件变形列大小

python - 在将列与 Python Pandas 结合的同时 reshape (融化？)数据

python - 如何使用 RandomizedSearchCV 正确实现 StratifiedKFold

python - 如果列的任何单元格中存在True，该如何测试？

python - 如何在 Django 管理模型中上传多个文件

python - 从数据框单元格中的字符串中删除单词/字符？