python - 从嵌套列表中剥离文本并将内容保存到 csv 文件中

标签 python csv

我有一个如下所示的嵌套列表,

[
    [
        '<p><strong>Mike</strong><br>Cardiologist</br></p>',
        '<p><strong>Alexandra</strong><br> Cardiac Surgeon</br></p>'
    ],

    [
        '<p><strong>Henna</strong><br/>physician</p>',
        '<p><strong>Gregg</strong><br/> Echocardiographer</p>'
    ]
]

我可以从中删除文本,也可以在 csv 中写入所有这些标签。我不知道如何实现两者。

我希望将数据打印在 CSV 文件中,如下所示,

Mike:Cardiologist, Alexandra:Cardiac Surgeon # This is first list in the parent list

Henna:physician, Gregg:Echocardiographer          # This is second list in the parent list

最佳答案

我已经为你写了一个例子。

代码:

import re
import csv

input_list = [
    [
        "<p><strong>Mike</strong><br>Cardiologist</br></p>",
        "<p><strong>Alexandra</strong><br> Cardiac Surgeon</br></p>",
    ],
    [
        "<p><strong>Henna</strong><br/>physician</p>",
        "<p><strong>Gregg</strong><br/> Echocardiographer</p>",
    ],
]

with open("test.csv", mode="w") as opened_csv:
    csv_writer = csv.writer(opened_csv, delimiter=",")
    for group in input_list:
        tmp_list = []
        for elem in group:
            result = re.sub("<[^>]*>", " ", elem)
            result = " ".join(result.split())
            tmp_list.append(result.strip().replace(" ", ":", 1))
        csv_writer.writerow(tmp_list)

test.csv 文件:

Mike:Cardiologist,Alexandra:Cardiac Surgeon
Henna:physician,Gregg:Echocardiographer

关于python - 从嵌套列表中剥离文本并将内容保存到 csv 文件中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57967437/

相关文章:

python - 尝试使函数循环并在用户未输入任何内容时中断

python - Peewee:如何从数组字段为空的 Postgres 中选择数据?

scala - 如何在 Spark 中跳过 CSV 文件的 header ?

arrays - 使用 CSV 对象声明 Powershell 变量

php - exec 无法正确执行 php 命令 centos 7

python - 什么是 Gridsearch.cv_results_ ,是否可以解释其中的所有内容,即 mean_test_score 等?

python - Google App Engine 的简单框架(如 Sinatra)?

java - 从 Android Studio 中的 CSV 文件中获取信息?

python - 如何在 Pandas 的同一列中将每个值与项目的最大值进行比较

java - 将字符串 "8:00"转换为分钟(整数值)