我有一个 XML 数据,其中也包含 HTML 数据。我正在尝试将此 XML 数据转储到 csv 文件中的一个单元格,该文件还包含其他列。现在,它正在 split 并进入不同(相邻)的单元格。因此使用 pandas 读取 csv 会引发错误
Error tokenizing data. C error: Expected 94 fields in line 3, saw 221
我还研究了 similar设想。但这没有帮助,因为它来自数据库。因此,解决方法的功能会有所不同。
我不想解析 XML 数据。我只想将整个 XML 数据保存到 csv 文件的一个单元格中。
此外,出于保密原因,我无法共享数据快照,但我希望问题得到传达。
感谢任何帮助。
最佳答案
您可以使用内置的 csv 包,尝试将 xml 作为字符串包装在列表中:
import csv
xml = ["""<?xml version="1.0"?>
<catalog>
<book id="bk101">
<author>Gambardella, Matthew</author>
<title>XML Developer's Guide</title>
<genre>Computer</genre>
<price>44.95</price>
<publish_date>2000-10-01</publish_date>
<description>An in-depth look at creating applications
with XML.</description>
</book>
</catalog>"""]
with open("test.csv", "w", encoding="utf8") as out_file:
writer = csv.writer(out_file)
writer.writerow(xml)
然后您应该能够使用 pandas 读取它。
关于python - 使用 python 将 xml 数据转储到 csv 文件中的单元格中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58851238/