python - 使用 pyKML 解析 KML 文档

标签 python xml lxml kml pykml

我正在使用 pyKML 模块从给定的 KML 文件中提取坐标。

我的Python代码如下:

from pykml import parser
fileobject = parser.fromstring(open('MapSource.kml', 'r').read())
root = parser.parse(fileobject).getroot()
print(xml.Document.Placemark.Point.coordinates)

但是,在运行此程序时,我收到以下错误:
ValueError: Unicode strings with encoding declaration are not supported. Please use bytes input or XML fragments without declaration.

寻找解决方案,我遇到了这个解决方案http://twigstechtips.blogspot.in/2013/06/python-lxml-strings-with-encoding.html从我尝试过的地方(我不确定这是正确的方法):
from pykml import parser
from lxml import etree
from os import path
kml_file = open('MapSource.kml', 'r')
parser = etree.XMLParser(recover=True)
xml = etree.fromstring(kml_file, parser)
print(xml.Document.Placemark.Point.coordinates)

这给了我ValueError: can only parse strings .我解析 KML 并获取该结构的坐标的正确方法是什么?

最佳答案

在上面的例子中,root = parser.parse(fileobject).getroot()正在对文件内容调用 parse() 作为从前一行的 fromstring() 函数返回的字符串。
使用 pyKML 解析 KML 文件有两种方法:
1:使用 parse.parse() 解析文件。

from pykml import parser
with open('MapSource.kml', 'r') as f:
  root = parser.parse(f).getroot()
print(root.Document.Placemark.Point.coordinates)
2:使用 parse.parsestring() 解析字符串内容。
from pykml import parser
with open('MapSource.kml', 'rb') as f:
  s = f.read()
root = parser.fromstring(s)
print(root.Document.Placemark.Point.coordinates)
如果 KML 文件将 XML prolog header 作为非 UTF8 编码的第一行并尝试使用“r”作为文本读取文件,而使用“rb”作为二进制格式读取文件,则方法 #2 可能会失败。
如果在 KML 文档中未正确指定编码,则注释解析可能会失败。由于名称和描述中包含国际字符和图形字符,因此在下面的示例中使用了 ISO-8859-1 编码。省略编码或使用“UTF-8”会使其成为无效的 XML 文件。
<?xml version="1.0" encoding="ISO-8859-1"?>
<kml xmlns="http://www.opengis.net/kml/2.2">
<Document>
  <Placemark>
    <name>Río Grande</name> 
    <description>
      Location: 18° 22′ 49″ N, 65° 49′ 53″ W
    </description>
    ...
</kml>

关于python - 使用 pyKML 解析 KML 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26074069/

相关文章:

python - 将点表示法字符串转换为对象以访问 lxml 对象 python

python - Pandas dataframe 编码具有数千个唯一值的分类变量

Python Panda 数据框按月-年排序

python - 在 Pandas 中重命名系列

java - 与 JPA 的自连接关系

c# - 如果 XElement 为 Null,如何防止添加 XML 元素?

xml - python解析xml并获取root下每个子元素的属性值

python - XPath 不是 lxml 的预期结果

python - 导入错误 : No module named elementtree. SimpleXMLWriter

c# - 包含来自 XML 文件的图像的 DataGridView