python - 令人难以置信的基本 lxml 问题 : getting HTML/string content of lxml. etree._Element?

标签 python lxml

这是一个基本的问题,我实际上在文档中找不到它:-/

如下:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

如何获取 <img/> 的 HTML标记?

我尝试添加 html_content()但得到 AttributeError: 'lxml.etree._Element' object has no attribute 'html_content' .

另外,它是一个包含一些内容的标签(例如 <p>text</p> )我如何获取内容(例如 text )?

非常感谢!

最佳答案

我想它会很简单:

from lxml.etree import tostring
inner_html = tostring(img)

至于从内部获取内容<p> ,比如说,一些选定的元素el :

content = el.text_content()

关于python - 令人难以置信的基本 lxml 问题 : getting HTML/string content of lxml. etree._Element?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5395948/

相关文章:

python - 如何从图像中提取表格数据?

c++ - waf:如何使用额外的工具以及如何分发项目?

python - 如何比较两个列表中一个列表中有重复的项目?

python - 词典理解和创建过程中的键检查

Python XPath 抓取显示列表没有文本属性

python - 如何将 Instagram API 响应转换为 Python 3 字典?

Python 找不到 lxml 模块

xpath - scrapy xpath 针对带有 type=html 和 html 实体的 xml 的解决方案

html - 无法将 html 从 Mechanize 传递给 lxml

python - 让 BeautifulSoup4+lxml 与 cx_freeze 一起工作需要什么?