python - 我可以使用 python、selenium 和 lxml 解析 xpath 吗?

标签 python parsing selenium lxml xpath

所以我一直在尝试弄清楚如何使用 BeautifulSoup 并进行了快速搜索,发现 lxml 可以解析 html 页面的 xpath。如果我能做到这一点,我会很高兴,但教程不是那么直观。

我知道如何使用 Firebug 来获取 xpath,并且很好奇是否有人使用过 lxml 并且可以解释我如何使用它来解析特定的 xpath,并打印它们.. 比如说每行 5 个.. 或者如果有可能的话?!

Selenium 正在使用 Chrome 并正确加载页面,只是需要帮助继续前进。

谢谢!

最佳答案

lxml 的 ElementTree 有一个 .xpath() 方法(请注意,Python 发行版的 xml 包中的 ElementTree 没有该方法!)

例如

# see http://lxml.de/xpathxslt.html

from lxml import etree

# root = etree.parse('/tmp/stack-overflow-questions.xml')
root = etree.XML('''
        <answers>
            <answer author="dlam" question-id="13965403">AAA</answer>
        </answers>
''')

all_answers = root.xpath('.//answer')

for i, answer in enumerate(all_answers):
    who_answered = answer.attrib['author']
    question_id = answer.attrib['question-id']
    answer_text = answer.text
    print 'Answer #{0} by {1}: {2}'.format(i, who_answered, answer_text)

关于python - 我可以使用 python、selenium 和 lxml 解析 xpath 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13965403/

相关文章:

Python Pandas 回归

Python bool 方法命名的可读性

regex - AWK代码解析器,区分除法和正则表达式

python - 无法选中复选框出现超时异常

java - 如何将插件添加到我的 webdriver 浏览器

Python Pandas 分配/计算 bool 列的位置

python - 如何从 CMake 获取 "install"Python 代码?

json - 如何解析 ColdFusion 返回的 JSON

java - 使用 MediaWiki 从 Wikia 页面提取文本,但返回时一团糟 有没有更好的方法可以从每个部分提取文本?

java - 发生断言错误后 Chrome 不会退出