我正在制作一个简单的命令行程序,用于使用 Python 中的 Twill 模块从网站(非常通用)收集和解析信息。我想使用 Twill 的 show() 命令将 HTML 输出分配给一个变量,以通过我的解析命令运行页面,但每次我将它分配给一个变量...
htmlString = twill.commands.show()
我在命令行上收到了大量的 HTML(就此而言,还有 IDLE)。为什么是这样?我不是要求打印变量,它附近没有打印命令。我只是想分配以进行进一步的操作。为什么变量赋值会导致打印发生?这不是一个致命的错误或什么的,只是真的非常不方便。我使用的是 Python 2.6、Twill 0.9 和 Ubuntu(如果有的话)。
最佳答案
我建议使用lxml
或BeautifulSoup
来解析HTML,从未遇到过twill
。但我看到你调用了 .show()
方法,也许这个方法里面有 print
语句。
关于Python模块 "twill"——变量赋值期间的HTML泛滥,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5831793/