我正在使用网络收获。但是,我想从 URL 中抓取数据:
我的代码是:
<?xml version="1.0" encoding="UTF-8"?>
<config>
<var-def name="google">
<html-to-xml>
<http url="http://derstandard.at/anzeiger/immoweb/Suchergebnis.aspx?Regionen=9&Bezirke=&Arten=&AngebotTyp=×tamp=1363305908912"></http>
</html-to-xml>
</var-def>
</config>
但是我得到:
Reference to the entity Bezirke has to end with an ';'
我不明白网络收获是什么意思,带有“;”?
最佳答案
我对网络收集不太了解,但他们的例子是这样的:
<xpath expression="//a[@shape='rect']/@href">
<html-to-xml>
<http url="http://www.somesite.com/"/>
</html-to-xml>
</xpath>
<http url =".." />
而你的代码有
<http url = ".."></http>
也许这是你的问题?不需要结束标签
关于java - 网络收获 - 抓取网址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15422524/