HTML结构是这样的:
<td class='hey'>
<a href="https://example.com">First one</a>
</td>
这是我的选择器:
m_URL = sel.css("td.hey a:nth-child(1)[href] ").extract()
我的选择器现在将输出 <a href="https://example.com">First one</a>
,但我只希望它输出链接本身:https://example.com
.
我该怎么做?
最佳答案
从 a
标签中获取 ::attr(value)
。
演示(使用 Scrapy shell ):
$ scrapy shell index.html
>>> response.css('td.hey a:nth-child(1)::attr(href)').extract()
[u'https://example.com']
其中 index.html
包含:
<table>
<tr>
<td class='hey'>
<a href="https://example.com">Fist one</a>
</td>
</tr>
</table>
关于python - CSS Selector 获取元素属性值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24987480/