简要说明:我有一个脚本,它循环访问页面的元素,然后返回数据。但我希望它返回的数据不在元素中,而是按顺序返回。
import argparse, os, socket, urllib2, re
from bs4 import BeautifulSoup
pge = urllib2.urlopen("").read()
src = BeautifulSoup(pge)
body = src.findAll('body')
el = body[0].findChildren()
for s in el:
cname = s.get('class')
if cname[0] == "work":
print s.text
HTML:
<body>
<div class="work">1</div>
<span class="nope">tosee</span>
<span class="work">2</span>
<span class="work">3</span>
4
<span class="work">5</span>
<span class="no">nothing</span>
</body>
它打印 1235 并错过了 4,但我希望它打印 12345
最佳答案
简单地说:
print soup.find('body').text
关于python - 从标签中获取数据(BeautifulSoup),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21248554/