我正在尝试从站点中提取特定类和特定名称下的所有文本,以便之后将其放入 Excel 文件中。但是,当我使用
soup.get_text("strong", {"class": "literal"})
关于 https://automatetheboringstuff.com/chapter11/ (这只是一个例子),我得到了所有文本,没有一个换行符。是否可以像在网站上一样获取文本,并具有正确的换行符、段落和段落?谢谢!
最佳答案
您可以使用str.join()
打印带换行符的文本:
from bs4 import BeautifulSoup
import requests
r = requests.get('https://automatetheboringstuff.com/chapter11/')
soup = BeautifulSoup(r.text, 'lxml')
print('\n'.join(strong.text for strong in soup.select('strong.literal')))
打印:
import webbrowser
webbrowser.open('http://inventwithpython.com/')
pyperclip
else:
# Get address from clipboard.
address = pyperclip.paste()
webbrowser.open('https://www.google.com/maps/place/' + address)
import requests
import requests
...and so on.
关于python - 美丽汤 : Insert a line break with soup. get_text,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51764239/