python - 美丽汤 : Insert a line break with soup. get_text

标签 python beautifulsoup

我正在尝试从站点中提取特定类和特定名称下的所有文本,以便之后将其放入 Excel 文件中。但是,当我使用

soup.get_text("strong", {"class": "literal"})

关于 https://automatetheboringstuff.com/chapter11/ (这只是一个例子),我得到了所有文本,没有一个换行符。是否可以像在网站上一样获取文本,并具有正确的换行符、段落和段落?谢谢!

最佳答案

您可以使用str.join()打印带换行符的文本:

from bs4 import BeautifulSoup
import requests

r = requests.get('https://automatetheboringstuff.com/chapter11/')
soup = BeautifulSoup(r.text, 'lxml')

print('\n'.join(strong.text for strong in soup.select('strong.literal')))

打印:

import webbrowser
webbrowser.open('http://inventwithpython.com/')
pyperclip
else:
# Get address from clipboard.
address = pyperclip.paste()
webbrowser.open('https://www.google.com/maps/place/' + address)
import requests
import requests

...and so on.

关于python - 美丽汤 : Insert a line break with soup. get_text,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51764239/

相关文章:

python - 如何使用 python 将异常回溯写入文件

python - 如何根据环境从我的 settings.py DATABASES 数组中激活数据库设置?

python - Beautiful Soup (bs4) 如何只匹配一个,而且只有一个,css 类

ruby - 带有过滤器的 Nokogiri next_element

python - BeautifulSoup 用 "N/A"填充缺失信息不起作用

python - 如何打印美丽汤中表格行的所有单元格

Python:如果列表元素的第一项发生变化,如何交替选择?

python - 在数据透视表中创建汇总行

python - 从一个 Flask View 重定向到另一个 Flask View

python - 使用 beautifulsoup python 更改内部标签的文本