python - 类型错误 : expected string or bytes-like object

标签 python beautifulsoup html-parsing

我写了一个script解析html并仅打印文本内容。我想忽略标签。但是我的程序有问题。我不确定它是什么。请帮助我。

enter image description here

import urllib.request
import re
from bs4 import BeautifulSoup
url = "www.example.com"

def hi():
    dep = urllib.request.urlopen(url)
    soup = BeautifulSoup(dep, 'html.parser')
    for link in soup.find_all('p', string=True):
        result = re.sub(b'<.*?>', "", link)
        print (result)
hi() 

网站link .

最佳答案

我相信,您在 link 变量中有 NavigableString

强制将其转换为如下字符串:

for link in soup.find_all('p', string=True):
    result = re.sub(b'<.*?>', "", str(link))
    print (result)

关于python - 类型错误 : expected string or bytes-like object,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35937771/

相关文章:

python - 有没有办法将 Python/Tkinter 连接到已经运行的 Tcl/Tk 应用程序?

python - 在 BeautifulSoup 4.7.0+ 中,如何选择在其属性之一中不包含指定文本的所有元素

Python beautifulsoup - 获取输入值/TypeError : 'NoneType' object is not subscriptable

python - 用美汤刮痧

python - 用于 HTML 解析的最佳 Python 模块

python - 有没有办法在嵌套 for 循环中访问生成器中每个元素的属性?

python - 避免软实时 NumPy/CPython 分配的优点

python - Pandas:将 NaN 视为 One-Hot 编码中不可见的值

python - 获取这些表格并将适当的团队关联在一起

php - 单引号不解析