python - 类型错误 : expected string or bytes-like object

我写了一个script解析html并仅打印文本内容。我想忽略标签。但是我的程序有问题。我不确定它是什么。请帮助我。

import urllib.request
import re
from bs4 import BeautifulSoup
url = "www.example.com"

def hi():
    dep = urllib.request.urlopen(url)
    soup = BeautifulSoup(dep, 'html.parser')
    for link in soup.find_all('p', string=True):
        result = re.sub(b'<.*?>', "", link)
        print (result)
hi()

网站link .

最佳答案

我相信，您在 link 变量中有 NavigableString。

强制将其转换为如下字符串:

for link in soup.find_all('p', string=True):
    result = re.sub(b'<.*?>', "", str(link))
    print (result)

关于python - 类型错误 : expected string or bytes-like object，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35937771/

上一篇：python - 值错误 : Data is not binary and pos_label is not specified for roc_curve

下一篇：带有换行的 Python argparse.RawTextHelpFormatter

python - 在 BeautifulSoup 4.7.0+ 中，如何选择在其属性之一中不包含指定文本的所有元素

Python beautifulsoup - 获取输入值/TypeError : 'NoneType' object is not subscriptable

python - 用美汤刮痧

python - 用于 HTML 解析的最佳 Python 模块

python - 有没有办法在嵌套 for 循环中访问生成器中每个元素的属性？

python - 避免软实时 NumPy/CPython 分配的优点

python - Pandas:将 NaN 视为 One-Hot 编码中不可见的值

python - 获取这些表格并将适当的团队关联在一起

php - 单引号不解析