python - 如何在不下载文章的情况下使用Newspaper3k库?

标签 python python-newspaper

假设我有新闻文章的本地副本。我怎样才能在报纸上刊登这些文章呢?根据文档,报纸库的正常使用是这样的:

from newspaper import Article

url = 'http://fox13now.com/2013/12/30/new-year-new-laws-obamacare-pot-guns-and-drones/'
article.download()
article = Article(url)
article.parse()
# ...

就我而言,我不需要从网页下载文章,因为我已经拥有该页面的本地副本。如何在网页的本地副本上使用报纸?

最佳答案

确实有一个官方方法可以解决这个问题,如上所述 here

在程序中加载 html 后,您可以使用 set_html() 方法将其设置为 article.html

import newspaper
with open("file.html", 'rb') as fh:
    ht = fh.read()
article = newspaper.Article(url = ' ')
article.set_html(ht)
article.parse()

关于python - 如何在不下载文章的情况下使用Newspaper3k库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56677636/

相关文章:

python - 如何居中绘制 3d 曲面图?

python - 如何使用Python报库?

python - 如何修复某些 URL 的 Newspaper3k 403 客户端错误?

python - 文本环绕时清除终端中的最后一行

python - OpenCV Python equalizeHist 彩色图像

python - fit_transform 后数组大小不同

python - Python 中的雅虎聊天

python - 报库中的发布日期总是返回无

python - 限制报纸的 URL 输出