假设我有新闻文章的本地副本。我怎样才能在报纸上刊登这些文章呢?根据文档,报纸库的正常使用是这样的:
from newspaper import Article
url = 'http://fox13now.com/2013/12/30/new-year-new-laws-obamacare-pot-guns-and-drones/'
article.download()
article = Article(url)
article.parse()
# ...
就我而言,我不需要从网页下载文章,因为我已经拥有该页面的本地副本。如何在网页的本地副本上使用报纸?
最佳答案
确实有一个官方方法可以解决这个问题,如上所述 here
在程序中加载 html 后,您可以使用 set_html()
方法将其设置为 article.html
import newspaper
with open("file.html", 'rb') as fh:
ht = fh.read()
article = newspaper.Article(url = ' ')
article.set_html(ht)
article.parse()
关于python - 如何在不下载文章的情况下使用Newspaper3k库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56677636/