python - 将搜索添加到文件类型对象的廉价方法

标签 python file urllib pypdf file-type

PdfFileReader 从 pdf 文件中读取内容以创建对象。

我通过urllib.urlopen()从cdn查询pdf,这为我提供了一个类似文件的对象,它没有搜索。 PdfFileReader,但是使用seek。

从通过 url 下载的 pdf 创建 PdfFileReader 对象的简单方法是什么。

现在,我该怎么做才能避免写入磁盘并通过 file() 再次读取它。

提前致谢。

最佳答案

确实没有一种廉价、即用的方法可以做到这一点。最简单的方法是读取所有数据并将其放入 StringIO目的。然而,这确实要求您首先阅读所有内容,这可能是也可能不是您想要的。

如果您想要只在必要时读取的内容,然后存储读取的内容(或者可能只是读取的一部分),那么您必须自己编写它。您可能想查看 StringIO 模块(或 Python 2.6 中的 io 模块)的源代码以获取一些示例。

关于python - 将搜索添加到文件类型对象的廉价方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2653079/

相关文章:

python - 这是 python 3 文件错误吗?

python - AttributeError : 'str' object has no attribute 'findAll' , 使用 BeautifulSoup 从 Youtube 抓取数据时无输出

python - 术语:Argv、调用程序

python - 如何使用 update() 方法对 Python Pandas Dataframe 中的 collection.Counter 对象求和?

java - 如何将字符串转换为文件名

python - 如何使用 Python 自动登录 gmail atom feed?

python - 我如何使用 mechanize 和 BeautifulSoup 找到这些成绩和这些类(class)名称?

python - 如何在 Python 中使用 elasticsearch 检索 1M 的文档?

python - Django:在最大外键值上选择不同的值

linux - 当日志大小较大时,性能较低