我想知道 python 中是否有一种方法(工具或函数等)将我的 pdf 文件转换为 doc 或 docx?
我知道在线转换器,但我需要在 Python 代码中使用它。
最佳答案
如果您的 pdf 文件有很多页......下面的代码将起作用:
import PyPDF2
path="C:\\ .... "
text=""
pdf_file = open(path, 'rb')
text =""
read_pdf = PyPDF2.PdfFileReader(pdf_file)
c = read_pdf.numPages
for i in range(c):
page = read_pdf.getPage(i)
text+=(page.extractText())
关于python - 有没有办法使用python将Pdf文件转换为Docx,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52327434/