我想通过在 Adobe Acrobat Pro DC 中打开 PDF 文件,然后使用该版本中提供的功能将所有数据导出到 Excel 电子表格来自动化某些操作。
有没有办法让我有一个脚本来打开 PDF 文件并将该文件中的所有数据导出到 Excel 工作表中?
有没有办法通过 pywin32 打开 PDF,然后将文件另存为 Excel 或 CSV?
这是我尝试使用的代码,但它不起作用
import win32com.client
import win32com.client.makepy
win32com.client.makepy.GenerateFromTypeLibSpec('Acrobat')
adobe = win32com.client.DispatchEx('AcroExch.App')
avDoc = win32com.client.DispatchEx('AcroExch.AVDoc')
avDoc.Open('Input.pdf', 'C:\\Users\\PDF\\')
pdDoc = avDoc.GetPDDoc()
jObject = pdDoc.GetJSObject()
jObject.SaveAs('Output.xlsx', "com.adobe.acrobat.xlsx")
最佳答案
这是我找到的答案:
import win32com.client, win32com.client.makepy, os, winerror, pandas as pd, errno, re
from win32com.client.dynamic import ERRORS_BAD_CONTEXT
excel_file = "output.xlsx"
output_1 = "output_1.csv"
ERRORS_BAD_CONTEXT.append(winerror.E_NOTIMPL)
src = os.path.abspath('FILE.pdf')
win32com.client.makepy.GenerateFromTypeLibSpec('Acrobat')
adobe = win32com.client.DispatchEx('AcroExch.App')
avDoc = win32com.client.DispatchEx('AcroExch.AVDoc')
avDoc.Open(src, src)
pdDoc = avDoc.GetPDDoc()
jObject = pdDoc.GetJSObject()
jObject.SaveAs(excel_file, "com.adobe.acrobat.xlsx")
关于python - Adobe Acrobat DC 和 Python 自动化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47471739/