python - Adobe Acrobat DC 和 Python 自动化

标签 python python-3.x python-2.7 adobe

我想通过在 Adob​​e Acrobat Pro DC 中打开 PDF 文件,然后使用该版本中提供的功能将所有数据导出到 Excel 电子表格来自动化某些操作。

有没有办法让我有一个脚本来打开 PDF 文件并将该文件中的所有数据导出到 Excel 工作表中?

有没有办法通过 pywin32 打开 PDF,然后将文件另存为 Excel 或 CSV?

这是我尝试使用的代码,但它不起作用

import win32com.client
import win32com.client.makepy

win32com.client.makepy.GenerateFromTypeLibSpec('Acrobat')
adobe = win32com.client.DispatchEx('AcroExch.App')
avDoc = win32com.client.DispatchEx('AcroExch.AVDoc')
avDoc.Open('Input.pdf', 'C:\\Users\\PDF\\')
pdDoc = avDoc.GetPDDoc()
jObject = pdDoc.GetJSObject()
jObject.SaveAs('Output.xlsx', "com.adobe.acrobat.xlsx")

最佳答案

这是我找到的答案:

import win32com.client, win32com.client.makepy, os, winerror, pandas as pd, errno, re
from win32com.client.dynamic import ERRORS_BAD_CONTEXT

excel_file = "output.xlsx"
output_1 = "output_1.csv"

ERRORS_BAD_CONTEXT.append(winerror.E_NOTIMPL)

src = os.path.abspath('FILE.pdf')

win32com.client.makepy.GenerateFromTypeLibSpec('Acrobat')
adobe = win32com.client.DispatchEx('AcroExch.App')
avDoc = win32com.client.DispatchEx('AcroExch.AVDoc')
avDoc.Open(src, src)
pdDoc = avDoc.GetPDDoc()
jObject = pdDoc.GetJSObject()
jObject.SaveAs(excel_file, "com.adobe.acrobat.xlsx")

关于python - Adobe Acrobat DC 和 Python 自动化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47471739/

相关文章:

python - 如何让 python-docx 处理复杂的脚本?

python-3.x - 无法连接到docker容器内的postgres数据库

Python:如何在类中调用def

python-3.x - 从 Azure 文件存储读取 NetCDF 文件

python - 纪元纳秒到正常时间

python-2.7 - 如何从pdf中提取特定标题下的文本?

python - 在 Python 中将基类动态混合到实例中

python - 如何制作一个抽象的 Haystack SearchIndex 类

python - Pandas 数据帧 : Getting row indices from criteria 1, 按标准 2 排序

python - Python 中是否有内置函数可以更改整数的基数?