我被分配从事这个特定的项目,我们将在其中获取 AFP(高级功能演示)文件,并且我们需要获取文档,即内容和相应的元数据。我一直在研究 AFP(高级功能演示)文件格式,但实际上没有获得任何关于如何继续执行任务的有用资源。
到目前为止我几乎没有得到任何信息,不知道该从哪里开始。我研究了一些开源项目,发现了这个:https://github.com/yan74/afplib
我尝试运行它..但它不适用于我拥有的示例 AFP 文件。
确实需要了解我应该使用哪些资源来完成这个项目。
我需要用 Java 编写代码,并且已经使用了一些具有相同功能的许可软件,例如 PROARCHIVER 和 PAPYRUS。
提前致谢
最佳答案
AFP 是一种简单的格式,它由结构化字段组成,您的第一步是解码它们,下载此:“混合对象文档内容架构引用”阅读前 50 页并编写代码将 afp 拆分为结构化字段,以便创建文件的简单转储。
之后,如果您想提取图像,AFP 世界将其称为 IOCA,因此您需要:Image Object Content 架构引用
如果您想提取文本(称为 PTX),您需要:Presentation Text 对象内容架构引用
干得好
关于java - 需要在读取 AFP 文件并提取内容和元数据方面占据先机,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44179117/