java - 需要在读取 AFP 文件并提取内容和元数据方面占据先机

标签 java dms afp

我被分配从事这个特定​​的项目,我们将在其中获取 AFP(高级功能演示)文件,并且我们需要获取文档,即内容和相应的元数据。我一直在研究 AFP(高级功能演示)文件格式,但实际上没有获得任何关于如何继续执行任务的有用资源。

到目前为止我几乎没有得到任何信息,不知道该从哪里开始。我研究了一些开源项目,发现了这个:https://github.com/yan74/afplib

我尝试运行它..但它不适用于我拥有的示例 AFP 文件。

确实需要了解我应该使用哪些资源来完成这个项目。

我需要用 Java 编写代码,并且已经使用了一些具有相同功能的许可软件,例如 PROARCHIVER 和 PAPYRUS。

提前致谢

最佳答案

AFP 是一种简单的格式,它由结构化字段组成,您的第一步是解码它们,下载此:“混合对象文档内容架构引用”阅读前 50 页并编写代码将 afp 拆分为结构化字段,以便创建文件的简单转储。

之后,如果您想提取图像,AFP 世界将其称为 IOCA,因此您需要:Ima​​ge Object Content 架构引用

如果您想提取文本(称为 PTX),您需要:Presentation Text 对象内容架构引用

干得好

关于java - 需要在读取 AFP 文件并提取内容和元数据方面占据先机,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44179117/

相关文章:

java - 如何设置 Eclipse 工作区,为 Android 开发但在 Java 中测试?

基于php的文档管理系统

macos - OSX 上的 bash : How to determine if network file (AFP) is in use?

java - Apache FOP AFP 到 XML 的转换

java - 是否有一种简洁的方法可以使用 Java 将 NOP 记录添加到 AFP 文件中?

java - TinkerPop 图中的深度优先树遍历

java - spring boot - 在 META-INF/spring.factories 中找不到自动配置 - gradle

amazon-web-services - 用于将数据从 ec2 迁移到 rds 的 cloudformation 模板

java - 如何在 Cordova 项目中禁用三星智能手机(Android)的自动完成?