我正在寻找一种在 Java 应用程序中读取 Microsoft Works (.wps) 和 One Note (.one) 文件的方法。实际上,我所关心的只是从这些文件中提取可读文本,以便为它们编制索引。
我已经成功地使用 Apache POI 和 Tika 库从大多数其他 Micrososft 格式中提取文本,但这两个仍然难以捉摸。
谢谢, 弗兰克
最佳答案
据我所知,.one(One Note)文件格式是专有的,但有一个 COM API: http://msdn.microsoft.com/en-us/library/ms788684(office.12).aspx#Office2007OneNoteWhatsNew_OneNote2007COMAPI您可以编写一些东西来将数据转换为另一种语言并调用它吗?
一些谷歌搜索揭示了可以转换 wps 文件的程序,但我没有看到任何 java api 或任何文档。这可能是可行的。不确定您要处理多少文件,但您可能需要使用另一个应用程序来转换文件,或者让您的用户先运行另一个应用程序来转换它?
关于java - 从 Java 读取 Microsoft Works 和/或 One Note 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4567055/