java - 文档格式转换为文本

标签 java


我正在寻找的是一个文本转换库,可以转换word文件,pdfs的格式

但在文本转换后保留其格式结构,表格结构丢失并且文档变得扭曲

例如

姓名、电子邮件、电话号码在表格中并形成一行

转换后,它们会出现在单独的行中,例如
姓名
电子邮件地址
电话号码

我希望这些以姓名、电子邮件、电话号码的形式出现

目前我正在使用 apache tikka,它使用 apache poi 我怎样才能实现这一目标

我可以逐个元素解析 msword 文档吗?如果可以,请分享一个示例

问候

拉贾特

最佳答案

您可以使用 APACHE POI 读取 .doc .dox 的内容和pdf PDF READ

然后您可以将该内容写入文本文件

关于java - 文档格式转换为文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11394360/

相关文章:

Java如何用长整数表示十进制数

java - 使用不同的标准对树集中的元素进行排序和区分

java - Android Sqlite - 无法在 onCreate 之外调用数据库处理程序

java - 计数词素 - 字符串越界异常

java - FileWriter 在文件末尾写入额外的空值

Java 不从 list 定义的类路径加载类

java - 为什么我可以使用 US Ascii Locale 来处理大写/小写的德语变音符号?

java - 是否可以为 JLabel 中的 ImageIcon 制作选择工具?

java - HtmlUnitDriver 是如何渲染页面的?

java - Spring Data 网页分页 "page"参数不起作用