我正在寻找的是一个文本转换库,可以转换word文件,pdfs的格式
但在文本转换后保留其格式结构,表格结构丢失并且文档变得扭曲
例如
姓名、电子邮件、电话号码在表格中并形成一行
转换后,它们会出现在单独的行中,例如
姓名
电子邮件地址
电话号码
我希望这些以姓名、电子邮件、电话号码的形式出现
目前我正在使用 apache tikka,它使用 apache poi 我怎样才能实现这一目标
我可以逐个元素解析 msword 文档吗?如果可以,请分享一个示例
问候
拉贾特
最佳答案
您可以使用 APACHE POI 读取 .doc .dox 的内容和pdf PDF READ
然后您可以将该内容写入文本文件
关于java - 文档格式转换为文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11394360/