我需要从 xls 文件中提取文本以进行索引。这只是一个索引要求,因此格式、宏表等并不重要,
使用 xlhtml 非常繁重,严重降低了索引能力。
实现这种转化的最佳方式是什么?
最佳答案
我用了提卡http://tika.apache.org/作为守护进程。 现在效果好多了
关于linux - Linux 上的快速 xls 转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12242854/
我需要从 xls 文件中提取文本以进行索引。这只是一个索引要求,因此格式、宏表等并不重要,
使用 xlhtml 非常繁重,严重降低了索引能力。
实现这种转化的最佳方式是什么?
最佳答案
我用了提卡http://tika.apache.org/作为守护进程。 现在效果好多了
关于linux - Linux 上的快速 xls 转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12242854/