我知道 Apache Tika 是一个文本提取器。它可以从 doc、pdf、ppt 和许多其他文件格式中提取文本。现在我在 ios 中需要这个功能,所以我想知道是否有 Apache Tika for ios 的替代品?
如果ios没有这样的库,你可以告诉我可以提取指定文件格式的工具。
提前谢谢你。
最佳答案
libopc用于从 docx、xlsx、pptx 中提取文本。
Antiword对于旧的 MS 格式。
You can extract strings from a PDF using CoreGraphics also , 和 使用 PDFiPhone也是。
如果您还想从 HTML 文档中提取文本,请查看 NSXMLParser .
关于ios - iOS 的 Apache Tika 替代品,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12280454/