ios - iOS 的 Apache Tika 替代品

标签 ios apache-tika

我知道 Apache Tika 是一个文本提取器。它可以从 doc、pdf、ppt 和许多其他文件格式中提取文本。现在我在 ios 中需要这个功能,所以我想知道是否有 Apache Tika for ios 的替代品?

如果ios没有这样的库,你可以告诉我可以提取指定文件格式的工具。

提前谢谢你。

最佳答案

libopc用于从 docx、xlsx、pptx 中提取文本。

Antiword对于旧的 MS 格式。

You can extract strings from a PDF using CoreGraphics also , 和 使用 PDFiPhone也是。

如果您还想从 HTML 文档中提取文本,请查看 NSXMLParser .

关于ios - iOS 的 Apache Tika 替代品,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12280454/

相关文章:

ios - 当 iOS 缩小图像时,它会剪辑/像素化它吗?

python - 解析 PDF 文档中的表格

java - 使用 Tika 进行递归爬网的 Storm Crawler 配置

java - 如何使用 apache Tika 将 xml 文件转换为 HashMap

ios - 在 Swift 中点击按钮时如何防止 uibutton alpha 变为零?

ios - Swift 中的 HealthKit 身份验证

ios - 计算可以包含在具有特定大小的容器中的文本

使用bs4的Python html解析div数据

java - 如何让 Apache Tika 在 .java 和 .xml(等)文件中查找文本

ios - 从哪里获得适用于 iOS 5 的 CoreTelephony.framework