ios - 如何从 iOS 的 epub 格式中提取 txt

标签 ios text epub extract

<分区>


想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post .

已关闭 8 年前

我想从 epub 文件中提取文本以用于我的文本转语音 iOS 应用程序。

如果我可以使用一些库在 iOS 设备中做到这一点,那就太好了,但我也想知道它是否应该在服务器端处理。

有人知道如何做到这一点吗?

例如,Voice Dream 从 epub 格式中提取文本。 http://www.voicedream.com/?page_id=134

最佳答案

ePub 是一个 ZIP 文件,其中包含 XML list ,其中包含摘要(和一些元数据)并引用一组 HTML(请查看规范以了解所有详细信息: http://idpf.org/epub ) 如果您想在设备上执行此操作,您很可能必须编写自己的代码:打开 zip,在 list 中找到您的文本位置,然后删除所有 HTML 标记以获取纯文本。 如果您可以在服务器端执行此操作,则会更容易:您可以使用处理 ePub(和许多其他格式)的 Apache Tika ( http://tika.apache.org/ )。

很难更准确,因为您没有解释如何获取 epub 以及如何选择 epub 的哪一部分将被定位...

关于ios - 如何从 iOS 的 epub 格式中提取 txt,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16185396/

上一篇:ios - UIPicker查看 NSDictionary 中的数据

下一篇:ios - 验证多个文本字段并使屏幕上的其他控件处于非事件状态

相关文章:

ios - 如何在iBooks上打开文件

javascript - 将 Ruby on Rails 与 Epub.js 集成

ios - 添加具有行动画的单元格时,将 tableview 保持在相同的滚动位置

ios - UIBarButtonItem选择到下一个ViewController

ios - Google.com Admob 显示错误的 admob/iAd 中介,正确的方法是什么?

c# - 获取 UI 文本元素的高度不正确 Unity

ios - 固定 header 的问题有时会在 iOS 上消失

python - 使用 Python 将 html 转换为文本

java - 大数据集的短文本聚类 - 用户分析

javascript - 使用 CSS 列在 epub 上工作,关于分页