是否可以使用 Tika 从 URL 中提取文本?任何链接将不胜感激。还是 TIKA 只能用于 pdf、word 和任何其他媒体文档?
最佳答案
检查 documentation - 是的你可以。
例子
java -jar tika-app-0.9.jar -t http://stackoverflow.com/questions/6656849/extract-the-text-from-url-using-tika
将显示此页面上的文本。
关于java - 使用 TIKA 从 URL 中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6656849/