pdf - 索引 pdf 文档

标签 pdf solr full-text-indexing apache-tika solr-cell

索引 pdf 文档的最佳方式是什么?我应该通过将 pdf 文档转换为 txt 来索引它们还是有更好的方法来索引 pdf 文件?

最佳答案

假设您正在谈论 solr:请参阅 ExtractingRequestHandler .

关于pdf - 索引 pdf 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3739215/

相关文章:

Solr 过滤器查询和提升

php - MySQL,全文搜索以显示最后更新的行

MySQL FULLTEXT 查询问题

ios - UIImage 数组到 PDF 转换内存泄漏

vb.net - 在没有实际 Excel 的情况下使用 Microsoft.Office.Interop.Excel?

java - SOLR配置问题

java - 线程 "main"java.lang.NoClassDefFoundError : org/apache/commons/codec/DecoderException 中的异常

php - 缓慢的 MySQL 全文搜索

r - 使用R从PDF文件中提取字符字体大小

pdf - iText生成带汉字的PDF,但不显示