我有一个关于环境变量的非常基本的问题。 Tika python library我正在尝试使用的内容提到了以下内容:
TIKA_SERVER_ENDPOINT: set to the host (local or remote) for the running Tika server jar
我从 here 下载了服务器 jar
并使用 java -jar jarname.jar 运行它 我试图将环境变量设置为本地主机,但我不确定具体如何执行此操作。我尝试了以下方法:
TIKA_SERVER_ENDPOINT=http://localhost:9998
但这只是导致了 404
,并显示网络错误 (dns_unresolved_hostname),您的主机无法由 DNS 解析
,
我还运行了ps aux | grep java
检查 jar
文件是否正在运行,并发现它在端口 9998
上运行......即:
java -cp /tmp/tika-server.jar org.apache.tika.server.TikaServerCLi -- port 9998 --host localhost
我的环境变量到底做错了什么?我对搞乱 jar
文件和环境变量还很陌生,所以任何帮助将不胜感激,谢谢!
最佳答案
我遇到了类似的问题,只需从 Apache downloads 下载最新的服务器 jar 即可解决该问题。页面,然后从 bash 在我的本地计算机上启动服务器:
java -jar tika-server -x.x.jar --port xxxx
这启动了 tika 服务器。然后我可以通过以下方式在 python 中访问 tika:
from tika import parser
parser.from_file('path_to_file')
关于java - 如何将环境变量设置为localhost?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44688478/