大家好!
我正在尝试将 Apache tika 与 Python 结合使用,但出现此错误:
jnius.JavaException: JVM exception occurred: ä (The system cannot find the file specified)
你能帮我一下吗?我使用 Windows 10(x64),我猜这个问题与 python 和 Java 之间的编码或类似的东西有关。提前谢谢你。
我使用的代码是:
import os
os.environ['CLASSPATH'] = "tika/tika-app-1.16.jar"
from jnius import autoclass
Tika = autoclass('org.apache.tika.Tika')
Metadata = autoclass('org.apache.tika.metadata.Metadata')
FileInputStream = autoclass('java.io.FileInputStream')
tika = Tika()
meta = Metadata()
file_path = FileInputStream("./content/2.xlsx")
text = tika.parseToString(file_path, meta)
print(text)
最佳答案
我知道已经晚了,但我遇到了完全相同的问题。
这是由 unicode 字符串未从 Python 正确转换为 Java 引起的,可以通过创建 Java String
对象来解决:
import os
os.environ['CLASSPATH'] = "tika/tika-app-1.16.jar"
from jnius import autoclass
Tika = autoclass('org.apache.tika.Tika')
Metadata = autoclass('org.apache.tika.metadata.Metadata')
FileInputStream = autoclass('java.io.FileInputStream')
String = jnius.autoclass("java.lang.String")
tika = Tika()
meta = Metadata()
file_path = FileInputStream(String("./content/2.xlsx"))
text = tika.parseToString(file_path, meta)
print(text)
关于java - jnius.JavaException : JVM exception occurred: . ..(系统找不到指定的文件),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46772117/