java - 如何添加自定义 MIME 类型并覆盖默认扩展模式?

标签 java mime apache-tika

我正在尝试向 Apache Tika 添加自定义 mime 类型。

我在 org.apache.tika.mime 中有以下 custom-mimetypes.xml 文档:

<?xml version="1.0" encoding="UTF-8"?>
<mime-info>
    <mime-type type="text/stringtemplategroup">
        <glob pattern="*.stg"/>
    </mime-type>
    <mime-type type="text/stringtemplate">
        <glob pattern="*.st"/>
    </mime-type>
</mime-info>

我收到关于 Conflicting extension pattern .st 的错误:

Caused by: org.apache.tika.mime.MimeTypeException: Conflicting extension pattern: .st
    at org.apache.tika.mime.MimeTypesReader.startElement(MimeTypesReader.java:166)
    at org.apache.xerces.parsers.AbstractSAXParser.startElement(Unknown Source)

如何覆盖 *.st 扩展的默认条目并让它使用我自己的?

最佳答案

看来你是 need to add具有优先级的 magic 标签

<mime-type type="text/stringtemplate">
    <magic priority="50">
        <!-- some match pattern -->
        <!-- <match value="[some characters]" type="string" offset="0" /> -->
    </magic>
    <glob pattern="*.st"/>
</mime-type>

关于java - 如何添加自定义 MIME 类型并覆盖默认扩展模式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15016500/

相关文章:

php - 从 PHP 发送的电子邮件中显示的 HTML 问题

Java Web 服务仅在本地主机上响应,而不是通过主机名 (Apache Tika)

java - 如何使用 Spring Batch 在作业中动态添加步骤

java - 关于 JVM 规范中引用大小的混淆

java - Android Firestore 复合查询

java - 使用 Tika 将元数据提取为 RDF

java - 使用 Tika 从大型 pdf 中提取文本

java - 哪里可以下载GWT4NB?

Java邮件 : distinguish between each message in an email thread

http - FrameTooLongException Mime HTTP header 大小计算