java - 文件上传文件名编码

标签 java spring azure encoding utf-8

自从我开始反对这个问题以来已经有一段时间了:多部分/混合内容。

  @RequestPart(name="view") CoolView,
  @RequestPart(name="files") Part [] files

也使用 spring 的(这并不重要,因为 CommonsMultipartResolver 也失败了):

  StandardServletMultipartResolver

现在的问题是,当上传一些名称超出 US_ASCII 字符的文件时,服务器会将它们转换为奇怪的东西。奇怪的是,我的意思是它将它们转换为 ISO_8859_1,而且我想我已经在任何可以想象到的地方设置了 UTF-8 编码。

  • -Dfile.encoding=UTF-8
  • LANG="en_US.UTF-8"LC_ALL="en_US.UTF-8"
  • URIEncoding = UTF-8(在 server.xml tomcat 中)
  • CharacterEncodingFilter 是第一个被选取的过滤器
  • 有趣的是,只有当我在 azure linux 机器上尝试时才会发生这种情况,本地一切都很好。

    例如,我使用curl发送一些要上传的文件:

      curl -X POST -F "files=@Définition fonctionnalités.pdf" 
    

    在 Controller 中,我试图查看实际从 Content-Disposition 文件名中捕获的名称。

      Définition fonctionnalités.pdf 
    

    此时我会接受任何建议。谢谢你

    最佳答案

    根据您的描述,字符串Définition fonctionnalités.pdf可以通过以下代码转换为正确的字符串。

    String str = new String("Définition fonctionnalités.pdf".getBytes("ISO-8859-1"), "UTF-8");
    System.out.println(str); // Output is "Définition fonctionnalités.pdf"
    

    根据我的经验,如果您的开发环境是在 Windows 上,这似乎是由 Java 源文件的字符编码格式引起的。

    对于这种情况,解决方案是使用支持 UTF-8 编码的文本编辑器在编译之前确定 Java 源文件的编码格式。

    如果您使用的是 Eclipse IDE,您可以为您的项目设置编码。步骤如下。

    1. 选择您的项目,右键单击选择属性或直接输入组合键Alt+Enter
    2. Resource选项卡中设置当前项目的文本文件编码,请参见下文。

    enter image description here

    注意:如果您为现有项目设置了文本文件编码,则可能需要手动修复这些不正确的编码字符串。

    希望有帮助。


    更新:请尝试进行以下一些配置。

    1. 配置 server.xml 文件进行连接,以使用 UTF-8 启用 URIEncoding

      <Connector port="80" maxHttpHeaderSize="8192" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" enableLookups="false" redirectPort="8443" acceptCount="100" connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="UTF-8"/> 
      
    2. 为您的 Java Web 应用程序添加全局过滤器。

    为您的项目配置 web.xml 文件

    <filter>
        <filter-name>charsetFilter</filter-name>
        <filter-class>com.XXXX.xxxx.CharsetFilter</filter-class>
        <init-param>
            <param-name>requestEncoding</param-name>
           <param-value>UTF-8</param-value>
        </init-param>
    </filter>
    <filter-mapping>
        <filter-name>charsetFilter</filter-name>
        <url-pattern>/*</url-pattern>
    </filter-mapping>
    

    创建过滤器类CharsetFilter

    public class CharsetFilter implements Filter {
        private String encoding;
        private Logger log = Logger.getLogger(this.getClass());
    
        public void init(FilterConfig config) throws ServletException {
            encoding = config.getInitParameter("requestEncoding");
            if (encoding == null) encoding = "UTF-8";
        }
    
        public void doFilter(ServletRequest request, ServletResponse response, FilterChain next)
                throws IOException, ServletException {
            HttpServletRequest req = (HttpServletRequest) request;
            request.setCharacterEncoding(encoding);
            next.doFilter(request, response);
        }
    
        public void destroy() {
        }
    }
    
  • 接收上传的文件时,将ISO-8859-1的文件名字符串的字节转换为UTF-8字符串,正如我所说如上所述。

    String originFN = ....;
    String fileName = new String(originFN.getBytes("ISO-8859-1"), "UTF-8");
    
  • 关于java - 文件上传文件名编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37723633/

    相关文章:

    java - 查找最大嵌套列表数

    java - Spring Data MongoDB 审计不适用于嵌入式文档

    spring - 使用 Spock 在 Spring 中测试 Mock Bean

    Azure B2C 与 Azure 外部身份

    azure - Terraform 列出对象映射的每次迭代的键中的所有项目

    java - 线性布局不可见/重叠

    java - 查找 JFrame 处于最大化状态时的还原边界

    java - Eclipse 不断崩溃

    java - 没有xml的spring+hibernate映射类

    azure - 如何用fiddler测试QnA知识库