java - 如何在Tomcat中设置请求编码?

标签 java jsp tomcat servlets character-encoding

我的 Java webapp 有问题。

这是 index.jsp 中的代码:

<%@page contentType="text/html" pageEncoding="UTF-8" %>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
   "http://www.w3.org/TR/html4/loose.dtd">

<% request.setCharacterEncoding("UTF-8");
response.setCharacterEncoding("UTF-8");
%>

<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <title>JSP Page</title>
    </head>
    <body>
        <h1>Hello World!</h1>

        <form action="index.jsp" method="get">
            <input type="text" name="q"/>
        </form>

        Res: <%= request.getParameter("q") %>
    </body>
</html>

当我对请求进行wireshark 时,我的浏览器会发送此 header :

GET /kjd/index.jsp?q=%C3%A9 HTTP/1.1\r\n
...
Accept-Charset: UTF-8,*\r\n

Tomcat 服务器返回给我这个:

Content-Type: text/html;charset=UTF-8\r\n

但如果我在表单中发送“é”(UTF-8 中的 %C3%A9),则会显示“é”。

我的理解是浏览器发送一个用 UTF-8 编码的“é”(%C3%A9)。

但服务器将此解释为 ISO-8859-1。所以 %C3 被解码为 Ã 和 %A9 被解码为 ©,然后发回以 UTF-8 编码的响应。

在代码中,请求应该使用 UTF-8 解码:

request.setCharacterEncoding("UTF-8");

但是,如果我发送这个网址:

http://localhost:8080/kjd/index.jsp?q=%E9

“%E9”使用 ISO-8859-1 解码并显示“é”。

为什么这不起作用?为什么使用 ISO-8859-1 对请求进行解码?

我已经在 Tomcat 6 和 7 以及 Windows 和 Ubuntu 上尝试过。

最佳答案

request.setCharacterEncoding("UTF-8");只设置请求 body 的编码(用于 POST 请求),而不设置请求 URI 的编码(用于 GET 请求)。

您需要设置URIEncoding归属于 UTF-8<Connector> Tomcat 的 /conf/server.xml 的元素让 Tomcat 将请求 URI(和查询字符串)解析为 UTF-8。这确实默认为 ISO-8859-1。另见Tomcat HTTP Connector Documentation .

<Connector ... URIEncoding="UTF-8">

或确保使用与正文相同的编码来解析 URI1:

<Connector ... useBodyEncodingForURI="true">

另见:


1 来自 Tomcat's documentation (强调我的):

This setting is present for compatibility with Tomcat 4.1.x, where the encoding specified in the contentType, or explicitly set using Request.setCharacterEncoding method was also used for the parameters from the URL. The default value is false.


请删除您的 JSP 中的那些 scriptletrequest.setCharacterEncoding("UTF-8");在错误的时刻被调用。每当您正确使用 Servlet 来处理请求时,都为时已晚。您宁愿使用 filter为了这。 response.setCharacterEncoding("UTF-8");部分已由 pageEncoding="UTF-8" 隐式完成在 JSP 的顶部。

我也是strongly recommend替换老式的<%= request.getParameter("q") %> scriptlet 来自 EL ${param.q} , 或使用 JSTL XML 转义 ${fn:escapeXml(param.q)}防止XSS attacks .

关于java - 如何在Tomcat中设置请求编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6876697/

相关文章:

jsp - 如何使用客户端 JSP/Servlet 在另一台计算机上部署 session Bean

javascript - 如何在客户端单页应用程序中管理服务器用户 session

java - Struts2 标签 : Fielderrors tag

tomcat - 定制Tomcat时: A ServletContext is required to configure default servlet handling

java - 在 servlet 调用中未发现合适的驱动程序异常

java - 构建树中的 spring-security-core 版本冲突问题

java - Spring Data Redis - 存储日期时出现问题

java - 我怎样才能使这段代码更有效率?

java - AvroMultipleInputs-添加多个路径时出现问题

tomcat - 如何在aws中激活/钝化docker容器