Java 邮件发件人地址删除非 ASCII 字符

标签 java email unicode jakarta-mail

MimeMessage mm;
mm.setFrom(new InternetAddress("\"Test\u0161\u0160\" <test@example.net>"));

部署到 WebLogic 的 Web 应用程序中的上述代码会损坏非 ascii 字符(它们是“š”和“Š”),但仅限于某些服务器环境。发送邮件到SMTP服务器的网络抓图显示: (消息头部分)

   0x0060:  0a46 726f 6d3a 2022 5465 7374 2061 2060  .From:."Test.a.`
   0x0070:  203c 7465 7374 4065 7861 6d70 6c65 2e6e  .<test@example.n
   0x0080:  6574 3e0d 0a                             et>..

因此,代码\u0161 被“转换”为 20 61,而\u0160 被“转换”为 20 60。

从哪里开始寻找?我怀疑某些环境设置,尽管这并不重要,因为 Java 内部使用 Unicode,并且所有数据在离开 JVM 之前都是正确的。另外,与 SMTP 服务器通信时应使用一些已建立的约定来对文本进行编码。

实际字符串是从属性文件中读取的,其定义如下:

mailFrom="Test\u0161\u0160" <test@example.net>

调试日志输出证明其读取正确。

我添加了更多调试输出(在调用 mm.setFrom(fromAddress) 后运行):

logger.info("set:{}, get:{}",  fromAddress, mm.getFrom()[0].toString());

在“良好”系统(Sun Java 1.6.0_45、tomcat 6.0.44)上,它打印:

set:"TestšŠ" <test@example.net>, get:=?UTF-8?Q?Test=C5=A1=C5=A0?= <test@example.net>

在“坏”系统(WebLogic 10.3.5、JRockit 1.6.0_26)上,它打印:

set:"TestšŠ" <test@example.net>, get:"TestšŠ" <test@example.net>

看来它忘记了正确编码 Unicode 字符。 JRE 中的错误?

更多信息:

事实证明,WL 使用 javax.mail_1.1.0.0_1-4-1.jar,而 tomcat 使用 geronimo-javamail_1.4_spec-1.7.1.jar

最佳答案

采用单个字符串的 InternetAddress 构造函数期望该字符串采用正确的 MIME 格式,这意味着所有 ASCII 编码都包含任何非 ASCII 字符。

如果您使用采用单独的电子邮件地址和人名字符串的 InternetAddress 构造函数,它将为您对个人名中的非 ASCII 字符进行编码。

不幸的是,我发现您正在以这种非 MIME 格式将地址存储在属性文件中。如果您无法更改属性文件中数据的格式,则最好的选择可能是解析数据以提取不同的字段,然后使用两字符串 InternetAddress 构造函数:

    InternetAddress ia =
        new InternetAddress("\"Test\u0161\u0160\" <test@example.net>");
    InternetAddress ia2 =
        new InternetAddress(ia.getAddress(), ia.getPersonal());
    System.out.println(ia2);

给出:

=?UTF-8?Q?Test=C5=A1=C5=A0?= <test@example.net>

这之所以有效,是因为 MIME 字符串 InternetAddress 构造函数的当前实现不会拒绝非法的非 ASCII 字符。

关于Java 邮件发件人地址删除非 ASCII 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31859901/

相关文章:

java - 如何在字符串文字中添加补充 Unicode 字符?

java - 从十六进制获取 Unicode

Java:从 .NET 构造函数转换

java - 如何在日志文件中打印堆栈跟踪

java - NetBeans Matisse - 从另一个类访问 jframe 组件

Django password_reset 表单邮箱验证

javascript - 如何使用 css 样式安全地加载电子邮件内容

java - 无法在 fragment 内显示对话框?

Ruby:如何从标准输入解析电子邮件 mime

javascript - 如何将包含表情符号的字符串拆分为数组?