linux 上的 java unicode 转换不适用于 mac os x

标签 java linux macos unicode

我正在 Ubuntu Linux 上编写一个 java 应用程序,它读取一个文本文件并根据数据创建一个 xml 文件。一些文本包含弯撇号和引号,我使用以下代码将其转换为直撇号和引号:

dataLine = dataLine.replaceAll( "[\u2018|\u2019]", "\u0027" ).replaceAll( "[\u201C|\u201D]", "\u005c\u0022" );

这工作正常,但是当我将 jar 文件移植到 Mac OSX 机器时,我得到三个问号,我应该在其中得到直撇号和引号。我在 Mac 上创建了一个测试应用程序,使用相同的代码行进行转换,并使用相同的测试文件进行输入,它运行良好。为什么在 Linux 机器上创建的 jar 文件在 Mac 上不能正常工作?我认为 java 应该是跨平台兼容的。

最佳答案

很有可能您一开始没有正确读取文件。您还没有显示您是如何读取文件的,但我猜测是您只是在使用 FileReaderInputStreamReader 而没有指定编码。在这种情况下,将使用默认平台编码 - 如果这不是文件的实际编码,您将无法读取正确的字符。您应该能够在根本不进行任何替换的情况下检测到这一点。

相反,您应该使用 FileInputStream 并将其包装在具有正确编码的 InputStreamReader 中 - 可能是 UTF-8,因为它是 XML。 (您应该能够轻松检查这一点。)

关于linux 上的 java unicode 转换不适用于 mac os x,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19016432/

相关文章:

java - 使用 maven 的 Web 片段

java - 如何将 SHA1 输出转换为十六进制字符串?

macos - 如何使用 Homebrew 软件在 mac 上安装 Solr?

sql - 在哪里可以下载 SQLite 的 Northwind 示例数据库?

linux - 带有 git 和符号链接(symbolic link)的基于组件的 Web 项目目录布局

mysql - 另一个 mysql 服务器在 OS X 上已经运行错误

ios - 跨 SDK 版本的 URLSessionConfiguration 等同性

java - 我可以将 Java 应用程序编译为在 Linux 上运行的单个二进制文件吗?

java - 是否可以在变量访问/写入时停止 Debug模式的执行?

python - PIP 安装无法找到 ffi.h,即使它识别 libffi