Java:使用 PDFBox 将国家字符写入 PDF

标签 java utf-8 internationalization pdfbox

Possible Duplicate:
Using PDFBox to write UTF-8 encoded strings to a PDF

我需要创建带有捷克国家字符的 PDF,并且我正在尝试使用 PDFBox 库来完成此操作。 我从一些教程中复制了以下代码:

public void doIt(String file, String message) throws IOException, COSVisitorException
{
    PDDocument doc = null;
    try
    {
        doc = new PDDocument();
        PDSimpleFont font = PDType1Font.TIMES_ROMAN;

        TextToPDF textToPdf = new TextToPDF();

        textToPdf.setFont(font);
        textToPdf.setFontSize(12);
        doc = textToPdf.createPDFFromText(new StringReader(message));
        doc.save(file);
    }
    finally
    {
        if( doc != null )
        {
            doc.close();
        }
    }
}

现在,我正在调用函数 doIt:

app.doIt("test.pdf", "Skákal pes přes oves, přes zelenou louku.");

这完全有效,但在输出 PDF 中我得到:“þÿSkákal pes pYes oves, pYes zelenou louku。”

我试图找到如何在 PDFBox 中设置 UTF-8 编码,但恕我直言,互联网上没有解决此问题的解决方案。

您有什么想法,如何在输出 PDF 中获得正确的文本吗?

谢谢。

最佳答案

我认为它的 PDType1Font.TIMES_ROMAN 字体不支持捷克国家字符。如果您可以设法获取捷克国家字符.ttf文件,则使用下面的方法获取PDFont,如下所示并使用相同的:

      PDFont font = PDTrueTypeFont.loadTTF( doc, new File( "CheckRepFont.ttf" ) );

这里 CheckRepFont.ttf 是您的字体文件名作为示例。用实际的更新它。

编辑:

  PDStream pdStream  = new PDStream(doc);
  PDSimpleFont font = PDType1Font.TIMES_ROMAN;
  font.setToUnicode(pdStream);

关于Java:使用 PDFBox 将国家字符写入 PDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13274578/

相关文章:

angular - i18n 国际化如何服务或构建多语言

grails - Grails 中的 HTTPBuilder 编码 utf-8

iphone - 文本编辑无法识别编码

internationalization - 我应该使用 ISO 3166 国家代码 (US) 还是文化代码 (en-US)?

java - 如何在使用 Java 转到 Selenium WebDriver 中的另一个页面之前等待一个页面?

php - PHP和MySQL的utf-8编码的字符串问题?

localization - 不适合旅行的图标示例?

java - 在同一 JVM 中运行 Apache MINA 和 Netty

java - 如果包含两个词

java - 运行start-dfs.sh后无法启动namenode(hadoop 2.7.1)