java - 使用 Apache POI 处理 docx 文件中的复选框

标签 java checkbox apache-poi docx

你能帮我一下吗? 我需要通过 Apache POI 填写 MS Word docx 模板中的复选框。复选框已通过“开发人员”选项卡->“控件”->“复选框”插入,并位于段落->“w:sdt”标记内(不在段落内->运行)。

我尝试过 paragraph.getCTP().getFldSimpleList() 但它返回 0 个字段。

那么还有其他方法来访问复选框吗?

XML部分:

<w:p w:rsidR="00C81ACC" w:rsidRDefault="00C81ACC" w:rsidP="004658AE">
    <w:pPr>
        <w:spacing w:line="276" w:lineRule="auto"/>
        <w:ind w:left="383" w:hanging="383"/>
        <w:rPr>
            <w:rFonts w:ascii="Arial" w:hAnsi="Arial" w:cs="Arial"/>
            <w:sz w:val="18"/>
            <w:szCs w:val="18"/>
        </w:rPr>
    </w:pPr>
    <w:sdt>
        <w:sdtPr>
            <w:rPr>
                <w:rFonts w:ascii="Arial" w:hAnsi="Arial" w:cs="Arial"/>
                <w:sz w:val="18"/>
                <w:szCs w:val="18"/>
            </w:rPr>
            <w:id w:val="615721754"/>
            <w14:checkbox>
                <w14:checked w14:val="0"/>
                <w14:checkedState w14:val="2612" w14:font="MS Gothic"/>
                <w14:uncheckedState w14:val="2610" w14:font="MS Gothic"/>
            </w14:checkbox>
        </w:sdtPr>
        <w:sdtContent>
            <w:r>
                <w:rPr>
                    <w:rFonts w:ascii="MS Gothic" w:eastAsia="MS Gothic" w:hAnsi="MS Gothic" w:cs="Arial" w:hint="eastAsia"/>
                    <w:sz w:val="18"/>
                    <w:szCs w:val="18"/>
                </w:rPr>
                <w:t>☐</w:t>
            </w:r>
        </w:sdtContent>
    </w:sdt>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="Arial" w:hAnsi="Arial" w:cs="Arial"/>
            <w:sz w:val="18"/>
            <w:szCs w:val="18"/>
        </w:rPr>
        <w:t xml:space="preserve"> Pass</w:t>
    </w:r>
</w:p>

最佳答案

到目前为止,apache poi 尚不支持此功能。由于它使用来自 w14 命名空间的扩展 XML,甚至底层的 ooxml-schema 类也不支持这一点。这些架构类是根据 2007 年发布的 Office Open XMLXML 架构生成的。来自 w14 的扩展 XML code> 命名空间稍后出现,并且不是 Office Open XML 的一部分。

因此,如果想要支持这一点,那么就需要在非常低的 XML 级别上工作。但对于像复选框这样简单的东西,可以在此处作为示例进行显示。

以下代码包含类W14Checkbox的工作草案。这提供了一个静态方法来检查给定的 CTSdtRun 是否包含 w14:checkbox。如果是这种情况,则可以从该 CTSdtRun 创建一个 W14Checkbox 对象。然后,该对象提供 getCheckedsetChecked 方法。

请注意,在 setChecked 中,不仅需要设置 boolean 值 w14:checkbox/w14:checked,还需要设置 CTSdtContentRun< 的相应文本值 需要设置。这可以是 Unicode 字符“BALLOT BOX”(U+2610)(表示未选中)或 Unicode 字符“BALLOT BOX WITH CHECK”(U+2612)(表示选中)。

完整示例:

import java.io.*;
import org.apache.poi.xwpf.usermodel.*;
import org.openxmlformats.schemas.wordprocessingml.x2006.main.*;

import org.apache.xmlbeans.*;
import javax.xml.namespace.QName;

public class WordFillCheckBox {

 public static void main(String[] args) throws Exception {

  XWPFDocument document = new XWPFDocument(new FileInputStream("source.docx"));

  for (XWPFParagraph paragraph : document.getParagraphs()) { //go through all paragraphs
   for (CTSdtRun sdtRun : paragraph.getCTP().getSdtList()) {
    if (W14Checkbox.isW14Checkbox(sdtRun)) {
     W14Checkbox w14Checkbox = new W14Checkbox(sdtRun);
     System.out.println(w14Checkbox.getChecked());
     if (w14Checkbox.getChecked()) w14Checkbox.setChecked(false); else w14Checkbox.setChecked(true);
     System.out.println(w14Checkbox.getChecked());
    }
   }
  }

  FileOutputStream out = new FileOutputStream("result.docx");
  document.write(out);
  out.close();
  document.close();

 }

 static class W14Checkbox {
  CTSdtRun sdtRun = null;
  CTSdtContentRun sdtContentRun = null;
  XmlObject w14CheckboxChecked = null;

  W14Checkbox(CTSdtRun sdtRun) {
   this.sdtRun = sdtRun;
   this.sdtContentRun = sdtRun.getSdtContent();
   String declareNameSpaces = "declare namespace w14='http://schemas.microsoft.com/office/word/2010/wordml'";
   XmlObject[] selectedObjects = sdtRun.getSdtPr().selectPath(declareNameSpaces + ".//w14:checkbox/w14:checked");
   if (selectedObjects.length > 0) {  
    this.w14CheckboxChecked  = selectedObjects[0];
   }
  }
  CTSdtContentRun getContent() {
   return this.sdtContentRun;
  }
  XmlObject getW14CheckboxChecked() {
   return this.w14CheckboxChecked;
  }
  boolean getChecked() {
   XmlCursor cursor = this.w14CheckboxChecked.newCursor();
   String val = cursor.getAttributeText(new QName("http://schemas.microsoft.com/office/word/2010/wordml", "val", "w14"));
   return "1".equals(val) || "true".equals(val);
  }
  void setChecked(boolean checked) {
   XmlCursor cursor = this.w14CheckboxChecked.newCursor();
   String val = (checked)?"1":"0";
   cursor.setAttributeText(new QName("http://schemas.microsoft.com/office/word/2010/wordml", "val", "w14"), val);
   cursor.dispose();
   CTText t = this.sdtContentRun.getRArray(0).getTArray(0);
   String content = (checked)?"\u2612":"\u2610";
   t.setStringValue(content);
  }

  static boolean isW14Checkbox(CTSdtRun sdtRun) {
   CTSdtPr sdtPr = sdtRun.getSdtPr();
   String declareNameSpaces = "declare namespace w14='http://schemas.microsoft.com/office/word/2010/wordml'";
   XmlObject[] selectedObjects = sdtPr.selectPath(declareNameSpaces + ".//w14:checkbox");
   if (selectedObjects.length > 0) return true;  
   return false;
  }
 }
}

注意:这只是一个工作草案,需要进一步开发才能投入生产使用。

关于java - 使用 Apache POI 处理 docx 文件中的复选框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58728103/

相关文章:

java - POI 将单元格背景设置为自定义颜色

java - 如何从具体子类中的重写方法访问通过抽象类中的构造函数实例化的对象的属性?

java - Java 运行时环境检测到 fatal error - Microsoft SQL Server

java - 向 mongoDB 嵌入式文档添加新字段

javascript - jQuery - 获取每个复选框内的下一个元素

jquery - 如何使用jquery启用一个复选框的多个输入文本字段?

java - 如何使用 Apache POI 在 1 或 2 张 Excel 文件中查找特定字符串?

java - 如何读取pdf文件的书签链接?

javascript - 如何在 HTML 中实现 "select all"复选框?

java - 替换文本后如何保持文档文件内容相同的格式