c# - 如何访问作者姓名和其他 docx 元数据

标签 c# metadata docx

我想使用 C# 获取文件的元数据,例如 docx。 在下面的屏幕截图中,您可以看到文件的作者和其他元数据。

Example

如何将此元数据写入控制台?

最佳答案

DOCX 中的 Word 文件打包为 zip 文件。元数据位于该 zip 文件内的 XML 文件中。 作为一种非常简单的思考方式,您需要通过 C# 以编程方式执行以下操作:

  1. 将 DOCX 文件解压缩到其文件夹结构中。
  2. 打开位于该结构的 docProps 文件夹中的 core.xml 文件。
  3. 提取并存储您要查找的相关 XML 元素,例如 标题、主题或其他任何内容。
  4. 使用 Console.WriteLine() 写入这些元素。

Image Showing Structure and XML file

Info on Office Open XML format

关于c# - 如何访问作者姓名和其他 docx 元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37116448/

相关文章:

java - 如何高效读取元数据文件?

ms-office - 尝试转换时unoconv无法正常工作。引发错误:无法连接或启动自己的监听器。堕胎

asp.net - DB2 OS/390 BLOB 是否支持 .docx 文件

c# - 如何将参数传递给 DataContext?

c# - LINQ:从列表中选择项目(Group By/Select/Sum & Max!)

c# - PRISM + MEF -- 如何指定使用哪个导出?

C# MongoDB 驱动程序 copydb 管理员登录

wpf - 使用WPF Imaging类-在不读取整个文件的情况下获取图像尺寸

mysql - 存储有关数值字段的元数据

c# - DocX 克隆表并在索引处插入