python - 使用python从word文档的第一页提取文本

标签 python ms-word

我正在尝试寻找可以从 word 文档的第一页中提取文本的 Python 脚本。我发现可以处理段落但不能处理页面的函数,这不是我需要的。

最佳答案

问题是,docx 格式的页面是纯虚拟的。 MS Word 根据文本大小和其他参数自行决定放置页面限制器的位置和时间。

当用户明确设置分页符时会更容易一些,因为可以像描述的那样找到它们 there ,例如。

作为解决方法,您可以只计算每页的行数并自行修剪,但据我所知,没有“简单”的方法可以用 1 行代码完成所有事情。

关于python - 使用python从word文档的第一页提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52499767/

相关文章:

python - 如何在 Python 中将 Word 文档转换为非常简单的 html?

Python MySQL(MariaDB) 查询 FROM_UNIXTIME 我得到计数​​而不是结果(显示行 0 - 0 )

python - 使用python查找数组中具有相同起始字符的对象

Python 使用给定的 sortKey 函数对对象/字典列表进行排序

templates - 在 Word 2013 中添加自定义 "template group"

excel - 用剪贴板中的图片替换电子邮件中的文本

python - Matplotlib 添加默认水印

python - 使用自己的字母字符串解密密文时遇到问题(python)

python - 使用 win32com.client api 打开 MS Word 2016 并访问 formFileds 时如何解决 AttributeError?

vba - Excel VBA 用于在 Word 中创建编号列表