xpath - 以编程方式将 Microsoft Teams channel 中的聊天消息导出为 Word 或 pdf,无需管理员角色、权限或权限

标签 xpath web-scraping outlook microsoft-teams microsoft-graph-teams

我正在寻找一种编程方式,将每个 Microsoft Teams channel 的所有聊天消息(文本和图像内容)导出到 Word 或 pdf 文档(任何支持文本和消息的输出介质)。我需要能够做到这一点,而无需向公司全局管理员寻求特定角色的许可。我已经研究了不同的方法,例如 Graph API(azure 应用程序注册)、电子发现以及从隐藏的 Outlook 文件夹中提取此信息。这些方法的共同主题是,我们需要针对导出策略中的特定需求寻求 IT 管理员的许可。

到目前为止,我已经尝试使用 Microsoft Teams 的 Web 应用程序版本并使用网页抓取方法,我已经能够循环浏览每个 channel 中的消息并将其导出到 Word 文档中。我想知道是否有一种更优雅、更好、更不容易出错的方法。

寻找一些建议。

最佳答案

这是一个名义上的解决方案。诚然,它不是很好/完整。但它在某种程度上确实有效。

你激励我清理我的尝试并发布它:

https://github.com/poleguy/selenium_teams

仅在 ubuntu 20.04 上测试。

克隆存储库。

运行 ./setup_python 以获取 conda 环境。

编辑脚本以指定您的网址/登录名。

运行 python ./selenium_teams.py

在弹出的浏览器中手动登录。

转到您想要聊天的聊天室。单击“输入新消息”部分。

按 Enter 键让 python 继续。

这将开始将所有消息保存到文本文件中。

获得文本文件后,将其转换为 pdf 或 word。

(不完整:无法处理图像,运行速度非常慢,可能会耗尽内存......测试很少。)

关于xpath - 以编程方式将 Microsoft Teams channel 中的聊天消息导出为 Word 或 pdf,无需管理员角色、权限或权限,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62587174/

相关文章:

python - 如何在 scrapy spider 的 start_urls 中发送 post 数据

通过 Mechanize 的 Python 表单登录

python - 谷歌搜索给出重定向网址,而不是真实的网址python

c++ - 使用 IProfAdmin 界面 c++ 创建 Outlook MAPI 配置文件

email - Outlook 中电子邮件的简短预览显示图像 src 而不是替代文本

php - 在 PHP 中使用 Outlook Api 创建新事件(使用 POST 方法)

RSelenium:查找与 Xpath 的链接

javascript - 使用 Node.js 和 XPath 对 HTML 页面进行高性能解析

XSLT 应用模板递归性的厄运!

xslt - xsl 转换期间命名空间的匹配