Azure 机器学习无法将 PDF 作为 Web 服务的输入

标签 azure azure-machine-learning-service

我在 azure ML 上部署了一个随机森林实验,我尝试根据文档包含的单词对文档进行评分。文档为 PDF 格式。当我将此实验部署为 Web 服务时,它不允许我输入 PDF。有没有办法将 PDF 输入到网络服务?

最佳答案

以下是几种可能的方法:

  • 在调用 Web 服务之前序列化 PDF 的字节数据。在实验内的执行 R/Python 脚本模块中,反序列化数据并使用第三方包(例如适用于 Python 的 pickle 和 pdfminer)从 PDF 中提取文本。
  • 提供 PDF 的 URI 作为 Web 服务输入。使用执行 R/Python 脚本模块从该 URI 检索 PDF 文件,并使用第三方包(例如用于 Python 的 urllib.requests 和 pdfminer)提取文本。

关于Azure 机器学习无法将 PDF 作为 Web 服务的输入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42063940/

相关文章:

javascript - 如何创建类似 `context.Provider`/`context.Consumer` 的结构来在机器人应用程序中传递值?

.net - CloudTableClient 与.NET Core 不兼容?

azure - 设备如何接收 IoT 中心中的直接方法?

azure - 如何访问已部署的 AppService Web 应用程序中的文件?

azure - 在 Windows 10 上安装 Azure 机器学习工作台失败

Azure 机器学习工作室 : Create DATASET via REST API

azure - 无法将经过训练的模型部署到现有的 AKS 计算目标

azure - 如何防止恶意带宽吸血鬼请求滥用 Azure CDN 带宽?

python - 无法读取 Azure Jupyter Notebook 中的 ".parquet"文件(Python 2 和 3)

azure - 如何配置YOLOv8 yaml文件来访问Azure上的blob存储数据集?