ibm-watson - 如何使用脚本 bash 中的文档转换服务转换多个文档?

标签 ibm-watson document-conversion

如何使用 Document Conversion 转换多个文档服务。

我想使用 convert_document 转换 50-100 个 MS Word 和 PDF 文档接口(interface)方法?

例如,您可以像这样提供多个 .pdf 或 *.doc 文件吗?

curl -u "username":"password" -X POST
-F "config={\"conversion_target\":\"ANSWER_UNITS\"};type=application/json" 
-F "file=@\*.doc;type=application/msword"
 "https://gateway.watsonplatform.net/document-conversion-experimental/api/v1/convert_document"

不幸的是,这给出了一个错误:curl: (26) 无法打开文件“*.doc”。 我也尝试过“file=@file1.doc,file2.doc,file3.doc”,但这也会出错。

最佳答案

该服务一次只接受一个文件,但您可以多次调用它。

#!/bin/bash
USERNAME="<service-username>"
PASSWORD="<service-password>"
URL="https://gateway.watsonplatform.net/document-conversion-experimental/api/v1/convert_document"
DIRECTORY="/path/to/documents"
for doc in *.doc
do
  echo "Converting - $doc"
  curl -u "$USERNAME:$PASSWORD" \
  -F 'config={"conversion_target":"ANSWER_UNITS"};type=application/json' \
  -F "file=@$doc;type=application/pdf" "$URL"
done

文档转换 documentationAPI Reference .

关于ibm-watson - 如何使用脚本 bash 中的文档转换服务转换多个文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33557966/

相关文章:

java - 将 PDF 文件转换为单个 HTML 文件

solr - 替代 Tika/PDFBox 用于在 Solr 中解析 PDF(1.4 之后的任何版本)

html - A.nnotate.com背后使用了什么技术?

java - IBM Watson Speech to Text 仅使用 Java SDK 返回第一个单词

ibm-watson - 如何检查我的 R&R 集群之一消耗了多少空间?

javascript - NPM ELIFECYCLE 错误 - 使用 node server.js 命令

java - 列表数组输出和 IBM 的 Watson Java SDK

ibm-watson - IBM Watson Conversation 服务中节点的多个答案