google-cloud-vision - Cloud Vision API - PDF OCR

标签 google-cloud-vision

我刚刚测试了 Google Cloud Vision API 以读取图像中的文本(如果存在)。

到目前为止,我安装了 Maven 服务器和 Redis 服务器。我只是按照此页面中的说明进行操作。

https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text

到目前为止,我可以使用 .jpg 文件进行测试,是否可以使用 tiff 文件或 pdf 进行测试?

我正在使用以下命令:

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar     com.google.cloud.vision.samples.text.TextApp ../../data/text/

在文本目录中,我有 jpg 格式的文件。

然后要读取转换后的文件,我不知道该怎么做,只需运行以下命令
java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp

我收到消息,输入要在转换后的文件中搜索的单词或短语。有没有办法查看整个文档的转换?

谢谢!

最佳答案

2016 年,Cloud Vision 不支持 PDF 和 TIFF 格式。

接受的格式是:(取自 doc)

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • 动画 GIF(仅第一帧)
  • BMP
  • WEBP
  • 原始
  • ICO

  • 不过现在都加了。
    jpg 的文档:

    https://cloud.google.com/vision/docs/ocr
    pdf 的文档

    https://cloud.google.com/vision/docs/pdf

    关于google-cloud-vision - Cloud Vision API - PDF OCR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36728347/

    相关文章:

    python - 使用 Google Cloud Vision API 从申请表中提取手写文本

    python - 谷歌云视觉 api 检测到不同数量的标签

    c# - 方法 'ImageAnnotatorClient.Create' 没有重载需要 1 个参数

    android - Google Cloud Vision - 无法在包含 2 列文本的图像上提供良好的 OCR

    ocr - 谷歌云视觉OCR支持条码读取吗?

    android - 在android项目中哪里设置GOOGLE_APPLICATION_CREDENTIALS变量?

    google-cloud-vision - 我可以训练它检测我的脸吗?或任何其他人面对

    android - 发现多个文件的操作系统独立路径为 'META-INF/INDEX.LIST' (Android/Gradle)

    google-cloud-vision - Google Cloud Vision API 上的请求问题失败,出现 INVALID_ARGUMENT

    python - Google Vision API 标签检测不起作用错误 : 'str' object has no attribute before request