.net - 用于屏幕阅读的OCR引擎

标签 .net text screenshot ocr imaging

是否有用于识别屏幕捕获图像中的文本而非扫描文本的OCR引擎?我有一个项目,我需要在应用程序中检索和识别文本,到目前为止,我尝试过的所有OCR引擎都无法与屏幕截图保持一致。

理想情况下,引擎应该在色彩和背景噪音下都可以正常工作,尽管如果没有类似的选择,我可以做出一些让步。

它需要与.NET兼容;用.NET编写或具有.NET可调用的API。

最佳答案

我发现Tesseract OCR对于一个开源项目来说非常可靠。我发现它甚至可以读取和解码简单的验证码,例如Megaupload的验证码。我认为稍作调整就可以很好地工作。

唯一的麻烦是它只接受未压缩的TIFF图像,这很烦人。

编辑:Philip Daubmeier已经找到了.NET集成,但是下面是将位图转换为未压缩TIFF的代码。

private void ConvertBitmapToTIF(Bitmap convert)
{
    ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
    System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
    System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;

    EncoderParameters parms = new EncoderParameters(2);
    EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
    EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
    parms.Param[0] = param0;
    parms.Param[1] = param1;

    convert.Save("output.tif", codecInfo, parms);
}

这将保存到文件,但是Bitmap.Save方法也可以写入流。

关于.net - 用于屏幕阅读的OCR引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3345027/

相关文章:

c# - 指定的版本字符串不符合要求的格式 - major[.minor[.build[.revision]]]

.net - Image.FromStream : Parameter not valid

python - 返回与正则表达式匹配的字符串

three.js - webGL的WebGL单帧 "screenshot"

ios - 我不明白为什么 Apple 会拒绝我的 ios 应用程序截图?

.net - 如何判断字节数组是否已被压缩?

regex - 寻找 awk 命令以在行尾附加文件名

vim - 使用 for 循环在 Vim 中写行

screenshot - 在工作站锁定时捕获屏幕截图

c# - 如何将调试器附加到 System.Diagnostics.Process?