是否有用于识别屏幕捕获图像中的文本而非扫描文本的OCR引擎?我有一个项目,我需要在应用程序中检索和识别文本,到目前为止,我尝试过的所有OCR引擎都无法与屏幕截图保持一致。
理想情况下,引擎应该在色彩和背景噪音下都可以正常工作,尽管如果没有类似的选择,我可以做出一些让步。
它需要与.NET兼容;用.NET编写或具有.NET可调用的API。
最佳答案
我发现Tesseract OCR对于一个开源项目来说非常可靠。我发现它甚至可以读取和解码简单的验证码,例如Megaupload的验证码。我认为稍作调整就可以很好地工作。
唯一的麻烦是它只接受未压缩的TIFF图像,这很烦人。
编辑:Philip Daubmeier已经找到了.NET集成,但是下面是将位图转换为未压缩TIFF的代码。
private void ConvertBitmapToTIF(Bitmap convert)
{
ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;
EncoderParameters parms = new EncoderParameters(2);
EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
parms.Param[0] = param0;
parms.Param[1] = param1;
convert.Save("output.tif", codecInfo, parms);
}
这将保存到文件,但是Bitmap.Save方法也可以写入流。
关于.net - 用于屏幕阅读的OCR引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3345027/