python - 来自图像 : OCR-Python 的验证码中断或文本阅读器

标签 python python-2.7 opencv ocr captcha

我有一个典型的验证码图像,其中仅包含数字。

例如。 enter image description here

我想从此图像中提取78614

我使用 OCR-Python 尝试了一些库和代码。但它返回0。

示例代码-1

from captcha_solver import CaptchaSolver

solver = CaptchaSolver('browser')
with open('captcha.png', 'rb') as inp:
raw_data = inp.read()
print(solver.solve_captcha(raw_data))

示例代码-2

from PIL import Image

def p(img, letter):
    A = img.load()
    B = letter.load()
    mx = 1000000
    max_x = 0
    x = 0
    for x in range(img.size[0] - letter.size[0]):
        _sum = 0
        for i in range(letter.size[0]):
            for j in range(letter.size[1]):
                _sum = _sum + abs(A[x+i, j][0] - B[i, j][0])
        if _sum < mx :
            mx = _sum
            max_x = x
    return mx, max_x


def ocr(im, threshold=200, alphabet="0123456789abcdef"):
    img = Image.open(im)
    img = img.convert("RGB")
    box = (8, 8, 58, 18)
    img = img.crop(box)
    pixdata = img.load()

    letters = Image.open(im)
    ledata = letters.load()

    # Clean the background noise, if color != white, then set to black.
    for y in range(img.size[1]):
        for x in range(img.size[0]):
            if (pixdata[x, y][0] > threshold) \
                    and (pixdata[x, y][1] > threshold) \
                    and (pixdata[x, y][2] > threshold):

                pixdata[x, y] = (255, 255, 255, 255)
            else:
                pixdata[x, y] = (0, 0, 0, 255)

    counter = 0;
    old_x = -1;

    letterlist = []

    for x in range(letters.size[0]):
        black = True
        for y in range(letters.size[1]):
            if ledata[x, y][0] <> 0 :
                black = False
                break
        if black :
            if True :
                box = (old_x + 1, 0, x, 10)
                letter = letters.crop(box)
                t = p(img, letter);
                print counter, x, t
                letterlist.append((t[0], alphabet[counter], t[1]))
            old_x = x
            counter += 1

    box = (old_x + 1, 0, 140, 10)
    letter = letters.crop(box)
    t = p(img, letter)
    letterlist.append((t[0], alphabet[counter], t[1]))

    t = sorted(letterlist)
    t = t[0:5]  # 5-letter captcha

    final = sorted(t, key=lambda e: e[2])
    answer = ""
    for l in final:
        answer = answer + l[1]
    return answer

print(ocr('captcha.png'))

有人有机会从这种典型的验证码中获取/提取文本吗?

最佳答案

您可以使用机器学习(神经网络)模型来解决验证码,它几乎总是优于免费 OCR 或任何其他方法。

这是一个很好的起点:https://medium.com/@ageitgey/how-to-break-a-captcha-system-in-15-minutes-with-machine-learning-dbebb035a710

关于python - 来自图像 : OCR-Python 的验证码中断或文本阅读器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47963234/

相关文章:

python - 在 python 中设置 python 路径

c++ - 如何使用单应性围绕图像中心旋转图像?

Python-OpenCV --F 函数错误--找不到正确的目录

python - 如何将 python 字典转换为所需的格式

python - Pandas 数据帧 to_sql 数据长度超过 65536 个字符

python - pandas读取没有标题的txt文件

python-2.7 - Python Mechanize 登录网站未找到表单

python - 我该如何放置字典 {key : value} in it's designated key in a dictionary so that it is {key: {key: value}} after counting value

arrays - 尽管网上有很多例子,但我无法在 python 中获得等效的 MATLAB repmat

c++ - 积分修改值