我组装了一个快速的 WinForm/嵌入式 IE 浏览器控件,每天早上登录我们公司的银行网站并抓取/导出所需的存款信息(该银行是一家小型区域银行)。由于我们有几十个从同一个主账户提取的“伪账户”,因此检索实际上需要 10-15 分钟。
无论如何,唯一的问题是我们的商业银行帐户需要 RSA 安全 token ( http://www.rsa.com/node.aspx?id=1156)--if 你不熟悉,它是一个小设备,每 15(?) 秒显示一个随机的 6 位数字,所以我有在开始之前提示输入此值。这是基于网站基于登录的安全模型的顶部,因此即使您创建了一个无法执行任何操作的只读帐户,您仍然必须输入 RSA 号码。我们有 5 个这些代币适用于公司中的不同人员。
从我们的角度来看,这是令人讨厌的安全问题。我开玩笑说使用网络摄像头对 key 扣上的数字进行 OCR 识别,这样他们就不必输入它——主要是为了在早上有人到达之前完成抓取/导出。好吧,他们问我是否真的能做到。
现在我问你,你认为从相机生成的 JPEG 图像中可靠地 OCR 这些数字需要多努力(多少小时)?我已经知道我可以轻松获取 JPEG。我认为您会尝试登录 3 次,因此确实需要达到 99% 的准确率。我可以在休息时间处理这个问题,但他们不希望我花超过几个小时的时间,所以我想尽可能多地利用现有代码。这是一个 7 段显示器(如闹钟),因此它并不完全是 OCR 包用来查看的文本。
此外——显示屏侧面有一个倒计时器;通常,当它下降到 1 格时,您会等到下一个数字出现,然后从 5 格重新开始(就像手机上的信号强度)。因此,这也需要是 OCRd,但它不是文本。
无论如何,当我输入此内容时,我思考得越多,我就越不相信我能真正做到这一点,所以也许我应该在业余时间研究它?
最佳答案
至少有两个有据可查的开源七段 OCR 程序,专门为自动读取 RSA SecurID key 的任务而设计:
ssocr:Seven Segment Optical Character Recognition 。它具有其他 OCR 和图像处理软件的链接。
LCDOCR.pm: OCR Build Your Own with Perl modules - May 2007 - Linux Magazine Online
在 Symbian 手机上运行的更多通用软件现在可能会开放:
- Reading LCD/LED Displays with a Camera Cell Phone - 第二届 IEEE 嵌入式计算机视觉研讨会 (ECVW '06)
帮助视障人士的最新工作似乎是Real-Time Detection and Reading of LED/LCD Displays for Visually Impaired Persons - Proc IEEE Workshop Appl Comput Vis。 2011年
关于key - OCR RSA key 卡(安全 token ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1983879/