java - 在 Java 中用数据库中的更正替换部分字符串

标签 java ocr

我正在用 Java 编写 OCR 程序(使用 Tesseract 从标签生成文本),我希望它能够识别输出中的常见错误,例如 VV 而不是 W 和 NIR 而不是 MR,它们存储在数据库。因此,例如,如果它有一个像“VVEIN, MIR Adam”这样的字符串,它应该更改为“WEIN, MR Adam”。

检查字符串是否与任何常见错误文本匹配的最有效方法是什么?目前我能想到的唯一方法是将字符串通过一系列正则表达式传递给每个已知错误,但我希望有一种更有效的方法。谢谢:)

最佳答案

String 传递给多个正则表达式将在每次替换子字符串时创建一个新的 String,因为 Java 中的字符串是不可变的。请改用 StringBuilder

关于java - 在 Java 中用数据库中的更正替换部分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13232876/

相关文章:

java - 如何在 Spring Boot 应用程序中实现长轮询 REST 端点?

java - 如何确定对整数数组进行合并排序的可能运行时间?

java - apache axis 2 网络服务的用户身份验证

image-processing - 图像处理以提高 tesseract OCR 准确性

python - 无法使用openCV从图像中提取每个文本

java - 在spring中获取属性对象

java - 如何使用 EWS JAVA api 搜索重定向的电子邮件?

java - 查找函数 'TessBaseAPICreate' : libtesseract. 时出错: undefined symbol :TessBaseAPICreate

java - 创建 TessBaseAPI 时出现 UnsatisfiedLinkError : no jnilept in java. library.path

python - 在 Python 中临时保存文件?