我正在用 Java 编写 OCR 程序(使用 Tesseract 从标签生成文本),我希望它能够识别输出中的常见错误,例如 VV 而不是 W 和 NIR 而不是 MR,它们存储在数据库。因此,例如,如果它有一个像“VVEIN, MIR Adam”这样的字符串,它应该更改为“WEIN, MR Adam”。
检查字符串是否与任何常见错误文本匹配的最有效方法是什么?目前我能想到的唯一方法是将字符串通过一系列正则表达式传递给每个已知错误,但我希望有一种更有效的方法。谢谢:)
最佳答案
将 String
传递给多个正则表达式将在每次替换子字符串时创建一个新的 String
,因为 Java 中的字符串是不可变的。请改用 StringBuilder
。
关于java - 在 Java 中用数据库中的更正替换部分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13232876/