我必须将几千份物理文件数字化,并将它们分配到各种类别,以用于显示它们的 Web 应用程序。
我是否应该为每份文件生成条形码以唯一标识它们?
如果是这样,如何避免扫描图像中出现条形码?
还有其他解决此问题的建议吗?
最佳答案
是的,我每天都在处理这些东西,条形码绝对是我的不二之选。
我建议从 2D bardode 开始,例如 DataMatrix 或 PDF417:
当您最终需要开始向条形码中添加额外数据时(我相信一旦您看到它可以为您做些什么,您就会开始这样做)时,您不会遇到客户提示他们的阻力不喜欢“丑陋”的新格式。
您可以在其中存储任何您想要的数据,而不必担心可用空间或合法字符。
内置冗余对于处理各种打印机上的打印然后将它们扫描回来非常有用。
在我们的条形码中,我们使用标准的键值对结构,因此无论哪个系统生成或读取条形码,它始终具有所需的数据。这比拥有文档 ID 和关联的查找表要好得多,也比固定长度的条形码要好得多。
例如
CLIENTID=123442 CAMPAIGN=WINTER09
有些系统可能不关心 Campaign,但每个系统都知道 ClientID 是什么。
我建议您不要担心条形码出现在扫描图像中 - 您的客户会很快习惯它,并且它可以使文档保持活力和可用。例如,如果您将文档通过电子邮件发送到某个地方,然后他们将其寄回,您仍然可以识别它并再次进行匹配。条形码将成为文档中最重要的部分。
确保条形码足够大,可以在 200DPI 下扫描并且仍然可用。
关于web-applications - 条形码是唯一标识需要为 Web 应用程序数字化的物理文档的最佳方式吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2641885/