我面临着来自客户端的 CSV 文件,这些文件可能包含数十万行。是否有 DSL(或广受欢迎的 Java 或 Python 库)可以有效地对这些信息进行计算,应用各种规则来发出警告和错误(当然,用户可配置)?
最佳答案
您能想象一个 DSL 可以做到这一点吗?规则将如何?
几个月前我研究过这样的问题 - 结果发现它比开始时看起来更难。
第一步很明显 - 所有 行被解析并放置到 特殊的数据结构,这样我就可以 与他们一起工作;那些与 丢失的字段被丢弃。
每一行都有其当前的“策略” 属性(property),以及可能的 list 策略(默认操作,忽略, 强制、覆盖等)
起初所有的行都有他们的“策略” 属性设置为“默认”。
行处理器检查操作是 可能,创建错误列表 和警告。
- 处理后 并分析结果的每一行 给出了引起问题的列表 用户可以选择的替代策略 选择;
因此,如果有任何问题,用户可以更改行策略(或只是简单地使用“忽略”)并返回到第 4 步。
那么,我很好奇这样的 DSL 会在哪一步起作用?
关于java - 是否有用于数据完整性验证的标准 DSL?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6347374/