我正在使用OpenCSV读取 CSV 文件。查看文档,我没有看到有关如何处理格式错误的数据的指南。
我有一个 CSV 文件。具有所有预期的功能:每个字段都用逗号分隔,并且每个字段都用引号引起来,以防其中一个值可能包含逗号。但是,每一行(标题除外)都缺少前导引号。这是一个例子
"Header 1","Header2"
value1","value2"
value1","value2"
由于引号的排列方式,CSV 解析器最终跳过了每隔一行,这显然会导致问题。
我认为这是一个错误,因为第一列缺少引号,因为我知道数据应该是什么样子,但就 CSV 规范而言,这可能被认为是有效的?如果是这样,我想我必须自己构建额外的检查,以确保我没有丢失任何行,尽管它包含有效的 CSV 数据。
最佳答案
While there are various specifications and implementations for the CSV format, there is no formal specification in existence, which allows for a wide variety of interpretations of CSV files.
简单地说,格式错误?不,非正式?偶数this文章(在 RFC 中链接)提到行可以与引号和不带引号混合匹配。
关于csv - 缺少前导引号的 CSV 数据是否被视为格式错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48410759/