我面临以下问题。
使用 etl 配置文件,我从 Oracle
DB 表加载一些数据,然后将这些数据导出到 CSV
文件。
但是,当字段包含双引号 (") 时,该字符会重复。
我将用一个简单的例子来解释:
表NAMES中的字段DESCRIPTION包含以下内容:
这是我名字的“描述”
当我使用 CSV 驱动程序导出此表的内容时,我在 CSV 中看到以下数据:
这是我名字的“描述”
ETL 配置:
<connection id="out-names" driver="csv" url="names.csv">
quote=
encoding=UTF-8
trim=true
null_string=
</connection>
...
<query connection-id="db">
SELECT NAME,DESCRIPTION FROM NAMES;
<script connection-id="out-names">
$1;$2
</script>
</query>
对此有什么帮助吗?
提前致谢
最佳答案
这是绝对正确的,2 x 双引号在 CSV 术语中意味着一个双引号,因此这是正确的...
123,"This is a string",456,13-Feb-2013,"This is ""Another"" String"
第二个字符串中包含“转义”双引号。
关于java - 为什么我在 Scriptella 中的输出 CSV 文件上得到双引号?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14852603/