我有一个如下所示的 csv:
"[u'Title, Volume.']",[u'19780620']
[u'Title 2.'],[u'19910607']
"[u'Catalogue.']",[u'19910429']
我想要一个如下所示的 csv:
'Title, Volume.','19786020'
'Title 2.','199110607'
'Catalogue.','19910429'
我更喜欢通过 Mac 终端使用 sed + regex 来完成此操作,但我想我也可以使用 python。我尝试过各种正则表达式,这最接近解决至少开始的字符问题:
sed 's/[\"\[u]//g' file.csv
但它会删除所有“u”字符——而不仅仅是开头的字符。如何编写一个正则表达式来达到我想要的结果?
最佳答案
我最终运行了三个单独的 sed 命令,因为我不确定如何将它们串在一起,但最终还是做到了。
sed -ie 's/"//g' file.csv
sed -ie 's/\[[u]//g' file.csv
sed -ie 's/\]//g' file.csv
欢迎任何更优雅的解决方案!
关于python - 如何删除 csv 中的 unicode 标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40893117/