我收到了一个非常大的 CSV 文件,其中包含我需要导入到 MySQL 数据库的数据。不幸的是,CSV 文件每 50 行数据后就有一个文本页脚,如下所示:
0,,,,,," of 2,401",,,,
10,,,,,," of 2,401",,,,
999,,,,,," of 2,401",,,,
"1,000",,,,,," of 2,401",,,,
"2,396",,,,,," of 2,401",,,,
...etc
正如你所看到的,当数字达到 1,000 时,模式发生变化(他们开始使用双引号将起始页 # 括起来)。这超出了我对 RegEx 的理解。我需要一个正则表达式来识别所有这些行并将其删除。
最佳答案
尝试
(\d+|"(\d+,\d+)+"),+" of (\d+|(\d+,\d+)+)",+(\n|$)
它将匹配以下所有情况:
0,,,,,,"共 2,401",,,,
10,,,,,,"共 2,401",,,,
999,,,,,,”共 2,401”,,,,
“1,000”,,,,,,”共 2,401”,,,,
“2,396”,,,,,,”共 2,401”,,,,
10,,,,,,"共 2,401,000",,,,
“1,999,822”,,,,,,”共 2,401,000”,,,,
关于mysql - 需要正则表达式来查找 "xxxx",,,,, 的 "yyyy",,,, 并删除,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46330472/