mysql - 需要正则表达式来查找 "xxxx",,,,, 的 "yyyy",,,, 并删除

我收到了一个非常大的 CSV 文件，其中包含我需要导入到 MySQL 数据库的数据。不幸的是，CSV 文件每 50 行数据后就有一个文本页脚，如下所示:

0,,,,,," of 2,401",,,,
10,,,,,," of 2,401",,,,
999,,,,,," of 2,401",,,,
"1,000",,,,,," of 2,401",,,,
"2,396",,,,,," of 2,401",,,,

...etc

正如你所看到的，当数字达到 1,000 时，模式发生变化(他们开始使用双引号将起始页 # 括起来)。这超出了我对 RegEx 的理解。我需要一个正则表达式来识别所有这些行并将其删除。

最佳答案

尝试

    (\d+|"(\d+,\d+)+"),+" of (\d+|(\d+,\d+)+)",+(\n|$)

它将匹配以下所有情况:

0,,,,,,"共 2,401",,,,

10,,,,,,"共 2,401",,,,

999,,,,,,”共 2,401”,,,,

“1,000”,,,,,,”共 2,401”,,,,

“2,396”,,,,,,”共 2,401”,,,,

10,,,,,,"共 2,401,000",,,,

“1,999,822”,,,,,,”共 2,401,000”,,,,

关于mysql - 需要正则表达式来查找 "xxxx",,,,, 的 "yyyy",,,, 并删除，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46330472/

相关文章：

python - 按大写字母拆分字符串但忽略 AAA Python Regex