mysql - 需要正则表达式来查找 "xxxx",,,,, 的 "yyyy",,,, 并删除

标签 mysql regex csv text

我收到了一个非常大的 CSV 文件,其中包含我需要导入到 MySQL 数据库的数据。不幸的是,CSV 文件每 50 行数据后就有一个文本页脚,如下所示:

0,,,,,," of 2,401",,,,
10,,,,,," of 2,401",,,,
999,,,,,," of 2,401",,,,
"1,000",,,,,," of 2,401",,,,
"2,396",,,,,," of 2,401",,,,

...etc

正如你所看到的,当数字达到 1,000 时,模式发生变化(他们开始使用双引号将起始页 # 括起来)。这超出了我对 RegEx 的理解。我需要一个正则表达式来识别所有这些行并将其删除。

最佳答案

尝试

    (\d+|"(\d+,\d+)+"),+" of (\d+|(\d+,\d+)+)",+(\n|$)

它将匹配以下所有情况:

0,,,,,,"共 2,401",,,,

10,,,,,,"共 2,401",,,,

999,,,,,,”共 2,401”,,,,

“1,000”,,,,,,”共 2,401”,,,,

“2,396”,,,,,,”共 2,401”,,,,

10,,,,,,"共 2,401,000",,,,

“1,999,822”,,,,,,”共 2,401,000”,,,,

关于mysql - 需要正则表达式来查找 "xxxx",,,,, 的 "yyyy",,,, 并删除,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46330472/

相关文章:

python - 按大写字母拆分字符串但忽略 AAA Python Regex

regex - perl6 正则表达式 : match all punctuations except . 和“

php - 如何在 mysql/php 中将日期和时间匹配在一起

java - JPA查询异常

python正则表达式仅检索一组

python - 如果每行包含不同数量的字段(数量很大),如何正确读取 csv 文件?

r - 如何获得R中字符串中的前10个单词?

php - 获取sql查询的开始/结束时间

c++ - 我应该使用 shared_ptr 还是返回 unique_ptr.get()?

mysql - 仅当所选日期等于或大于数据中的日期时,日期之间的查询才会返回结果