我有一个正则表达式来验证用户电子邮件地址。
/^(|(([A-Za-z0-9]+_+)|([A-Za-z0-9]+\-+)|([A-Za-z0-9]+\.+)|([A-Za-z0-9]+\++))*[A-Za-z0-9]+@((\w+\-+)|(\w+\.))*\w{1,63}\.[a-zA-Z]{2,})$/i"
在事件记录的帮助下,我想从数据库中获取电子邮件地址与此正则表达式不匹配的所有用户。我尝试了以下 scope
来实现所需的结果,但我得到的只是 ActiveRecord::Relation
。
scope :not_match_email_regex, :conditions => ["NOT email REGEXP ?'", /^(|(([A-Za-z0-9]+_+)|([A-Za-z0-9]+\-+)|([A-Za-z0-9]+\.+)|([A-Za-z0-9]+\++))*[A-Za-z0-9]+@((\w+\-+)|(\w+\.))*\w{1,63}\.[a-zA-Z]{2,})$/"]
这给了我以下查询:
SELECT `users`.* FROM `users` WHERE (email REGEXP '--- !ruby/regexp /^(|(([A-Za-z0-9]+_+)|([A-Za-z0-9]+\\-+)|([A-Za-z0-9]+\\.+)|([A-Za-z0-9]+\\++))*[A-Za-z0-9]+@((\\w+\\-+)|(\\w+\\.))*\\w{1,63}\\.[a-zA-Z]{2,})$/\n...\n')
我还尝试通过以下方式定义此范围
,并获得相同的结果:
scope :not_match_email_regex, :conditions => ["email REGEXP '(|(([A-Za-z0-9]+_+)|([A-Za-z0-9]+\-+)|([A-Za-z0-9]+\.+)|([A-Za-z0-9]+\++))*[A-Za-z0-9]+@((\w+\-+)|(\w+\.))*\w{1,63}\.[a-zA-Z]{2,})'"]
它生成的查询是:
SELECT `users`.* FROM `users` WHERE (email REGEXP '(|(([A-Za-z0-9]+_+)|([A-Za-z0-9]+-+)|([A-Za-z0-9]+.+)|([A-Za-z0-9]+++))*[A-Za-z0-9]+@((w+-+)|(w+.))*w{1,63}.[a-zA-Z]{2,})')
如何获取与给定正则表达式匹配或不匹配的所有记录?
最佳答案
编辑 12-11-30 部分根据 @innocent_rifle 的评论进行小修正
此处建议的正则表达式试图进行与原始问题中相同的匹配
1. 在我的解决方案中,当我第一次编写它时,我忘记了你必须转义 \
在字符串中,因为我直接在 MySQL 中进行测试。当讨论正则表达式时,在字符串中使用正则表达式会让人感到困惑,所以我将使用这种形式,例如/dot\./.source
(在 Ruby 中)将给出 "dot\\."
.
2. REGEXP in MySQL (5.6 手册,在 5.0.67 中测试)正在使用“字符串中的 C 转义语法”,因此 WHERE email REGEXP '\.'
仍然与 WHERE email REGEXP '.'
相同,查找字符 "."
您必须使用WHERE email REGEXP '\\.'
,要实现这一点,您必须使用代码 .where([ 'email REGEXP ?', "\\\\."])
。使用 .where([ 'email REGEXP ?', /\\./.source ])
更具可读性(MySQL 需要 2 次转义)。但是,我更喜欢使用 .where([ 'email REGEXP ?', /[.]/.source ])
,那么我就不用担心你需要多少次转义了。
3.你不需要逃避"-"
在正则表达式中,而不是在 []
中使用它时只要该字符是第一个或最后一个。
我发现一些错误:这是第一个正则表达式-或“|”在你的表达式中,它应该作为查询中的字符串,或者使用我更喜欢的 Regexp#source 。我认为最后还有一句额外的引言。 除此之外,您真的确定正则表达式有效吗?如果您在控制台中尝试字符串?
还要注意,您不会在数据库中捕获带有 NULL 的电子邮件,在这种情况下,您必须添加 (<your existing expr in parentheses>) OR IS NULL
我的 MySQL 版本中的正则表达式语法。
我还测试了@Olaf Dietsche在他的建议中写的内容,似乎不需要,但无论如何强烈建议遵循标准语法( NOT (expr REGEXP pat)
或 expr NOT REGEXP pat
)。
我已经做了一些检查,这些事情必须改变:使用 [A-Za-z0-9_]
而不是\w
,和\+
无效,您必须使用 \\+
( "\\\\+"
如果是字符串),使用 [+]
更容易(在正则表达式或字符串中)。
它导致以下MySQL中的REGEXP
'^(([A-Za-z0-9]+_+)|([A-Za-z0-9]+-+)|([A-Za-z0-9]+[.]+)|([A-Za-z0-9]+[+]+))*[A-Za-z0-9]+@(([A-Za-z0-9]+-+)|([A-Za-z0-9]+[.]))*[A-Za-z0-9]{1,63}[.][a-zA-Z]{2,}$'
小改动建议
我不完全理解您的正则表达式,因此这只是更改您的正则表达式,而不会更改它将找到的内容。
首先:按照上面的描述更改整个字符串
然后改变
(([A-Za-z0-9]+_+)|([A-Za-z0-9]+-+)|([A-Za-z0-9]+[.]+)|([A-Za-z0-9]+[+]+))*
至
([A-Za-z0-9]+[-+_.]+)*
和
@(([A-Za-z0-9]+-+)|([A-Za-z0-9]+[.]))*
至
@([A-Za-z]+[-.]+)*
最终代码(如果您愿意,请更改为 ..., :conditions => ...
语法)。 我试图让它找到与 @innocent_rifle 的评论中相同的字符串,只添加 "_"
在 @
右侧的表达式中
.where([ 'NOT (email REGEXP ?)', /^([A-Za-z0-9]+[-+_.]+)*[A-Za-z0-9]+@([A-Za-z0-9]+[-._]+)*[A-Za-z0-9_]{1,63}[.][A-Za-z]{2,}$/.source ])
关于mysql - 如何通过正则表达式从mysql数据库中选择记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13529937/