我正在考虑使用正则表达式来限制城市名称(全局)中的标点符号。什么是具有相当包容性的白名单?
我在想:
(space)
. period
- hyphen
' apostrophe
也在想逗号或斜线,但我没有任何例子。还有其他人吗?
最佳答案
This是城市名称中最具包容性的标点白名单。当有人在键盘上输入撇号时,可能不会使用 ASCII 撇号代码点。
如果您已经识别出提交文本的编码,您应该能够查看它是否属于标点符号块:
/\p{InGeneral_Punctuation}/
如果您将自己限制在拉丁语扩展中,请使用这些:
/\p{InLatin_Extended-A}/
另外,问问自己:有人在我的城市名称中加入一个有趣的角色会产生什么后果?如果我排除太多,这是否比某人无法输入正确地址的后果更糟糕?
关于regex - 城市字段需要哪些标点符号?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22031146/