我有一个 Web 应用程序,它是用 PHP 编写的,结合了 Javascript 和 JQuery,将用作我公司的库存管理系统 (IMS)。我希望能够创建一个基于用户输入值的正则表达式。
这背后的想法是,大多数制造商的序列号架构、字符长度以及字母与数字值的混合对于某个零件来说是独一无二的。因此,当一个部件被添加到 IMS 并且第一个序列号被扫描到系统中时,我希望构建一个 Regex 语句并将其保存到与该部件类型对应的数据库表中。以后扫描序列号时,应自动选择零件作为零件类型,因为它与制造商的序列号模式相匹配。我知道这种方法可能并不总是适用于单个部件,因此我什至可以返回与模式匹配的部件列表,而不是用户需要在目录中查找它。
我的问题的基础是,查看代码中的函数是否能够破译用户给出的值以创建 Regex 表达式的最佳起点是什么?我不是在要求一个完整的功能,而是一个如何看待我的情况和目标的起点,这样我才能理解从哪里开始。我挠头够久了,开始无数次编写函数,只是为了删除整个 block ,因为我知道我正在走向灾难。
代码中的任何事情都是可能的——这可行吗?
编辑 - 添加示例值
DVD-RW(光驱)
- 1613518L121
- 1613509L121
- 1613519L121
VGA输出卡
- 0324311071068
- 0324311071134
COM 扩展卡
- 608131234
- 608131237
硬盘
- WMAYUJ753738
- WMAYUJ072099
- WMAYUJ683739
- WMAYUJ844900
如您所见,某些值将只是特定长度字符的数字。其他人将在开头有字母字符,后跟一系列数字。其他人可能有相互穿插的字母/数字字符。在大多数情况下,一个简单的字母/数字规则长度将适用于识别我们的商品 list 中的单一零件类型。然而,在多个表达式与一个值匹配的情况下,我可以简单地让应用程序显示与正则表达式匹配的两个或更多产品的列表,并提示用户选择正确的部分。总的来说,这将节省在 WMS 数据库中选择产品类型的时间和错误。
感谢您的评论。我知道我不是在问一个只有一个答案的问题。我正在寻找一个起点,以了解如何最好地单步执行字符串并吐出与该值匹配的相应 Regex 语句。
最佳答案
正如@Pete 所说,我认为您为自己设定的目标过于雄心勃勃。一些想法,可能从您的特定需求中过度概括。
我认为您想扫描像 1-56592-487-8 这样的序列号并推断正则表达式/\d-\d{5}-\d{3}-\d/匹配部分这种类型来自给定的制造商。 (这恰好是我的“Java in a Nutshell”副本的 ISBN-10。ISBN 不是序列号,而是与我一起使用。)但是您无法从少数示例中推断出制造商使用的模式。也许第一个字符位置是十六进制数字 (0-F)。也许最后一个字符是校验和,可以是数字或 X(如 ISBN)。也许有一个后缀,并不总是存在,表示植物。因此,随着零件的新实例出现,您会发现自己为同一制造商/零件类型构建了许多模式。
你也会遇到相反的问题。小部件制造商使用正则表达式/[A-Z]{3}\d{7}/,声波 Screwdriver 制造商使用相同的模式。
也就是说,你能做的最好的事情是这样的:
for each character in the scanned serial number
if it is a capital letter
add [A-Z] to the regular expression
else if it is a digit
add \d to the regular expression
else
add the character itself to the regular expression, escaped as necessary
end for
collapse multiple occurrences with the {,} interval qualifier
Vehicle Identification Numbers 的规则也可能是鼓舞人心的。考虑一下如何根据一些示例推断 VIN 的规则。
关于php - 基于输入的正则表达式创建,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10703094/