python - 将第一个单词和参数与可选参数(带引号或不带引号)匹配

标签 python regex

所有,我正在尝试解析具有以下特征的用户指令(存储为单行字符串):

  1. 第一个单词是命令 - 不允许有空格,但可以有前导或尾随空格,具体取决于用户的纪律程度
  2. 命令后面的可选参数,用逗号或空格(或两者)分隔参数
  3. 双引号中的输入被视为单个参数,因此双引号内的逗号不用于分隔参数(这用于创建列表)。

输入和所需解析的示例(显示为字典);单引号开始和结束示例,并且不是要解析的字符串的一部分..:

'start'                       
{'cmd':'start'}
'  stop     '                
{'cmd':'stop'}
'start now'                   
{'cmd':'start','arg1':'now'}
' start     later   forward ,  back    ' 
{'cmd':'start','arg1':'later','arg2':'forward','arg3':'back}
'start    tomorrow  ,back, "Lucile,   Michael "    Oscar'
{'cmd':'start','arg1':tomorrow','arg2':'back','arg3':'Lucile,   Michael','arg4':'Oscar'}

我使用的是 PY3.4,但关键问题是 RegEx,不需要特定于 python 的实现。

最佳答案

单个正则表达式可能会更困难,因为看起来您可能想要处理任意数量的参数。您可以使用此函数以上面给出的格式提取命令和参数:

import re

def parse(s):
  args = {}
  n = 1
  # recognizes a double-quoted argument
  q_arg_re = "^\s*,?\s*\"(.*?)\""
  # recognizes a single-word argument
  arg_re = "^\s*,?\s*(\w+)"
  arg = False
  while True:
    m = re.search(arg_re, s)
    if m:
      arg = m.groups()[0]
    else:
      m = re.search(q_arg_re, s)
      if m:
        arg = m.groups()[0]

    if arg:
      if 'cmd' in args:
        args['arg{}'.format(n)] = arg
        n += 1
      else:
        args['cmd'] = arg
      s = s[m.end(0):]
      arg = False
    else:
      break
  return args

关于python - 将第一个单词和参数与可选参数(带引号或不带引号)匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32129321/

相关文章:

python - 为什么SimpleITK不使用imageJ显示图像?

python - 拦截来自第三方代码的消息

regex - 正则表达式库基准测试

java - 正则表达式模式从字符串中查找单词

python - 你如何检查列表是否为空?

python - 如何获取有关上述用户的信息(discord.py bot)?

python - Keras 密集输出层形状错误

c# - 用于替换标签的正则表达式

python - python/jinja 中的正则表达式模式替换

php - 在 PHP 中删除开始和结束 <br> 标签