java - 如何识别正则表达式中两个之间没有空格的标记?

标签 java regex

我正在尝试匹配字符串中的两个标记,例如我想识别(x),例如specialCharacter:(,变量:x,specialCharacter:)。

但我的正则表达式仅识别字符串中的第一个标记:specialCharacter:(x)

这是我的正则表达式:

SpecialCharacters("[{|}|(|)|@|&|'|/||`|~|?|:|;]\\s?"),
Variables("\\w")

这是我的 Java 代码:

package lexer;

import java.util.ArrayList;
import java.util.StringTokenizer;
import java.util.regex.Pattern;
import java.util.regex.Matcher;

public class Lexer{


final ArrayList<Reservada> rs = new ArrayList<Reservada>(); // atributo de mi clase lexer que contendra un arraylist de instancias de Reservada aqui
//sabre cuantos tipos de tokens tengo.


public ArrayList<Token> lex(String entrada){
    final ArrayList<Token> tokens = new ArrayList<Token>(); //arraylist de tokens
    final StringTokenizer st = new StringTokenizer(entrada); // mi tokenizer que tendra el codigo que se pasa como parametro a entrada

    while(st.hasMoreTokens()){

        String palabra = st.nextToken(); //mi palabra es igual a el siguiente token

        boolean matched = false; //mi bandera de encuentra o relacionado la pongo en falso

        int i=0;   // creo una variable i y le asigno 0 esto lo hago para controlar que no haya dos tokens iguales pero relacionados con dos tipos diferentes

        for(Tipos tokenTipo: Tipos.values()){ // recorro todos mis tipos hasta allar el que corresponda a mi palabra



            Pattern patron = Pattern.compile(tokenTipo.patron);
            Matcher matcher = patron.matcher(palabra);

            if(matcher.find()){ // si se encuentra pues hahcemos el proceso de agregar el tipo al token , el valor y inicializar o aumentar al contador de tipos
                i++;
                System.out.println(palabra);

                if(i<=1) { //condicional para que no se repita el token con diferentes tipos
                    boolean ok=true;
                    Token tk = new Token();


                    tk.setTipo(tokenTipo);
                    tk.setValor(palabra);
                    tokens.add(tk);

                    //checo si mi arraylist esta vacio si no es asi recorro todo para saber cual se repite y agregarle al contador uno mas de ese tipo
                    //pongo mi bandera en false si no existe la palabra reservada pues mi bandera ase queda en true asi que creo una instancia de Reservada y la agrego
                    // a mi arraylist

                    if(rs.isEmpty()){
                        Reservada r = new Reservada(tk.getTipo().toString());
                        rs.add(r);
                    }else{
                        for(Reservada x:rs){

                            if(x.reservada.equals(tk.getTipo().toString())){

                                x.size++;
                                ok=false;
                            }
                        }
                        if(ok==true){
                            Reservada r = new Reservada(tk.getTipo().toString());
                            rs.add(r);
                        }

                    }
                    matched=true;
                    System.out.println(i);

                }
            }
            if(!matched){
                //   throw new RuntimeException("No existe tal token");
            }

        }

    }

    return tokens; //regreso mi arraylist de tokens.
}
}

我想将字符串 (x) 分成三个不同的部分。任何想法?

最佳答案

通过创建新的正则表达式解决了我的问题:

"((?<=[\\(|\\)|\\s+|\\{|\\}|\\+|\\-|\\/|//*])|(?=[\\(|\\)|\\s+|\\{|\\}|\\+|\\-|\\/|//*]))"

然后使用Scanner的方法useDelimiter

st.useDelimiter(Delimiters.delimiters.patron);

关于java - 如何识别正则表达式中两个之间没有空格的标记?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55435333/

相关文章:

java - Spring MVC 中带有抽象类的 @ModelAttribute

java - 如果授权失败,Spring Controller 上的 @PreAuthorize 会发送重定向

javascript正则表达式检查第一个和最后一个字符是否相似?

regex - 使用 sed 匹配行尾,前面不紧接着某个字符

java - 使用 Java 8 jar 命令从 zip 存档中提取 4GB+ 文件时出现 "invalid CEN header (bad signature)"

java - NullPointerException是如何实现的?

java - 使用预准备语句的变量列名

java - 正则表达式匹配匹配域的所有子域

node.js - Express 正则表达式路由不再知道如何加载静态资源

c# - 用于替换除数字之外的所有字符的正则表达式