java 正则表达式模式匹配器来识别不寻常的字符和亚洲表意文字

标签 java regex pattern-matching

我想通过以下文本来根据 java 正则表达式模式提取一些某些元素:

『卥』

对于这个元素『卥』,我想我总能找到之间的项目并提取它,这应该是可行的,因为这些是非常不寻常的实体,所以它应该是识别和提取它们之间的任何内容的良好基础,即

有很多关于使用 java 正则表达式模式匹配器来匹配整个字符类的信息,但我没有找到太多关于仅匹配一两个特定字符并从中间删除内容的信息。我想这当然有可能,不是吗?如何做到这一点?

理想情况下是这样的

match(`『` and `』`)
{
     print(what comes between them)
}

尝试过,但没有成功:

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class text_processing
{
    @SuppressWarnings("resource")
    public static void main(String[] args) throws IOException
    {
        String sCurrentLine; 
        BufferedReader br = new BufferedReader(new FileReader("/home/matthias/Workbench/SUTD/1_February/brute_force/items.csv"));


        Pattern p = Pattern.compile("/『(.*?)』/");


        while ((sCurrentLine = br.readLine()) != null) 
        {
            Matcher m = p.matcher(sCurrentLine);
            System.out.println(m);
        }
    }
}

感谢您的考虑

最佳答案

下面将是你的正则表达式

"『(.*?)』"

查看此处的工作示例:https://regex101.com/r/lO8xR1/1

关于java 正则表达式模式匹配器来识别不寻常的字符和亚洲表意文字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28469980/

相关文章:

java 获取日期标记字段(上午/下午)

java - 捕获并存储所有 mysql 数据库数据(表行)以使用它们进行比较和匹配

php - preg_replace : add number after backreference

Android:Pattern.UNICODE_CASE 不匹配变音符号

java - java中Jtable到TextArea

sql - Oracle、正则表达式、以分号分隔的字符串

# 分隔记录的 Java 正则表达式

haskell - 模式匹配重叠 - 运算符上的模式匹配

linux - 如何在终端(LINUX)中重命名多个文件?

java - HQL 返回 List<MyClass> 而不是 List<Object[]>