我想通过以下文本来根据 java 正则表达式模式提取一些某些元素:
『卥』
对于这个元素『卥』
,我想我总能找到『
和』
之间的项目并提取它,这应该是可行的,因为这些是非常不寻常的实体,所以它应该是识别和提取它们之间的任何内容的良好基础,即 卥
有很多关于使用 java 正则表达式模式匹配器来匹配整个字符类的信息,但我没有找到太多关于仅匹配一两个特定字符并从中间删除内容的信息。我想这当然有可能,不是吗?如何做到这一点?
理想情况下是这样的
match(`『` and `』`)
{
print(what comes between them)
}
尝试过,但没有成功:
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class text_processing
{
@SuppressWarnings("resource")
public static void main(String[] args) throws IOException
{
String sCurrentLine;
BufferedReader br = new BufferedReader(new FileReader("/home/matthias/Workbench/SUTD/1_February/brute_force/items.csv"));
Pattern p = Pattern.compile("/『(.*?)』/");
while ((sCurrentLine = br.readLine()) != null)
{
Matcher m = p.matcher(sCurrentLine);
System.out.println(m);
}
}
}
感谢您的考虑
最佳答案
关于java 正则表达式模式匹配器来识别不寻常的字符和亚洲表意文字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28469980/