java - 收集 HashSet/Java 8/Regex Pattern/Stream API

标签 java regex collections java-8 java-stream

最近我更改了 JDK 8 的版本而不是我的项目的 7,现在我使用 Java 8 附带的新功能覆盖了一些代码片段。

final Matcher mtr = Pattern.compile(regex).matcher(input);

HashSet<String> set = new HashSet<String>() {{
    while (mtr.find()) add(mtr.group().toLowerCase());
}};

如何使用 Stream API 编写此代码?

最佳答案

如果您重用 JDK 提供的 Spliterators.AbstractSpliterator,基于 Matcher 的拆分器实现会非常简单:

public class MatcherSpliterator extends AbstractSpliterator<String[]>
{
  private final Matcher m;

  public MatcherSpliterator(Matcher m) {
    super(Long.MAX_VALUE, ORDERED | NONNULL | IMMUTABLE);
    this.m = m;
  }

  @Override public boolean tryAdvance(Consumer<? super String[]> action) {
    if (!m.find()) return false;
    final String[] groups = new String[m.groupCount()+1];
    for (int i = 0; i <= m.groupCount(); i++) groups[i] = m.group(i);
    action.accept(groups);
    return true;
  }
}

请注意,拆分器提供所有 匹配器组,而不仅仅是完整匹配。另请注意,此拆分器支持并行性,因为 AbstractSpliterator 实现拆分策略。

通常你会使用便利流工厂:

public static Stream<String[]> matcherStream(Matcher m) {
  return StreamSupport.stream(new MatcherSpliterator(m), false);
}

这为您简洁地编写各种复杂的面向正则表达式的逻辑提供了强大的基础,例如:

private static final Pattern emailRegex = Pattern.compile("([^,]+?)@([^,]+)");
public static void main(String[] args) {
  final String emails = "kid@gmail.com, stray@yahoo.com, miks@tijuana.com";
  System.out.println("User has e-mail accounts on these domains: " +
      matcherStream(emailRegex.matcher(emails))
      .map(gs->gs[2])
      .collect(joining(", ")));
}

哪个打印

User has e-mail accounts on these domains: gmail.com, yahoo.com, tijuana.com

为了完整起见,您的代码将被重写为

Set<String> set = matcherStream(mtr).map(gs->gs[0].toLowerCase()).collect(toSet());

关于java - 收集 HashSet/Java 8/Regex Pattern/Stream API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24660888/

相关文章:

java - 在应用程序包中包含 JVM 的副本

node.js - 如何在node.js中获得对regexp-match-indices的支持?

python - 使用 Regex 提取多行 SAS 代码

c# - 字符出现时正则表达式结束

java - 将 Collections.emptyMap 作为参数传递时出现错误

java - 从列表中删除项目或添加构建新列表?

javascript - 将 JavaScript 函数转换为

java - 如何将数组添加到 ArrayList?

java - Java EE部署中的Spring类加载机制

c# - 对 DFS 和 BFS 程序有用的 C# 类/方法