java - 词频计数 Java 8

标签 java java-8 java-stream word-count

Java 8中如何统计List的词频?

List <String> wordsList = Lists.newArrayList("hello", "bye", "ciao", "bye", "ciao");

结果必须是:

{ciao=2, hello=1, bye=2}

最佳答案

我想分享我找到的解决方案,因为一开始我希望使用 map-and-reduce 方法,但它有点不同。

Map<String,Long> collect = wordsList.stream()
    .collect( Collectors.groupingBy( Function.identity(), Collectors.counting() ));

或者对于整数值:

Map<String,Integer> collect = wordsList.stream()
     .collect( Collectors.groupingBy( Function.identity(), Collectors.summingInt(e -> 1) ));

编辑

我添加了如何按值对 map 进行排序:

LinkedHashMap<String, Long> countByWordSorted = collect.entrySet()
            .stream()
            .sorted(Map.Entry.comparingByValue(Comparator.reverseOrder()))
            .collect(Collectors.toMap(
                    Map.Entry::getKey,
                    Map.Entry::getValue,
                    (v1, v2) -> {
                        throw new IllegalStateException();
                    },
                    LinkedHashMap::new
            ));

关于java - 词频计数 Java 8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29122394/

相关文章:

java - Android套接字客户端不工作

java - 使用pdfbox从PDF文件中提取文本

java - 将文本字段与 Java 中的复选框关联起来

java - 基于注释参数创建切入点

java - 可以是 N 个接口(interface)的实现的方法参数

java - 删除 Spark 数组列中的重复项

Java 8 Lambda(一步分组和归约)

java - 使用 Stream API 进行转换

java - 按前 3 个字符进行流分组

java - 字符串流未排序?