使用jdk8 stream 统计单词数
在我的SpringBoot2.0不容错过的新特性 WebFlux响应式编程里面,有同学问如何使用stream统计单词数。这是个好例子,也很典型,在这里补上。
下面的例子实现了从一个文本文件读取(英文)文本并统计单词数的功能。
package com.imooc; import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException; /**
* 使用stream统计文章单词数
*
* @author 晓风轻
*
*/
public class StreamWordDemo { public static void main(String[] args) throws IOException {
// 使用try-resource 关闭资源
try (BufferedReader reader = new BufferedReader(
new FileReader("webflux.txt"))) { long wordCount = reader.lines()
// trim前后空格(使用方法引用)
.map(String::trim)
// 过滤掉空串
.filter(s -> !s.isEmpty())
// 把空格隔开的转为单词数组
.map(s -> s.split(" "))
// 得到数组长度
.mapToInt(array -> array.length)
// 并行(都是无状态操作)
.parallel()
// 求和
.sum(); System.out.println("单词数:" + wordCount);
}
}
}
牵涉的知识点主要还是lambda表达式和stream的基本应用。大家可以看出,使用stream编程代码非常清晰和简单,可读性很强。
下面获取每个单词出现的次数
// 使用try-resource 关闭资源
try (BufferedReader reader = new BufferedReader(
new FileReader("webflux.txt"))) { Map<String, Long> counts = reader.lines()
// trim前后空格(使用方法引用)
.map(String::trim)
// 过滤掉空串
.filter(s -> !s.isEmpty())
// 把空格隔开的转为数组
.map(s -> s.split(" "))
// 数组转成流
.map(array -> Stream.of(array))
// 拉平
.flatMap(stream -> stream)
// 分组
.collect(Collectors.groupingBy(s -> s, Collectors.counting())); System.out.println("单词出现次数:" + counts); // 统计信息
LongSummaryStatistics summaryStatistics = counts.entrySet().stream()
// 得到次数
.mapToLong(entry -> entry.getValue())
// 统计
.summaryStatistics(); System.out.println("统计信息:" + summaryStatistics);
}
输出的统计
信息为:
统计信息:LongSummaryStatistics{count=170, sum=271, min=1, average=1.594118, max=14}
可以看出,一共有271个单词,不同的词有170个,出现最多的14次,最少1次,平均1.594118次。
这就是stream的编程风格,其中lambda表达式是函数式编程的基础,是后面的stream,reactor的前置基础知识。对lambda表达式,stream流编程以及响应式编程webflux有更多兴趣的可以学习我的实战课程 SpringBoot2.0不容错过的新特性 WebFlux响应式编程,里面有详细的讲解,课程干货满满,7小时只需要128元,海量的知识点的底层实现讲解和自己动手编写响应式的类似feign的restclient,绝对物超所值!
上面范例代码github地址:stream流编程处理单词
作者: 晓风轻
链接:https://www.imooc.com/article/27508
来源:慕课网
本文原创发布于慕课网 ,转载请注明出处,谢谢合作
使用jdk8 stream 统计单词数的更多相关文章
- 统计单词数(WordCount)
1.首先新建两个文件夹: 往文件夹添加内容: 2.启动hadoop-查看是否启动成功. 3.先对nameNode进行初始化. 4.查看hadoop下面有哪些文件. 5.在hadoop目录下创建inpu ...
- 05:统计单词数【NOIP2011复赛普及组第二题】
05:统计单词数 总时间限制: 1000ms 内存限制: 65536kB 描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次 ...
- AC日记——统计单词数 openjudge 1.12 5
05:统计单词数 总时间限制: 1000ms 内存限制: 65536kB 描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次 ...
- noip2011普及组——统计单词数
统计单词数 时间限制:1 s 内存限制:128MB [问题描述]一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数.现在,请你编程实 ...
- linux统计单词数
sort +awk+uniq 统计文件中出现次数最多的前10个单词 实例 cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sor ...
- codevs 1131 统计单词数
#include<iostream> #include<string> using namespace std; int main() { string s, s0; getl ...
- 洛谷 P1308 统计单词数【string类及其函数应用/STL】
题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数. 现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给 ...
- 洛谷 P1308 统计单词数
P1308 统计单词数 题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数. 现在,请你编程实现这一功能,具体要求是:给定 ...
- 杭电oj 2072————统计单词数(java)
problem:统计单词数 思路:利用HashMap的特性——不能反复存储同一个键得数据,所以可以保证map里边儿的元素都是不重复的,存储完毕之后直接输出size就好了 注意事项: 1.利用strin ...
随机推荐
- 1.QT中播放视频,录音程序的编写
1 通过process的方式播放视频 T22VideoPlayer.pro HEADERS += \ MyWidget.h SOURCES += \ MyWidget.cpp QT += gu ...
- 带吸附效果的ViewPager(二)
上篇实现了一个简单的吸附效果,那么这篇我们来实现上篇中所示的360软件详情页(带viewpager)的效果!先来参观下本篇所实现的效果图: 了解了上一篇的实现过程,那么本篇的效果无非是修改一下布局,将 ...
- myeclipse一直停留在Loading workbench界面上的处理办法
找到工作目录比如我的叫work,在.metadata中删掉以下两个文 件,再次重启myeclipse走一个! org.eclipse.ui.workbench org.eclipse.ui.workb ...
- Cocos2D iOS之旅:如何写一个敲地鼠游戏(六):放置地鼠
大熊猫猪·侯佩原创或翻译作品.欢迎转载,转载请注明出处. 如果觉得写的不好请告诉我,如果觉得不错请多多支持点赞.谢谢! hopy ;) 免责申明:本博客提供的所有翻译文章原稿均来自互联网,仅供学习交流 ...
- Android开发工具下载地址
Android Studio: http://zdz.la/iq4zSa
- 【一天一道LeetCode】#107. Binary Tree Level Order Traversal II
一天一道LeetCode 本系列文章已全部上传至我的github,地址:ZeeCoder's Github 欢迎大家关注我的新浪微博,我的新浪微博 欢迎转载,转载请注明出处 (一)题目 来源: htt ...
- synchronized和volatile比较
synchronized和volatile比较 volatile不需要加锁,比synchronized更轻量级,不会阻塞线程 从内存可见性角度讲,volatile读相当于加锁,volatile写相当于 ...
- 摆脱命令行,Ubuntu下配置Android开发环境
作者:宋志辉 微博:weibo.com/askzhihui/ 安装所需工具 一.新立得 新立得(Synaptic)是Debian和Ubuntu Linux操作系统的包管理工具apt的图形化前端. 它结 ...
- 【一天一道LeetCode】#95. Unique Binary Search Trees II
一天一道LeetCode 本系列文章已全部上传至我的github,地址:ZeeCoder's Github 欢迎大家关注我的新浪微博,我的新浪微博 欢迎转载,转载请注明出处 (一)题目 Given a ...
- Unity插件 - MeshEditor(一) 3D线段作画 & 模型网格编辑器
之前,因为工作需要,项目中需要动态生成很多的电线,不能事先让模型做好,更不能用LineRenderer之类的,因为画出来没有3D的效果,最主要是拐角的时候还容易破面,而我们要的是真真实实纯3D的电线, ...