什么是Stream?
Stream字面意思是流,在java中是指一个来自数据源的元素队列并支持聚合操作,存在于java.util
包中,又或者说是能应用在一组元素上一次执行的操作序列。(stream是一个由特定类型对象组成的一个支持聚合操作的队列。)注意Java中的Stream并不会存储元素,而是按需计算。关于这个概念需要以下几点解释:1、数据源流的来源。 它可以是列表,集合,数组(java.util.Collection
的子类),I/O channel
, 产生器generator
等(注意Map是不支持的);2、聚合操作。类似于SQL语句一样的操作, 如filter, map, reduce, find, match, sorted等。因此stream流和以前的Collection操作是完全不同, Stream操作还有两个非常基础的特征:Pipelining
和内部迭代。
Pipelining
也就是中间操作,它都会返回流对象本身。 这样多个操作的设计可以串联起不同的运算操作,进而形成一个管道, 如同流式风格(fluent style)。 这样做还可以对操作进行优化, 比如延迟执行(laziness)和短路( short-circuiting)等。内部迭代, 以前对集合遍历都是通过Iterator
或者For-Each
的方式来显式的在集合外部进行迭代, 这种方式叫做外部迭代。而我们的Stream则提供了内部迭代方式, 是通过访问者模式(Visitor)来实现的。
也就是说Stream操作分为中间操作和最终操作两种。其中最终操作用于返回特定类型的计算结果,而中间操作则返回Stream对象本身,这样就可以将多个操作依次串起来且使得操作优化成为可能。
生成流
在Java1.8 中, 集合接口提供了两个方法来生成流:stream()串行流
和parallelStream()并行流
,即Stream的操作可以分为串行stream()
和并行parallelStream()
。举个例子来说:
1 2
| List<String> strings = Arrays.asList("who","what","when","why","which"); List<String> filterd = strings.stream().filter(string -> !string.isEmpty()).collect(Collectors.toList());
|
流的各种运算操作
接下来介绍流的各种操作运算,使得你在适当的时候可以选择相应的流运算。
1、forEach 循环
Stream提供了新的方法forEach
来迭代流中的每个数据。举个例子来说:
1 2 3 4 5 6 7 8 9 10 11 12
| List<String> stringList = Arrays.asList("who","what","when","why","which");
// 方式一:JDK1.8之前的循环方式 for(String string:stringList){ System.out.println(string); }
// 方式二:使用Stream的forEach方法 stringList.stream().forEach(e -> System.out.println(e));
// 方式三:方式二的简化形式,因为方法引用也属于函数式接口,因此Lambda表达式可以用方法引用来代替 stringList.stream().forEach(System.out::println);
|
2、filter 过滤
filter方法用于通过设置条件来过滤出满足条件的元素。举个例子来说,下面就是用于输出字符串列表中的空字符串的个数:
1 2 3
| List<String> stringList = Arrays.asList("","welcome","","to","visit","my","","website"); long count = stringList.stream().filter(e -> e.isEmpty()).count(); System.out.println(count);
|
3、map 映射
请注意这里的map不是指地图map,而是一种函数,用于映射每个元素执行某些操作得到对应的结果。举个例子来说,下面就是使用map来输出元素对应的平方数:
1 2 3
| List<Integer> integerList = Arrays.asList(2,3,4,5,6); List<Integer> integers = integerList.stream().map(i->i*i).collect(Collectors.toList()); integerList.stream().forEach(System.out::println);
|
上面介绍的只是map的最基本用法。map对于Stream中包含的元素使用给定的转换函数进行转换操作,新生成的Stream只包含转换生成的元素。这个方法有三个对于原始类型的变种方法,分别是:mapToInt
,mapToLong
和mapToDouble
。顾名思义像mapToInt就是将原始Stream转换成一个新的Stream,不过新生成的Stream中的元素都是int类型。三个变种方法可以免除自动装箱/拆箱的额外消耗。map方法示意图:
4、flatMap 映射
flatMap映射和map映射类似,不过它的每个元素转换得到的是Stream对象,会把子Stream中的元素压缩到父集合中,说白了就是将几个小的list合并成一个大的list。flatMap方法示意图:
合并的过程可以参看下面这张图片:
举个例子来说,下面是jdk1.8之前的合并方式,需要先构造一个复合类型List,然后通过两次遍历循环来实现将复合类型List转为单一类型List,这个过程其实挺复杂的:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| List<String> fruitList = Arrays.asList("banana","orange","watermelon"); List<String> vegetableList = Arrays.asList("kale","leek","carrot"); List<String> transportList = Arrays.asList("car","bike","train");
//将多个元素合成一个复合类型集合,元素类型List<String> List<List<String>> lists = new ArrayList<>(); lists.add(fruitList); lists.add(vegetableList); lists.add(transportList);
//将多个元素合成一个单一类型集合,元素类型String List<String> newList = new ArrayList<>(); for(List<String> list:lists){ for(String item:list){ newList.add(item); } }
|
那么使用jdk1.8提供的stream流,同时辅助of、collect和flatMap就可以直接进行转换:
1 2 3 4 5 6 7 8 9 10 11 12
| List<String> fruitList = Arrays.asList("banana","orange","watermelon"); List<String> vegetableList = Arrays.asList("kale","leek","carrot"); List<String> transportList = Arrays.asList("car","bike","train");
//将多个元素合成一个复合类型集合,元素类型List<String> List<List<String>> lists = Stream.of(fruitList,vegetableList,transportList).collect(Collectors.toList());
//将多个元素合成一个单一类型集合,元素类型String List<String> flatMap = Stream.of(fruitList,vegetableList,transportList) .flatMap(list ->list.stream()) .collect(Collectors.toList()); System.out.println(flatMap);
|
5、sorted 排序
sorted方法用于对流进行排序。举个例子来说,下面的代码就是用于对字符串按照给定的规则进行排序并输出:
1 2
| List<String> stringList = Arrays.asList("c","a","f","d","b","e"); stringList.stream().sorted((s1,s2) -> s1.compareTo(s2)).forEach(System.out::println);
|
再举个例子,对10个随机数进行排序并输出:
1 2
| Random random = new Random(); random.ints().limit(10).sorted().forEach(System.out::println);
|
6、distinct 去除重复
distinct方法用于去除流中重复的元素,缺点就是不能设置去重的条件。举个例子来说:
1 2
| List<String> stringList = Arrays.asList("do","what","you","want","to","do","and","do","it"); stringList.stream().distinct().forEach(System.out::println);
|
7、of 生成Stream对象
of方法用于生成Stream对象,注意它是Stream对象的方法。举个例子来说:
1 2
| Stream<Object> objectStream= Stream.of("do","what","you","want","to","do","and","do","it"); objectStream.forEach(System.out::println);
|
8、count 计算总数
count方法用于计算流中元素的总数。举个例子来说:
1 2 3
| Stream<Object> objectStream = Stream.of("do","what","you","want","to","do","and","do","it"); long count = objectStream.count(); System.out.println(count);
|
9、min和max 最小/最大
min/max方法用于返回流中那个元素最小(最大)的,注意返回的是一个Optional对象。举个例子来说:
1 2 3 4
| List<String> integerList = Arrays.asList("1","2","3","4","5","6","7"); Optional<String> optionalInteger = integerList.stream().max((a,b) -> a.compareTo(b)); String result = optionalInteger.get(); System.out.println(result); //结果为7
|
10、collect
collect
方法的使用较为复杂,这里仅仅介绍一些常用的方法即可。collect方法可以将Stream转为Collection对象或者是Object类型的数组等,举个例子来说:
1 2 3 4 5
| List<String> stringList= Arrays.asList("do","what","you","want","to","do","and","do","it"); //Stream转Collection stringList.stream().collect(Collectors.toList()); //Stream转Object[]数组 Object[] objects = stringList.stream().toArray();
|
11、concat
concat
方法用于合并流对象,注意这时Stream对象的方法。举个例子来说:
1 2 3 4 5
| List<String> fruitList = Arrays.asList("banana","orange","watermelon"); List<String> vegetableList = Arrays.asList("kale","leek","carrot");
Stream<String> stringStream = Stream.concat(fruitList.stream(),vegetableList.stream()); stringStream.forEach(System.out::println);
|
12、skip和limit
通常大家都会将skip和limit放在一块进行学习和对比,那是因为两者具有类似的作用,都是对流进行裁剪的中间方法。
skip方法。先来看skip方法,顾名思义skip(n)
用于跳过前面n个元素,然后再返回新的流,如图所示:
为了验证上面图片的作用,这里举一个例子来进行说明:
1 2 3 4
| public static void skipTest(long n){ Stream<Integer> integerStream = Stream.of(1,2,3,4,5,6); integerStream.skip(n).forEach(System.out::println); }
|
方法skip()
中的参数n不同将会导致不同的结果,具体情况如下:
(1)、当n<0时,运行结果会抛出IllegalArgumentException
异常;(2)、当n=0时,相当没有跳过任何元素,原封不动地截取流中的元素(这种通常没有意义,基本不会这样操作);(3)、当0<n<length时,表示跳过n个元素后(不包括元素n),结果返回含有剩下的元素的流(使用频率较多);(4)、当n>=length时,表示跳过所有元素,结果返回空流,你可以使用count方法来判断此时流中元素的总数必定为0。
limit方法。说完了skip()
方法,接下来聊聊limit()
方法。顾名思义这个就是限制流中的元素,即用于将前n个元素返回新的流,如图所示:
同样也通过举一个例子来进行说明:
1 2 3 4
| public static void limitTest(long n){ Stream<Integer> integerStream = Stream.of(1,2,3,4,5,6); integerStream.limit(n).forEach(System.out::println); }
|
方法limit()
中的参数n不同将会导致不同的结果,具体情况如下:
(1)、当n<0时,运行结果会抛出IllegalArgumentException
异常;(2)、当n=0时,相当不取元素,结果返回空流;(3)、当0<n<length时,表示取前n个元素,结果返回新的流(使用频率较多);(4)、当n>=length时,表示取所有元素,结果返回流本身,你可以使用count方法来判断此时流中元素的总数必定为length。
区别:注意这里谈skip
和limit
方法的区别是局限于有限流。skip
和limit
方法都是对流进行截取操作,区别在于skip
方法必须时刻监测流中元素的状态,才能判断是否需要丢弃,因此skip
属于状态操作。而limit
只关心截取的是否是其length,是就立马中断操作返回流,因此limit
属于中断操作。
13、并行(parallel)执行
parallelStream
是流并行处理程序的代替方法。举个例子来说,下面是使用 parallelStream
并行流来输出空字符串的数量:
1 2 3 4
| List<String> stringList= Arrays.asList("a","","b","","e","","c","","f"); //获取空字符串的数量 long count = stringList.parallelStream().filter(string -> string.isEmpty()).count(); System.out.println(count); // 4
|
14、anyMatch、allMatch和noneMatch
anyMatch
方法用于判断流中是否存在满足特定条件的元素,返回类型是boolean类型。(只要有一个条件满足即返回true)
1 2 3
| List<String> stringList = Arrays.asList("hello","the","fruit","name","is","banana"); Boolean result = stringList.parallelStream().anyMatch(item -> item.equals("name")); System.out.println(result); // true
|
allMatch
方法用于判断流中是否存在满足特定条件的元素,返回类型是boolean类型。(必须全部满足才会返回true)
1 2 3
| List<String> stringList = Arrays.asList("hello","the","fruit","name","is","banana"); Boolean result = stringList.parallelStream().allMatch(item -> item.equals("name")); System.out.println(result); // false
|
noneMatch
方法用于判断流中是否存在满足特定条件的元素,返回类型是boolean类型。(全都不满足才会返回true)
1 2 3
| List<String> stringList = Arrays.asList("hello","the","fruit","name","is","banana"); Boolean result = stringList.parallelStream().noneMatch(item -> item.equals("name")); System.out.println(result); // false
|
上面这个例子就是因为有一个满足条件就返回了false。
15、reduce
reduce的意思是减少,而Stream中reduce方法就是用于实现这个目的,它根据一定的规则将Stream中的元素进行计算后返回一个唯一的值。举个例子来说:
1 2 3
| Stream<String> stringStream = Stream.of("my","name","is","envy"); Optional<String> stringOptional = stringStream.reduce((before, after) -> before+"、"+after); stringOptional.ifPresent(System.out::println); // my、name、is、envy
|
16、findFirst和findAny
findFirst
方法用于返回list列表中第一个元素,注意如果元素不存在则抛异常。举个例子来说:
1 2 3
| List<String> stringList = Arrays.asList("do","what","you","want","to","do","and","do","it"); Optional<String> result = stringList.parallelStream().findFirst(); System.out.println(result.get()); // do
|
注意若Optional
为空,则get方法会抛出异常,但是你可以使用orElse(defaultVal);
或使用orElseGet(() -> {// doSomething; return defaultVal;});
来返回默认值。举个例子来说:
1 2 3 4 5 6 7
| List<String> stringList = Arrays.asList(); Optional<String> result = stringList.parallelStream().findFirst(); System.out.println(result.orElse("没有元素")); // 没有元素
List<String> stringList = Arrays.asList(); Optional<String> result = stringList.parallelStream().findFirst(); System.out.println(result.orElseGet(() ->{return "没有元素";})); // 没有元素
|
17、summaryStatistics统计
summaryStatistics
方法用于产生统计结果的收集器,举个例子来说:
1 2 3 4 5 6 7
| List<Integer> integerList = Arrays.asList(3,2,3,5,6,8,9); IntSummaryStatistics result = integerList.stream().mapToInt((x)->x).summaryStatistics(); System.out.println("列表中最大的数:"+result.getMax()); System.out.println("列表中最小的数:"+result.getMin()); System.out.println("列表中所有数之和:"+result.getSum()); System.out.println("列表中所有数的平均数:"+result.getAverage()); System.out.println("列表中元素的个数:"+result.getCount());
|
18、Joining集合元素的拼接
集合元素的拼接,其实就是指定分隔符将列表中的元素合并成一个字符串,注意joining
方法是存在于Collectors
中的。举个例子来说:
1 2 3 4 5 6 7 8 9 10
| List<String> stringList = Arrays.asList("my","name","is"); System.out.println(stringList); // [my, name, is]
String result = stringList.stream().collect(Collectors.joining(",")); System.out.println(result); // my,name,is
String newString = Stream.of("I","come","from bei").collect( Collectors.collectingAndThen( Collectors.joining(","),x-> x+"jing")); System.out.println(newString); // I,come,from beijing
|
19、Collectors之流转换成集合
Collectors
类实现了很多归约操作,例如将流转换成集合和聚合元素等,Collectors
可用于返回列表或字符串。下面通过举一些经常会使用到的例子来进行说明:
先在外部新建一个Student实体类,后续会使用到:
1 2 3 4 5
| public class Student { private String name; private Long score; //getter/setter/toString/AllArgsConstructor }
|
然后看下面的例子代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
| List<Integer> integerList = Arrays.asList(1,2,3,4,5); //流转列表 List<Integer> newList = integerList.stream().map(i -> i*10).collect(Collectors.toList()); System.out.println("新列表:"+newList); //[10, 20, 30, 40, 50]
//流转集合 Set<Integer> integerSet = integerList.stream().map(i -> i*10).collect(Collectors.toSet()); System.out.println("新集合:"+integerSet); //[50, 20, 40, 10, 30]
//流转映射 Map<String,String> stringStringMap = integerList.stream().map(i ->i*10).collect( Collectors.toMap(key -> "key"+key/10,value -> "value:"+value) ); System.out.println("新映射:"+stringStringMap); //{key1=value:10, key2=value:20, key5=value:50, key3=value:30, key4=value:40}
//流转有序集合TreeSet TreeSet<Integer> integerTreeSet = Stream.of(1,6,3,7,2).collect(Collectors.toCollection(TreeSet::new)); System.out.println("新有序集合:"+integerTreeSet); //[1, 2, 3, 6, 7]
//自定义对象流 List<Student> studentList = Arrays.asList( new Student("envy",100L), new Student("movie",90L), new Student("book",80L) );
//获得对象 Map<String,Student> studentAndModelMap = studentList.stream().collect(Collectors.toMap( Student::getName, Function.identity() )); Student student = studentAndModelMap.get("envy"); System.out.println(student); //Student{name='envy', score=100}
//获得属性 Map<String,Long> studentAndStudentScoreMap = studentList.stream().collect(Collectors.toMap( Student::getName, Student::getScore )); Long score = studentAndStudentScoreMap.get("envy"); System.out.println(score); //100
|
20、Collectors之元素聚合
其实这个元素聚合归根结底还是Collectors
类中的方,下面就来介绍聚合元素这个操作,Collectors
可用于返回列表或字符串。下面通过举一些经常会使用到的例子来进行说明:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
| //元素聚合
List<Integer> integerList = Arrays.asList(1,5,8,3,6,2,9,7,4);
//求最大值 Integer maxValue = integerList.stream().collect( Collectors.collectingAndThen( Collectors.maxBy((a,b) -> a-b), Optional::get )); System.out.println(maxValue); // 9
//求最小值 Integer minValue = integerList.stream().collect( Collectors.collectingAndThen( Collectors.minBy((a,b) -> a-b), Optional::get )); System.out.println(minValue); // 1
//求和 Integer sumValue = integerList.stream().collect( Collectors.summingInt(item ->item) ); System.out.println(sumValue); // 45
//平均值 Double avgValue = integerList.stream().collect( Collectors.averagingDouble(x -> x) ); System.out.println(avgValue); // 5.0
//集合转映射 String listToMap = Stream.of("my","name","is","envy").collect( Collectors.mapping( x->x.toUpperCase(),Collectors.joining(",") ) ); System.out.println(listToMap); // MY,NAME,IS,ENVY
|
21、累计操作
reducing
累计操作,也是Collectors
类中的方法,用于进行元素的累计操作。先来看一个例子,用于计算出[2,3,5,6]
这个列表中所有元素各加1之后的所有元素之和,很简单口算都可以知道答案是20。你可能有很多种想法,这里提供几种以供你参考:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
| //方法一,不使用stream int[] ints = {2,3,5,6}; int resultSum =0; for(int i:ints){ i++; resultSum+=i; } System.out.println(resultSum); //20
//方法二,使用stream流的map+summingInt方法 List<Integer> integerList = Arrays.asList(2,3,5,6); Integer integerOne = integerList.stream().map(i ->i+1).collect( Collectors.summingInt(x ->x) ); System.out.println(integerOne); //20
//方法三,使用stream流的reducing方法 Integer integerTwo = integerList.stream().collect( Collectors.reducing(0,x->x+1,(sum,b) -> { return sum+b; }) ); System.out.println(integerTwo); //20
// reducing还可以用于更复杂的累计计算,不局限于加减乘除等操作 Integer integerThree = integerList.stream().collect( Collectors.reducing(1,x->x+1,(result,b) -> { return result*b; }) ); System.out.println(integerThree); // 3*4*6*7=504
|
22、groupingBy 分组
groupingBy
分组这个功能在实际开发中用的非常多,因此有必须要好好用一下,它也是存在于Collectors
类中的。来看一下这个Collectors.groupingBy
方法的源码,它有三个重载方法,这里就以只有一个参数的方法为例进行说明:
1 2 3 4
| public static <T, K> Collector<T, ?, Map<K, List<T>>> groupingBy(Function<? super T, ? extends K> classifier) { return groupingBy(classifier, toList()); }
|
可以发现它的参数只有一个:Function<? super T, ? extends K> classifier
,类型是Function类型也就是个函数,Function的返回值可以是要分组的条件,或者是要分组的字段。groupingBy
方法的返回的结果是一个Map,其中key的数据类型为Function体中的计算类型(也就是参数类型),value是List类型也就是分组的结果。
接下来通过一个例子来介绍如何使用它,这个例子也非常简单,给定[1,2,3,4,5,6,7,8,9]
这个列表,如何将其按照奇数和偶数来划分为两组。用以往的知识你可能会这样操作:
1 2 3 4 5 6 7 8 9 10 11
| List<Integer> oneList = new ArrayList<>(); //奇数列表 List<Integer> twoList = new ArrayList<>(); //偶数列表 for(Integer item:integerList){ if(item%2==0){ twoList.add(item); }else { oneList.add(item); } } System.out.println(oneList); // [1, 3, 5, 7, 9] System.out.println(twoList); // [2, 4, 6, 8]
|
但是如果你使用了stream那就变得简单多了:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
| //方法二,使用stream Map<Boolean, List<Integer>> resultMap = integerList.stream().collect( Collectors.groupingBy(item -> item%2 ==0) ); System.out.println(resultMap); // {false=[1, 3, 5, 7, 9], true=[2, 4, 6, 8]}
Map<Boolean, List<Integer>> twoPartition = integerList.stream().collect( Collectors.partitioningBy(item -> item%2 ==0) ); System.out.println(twoPartition); //twoPartition就是将结果为为两组
//还可以自定义分组的条件 List<Student> studentList = Arrays.asList( new Student("book",100L,1), new Student("movie",90L,2), new Student("fruit",80L,2), new Student("vegetable",70L,4) ); //根据某个字段进行分组 Map<Integer,List<Student>> studentMap = studentList.stream().collect( Collectors.groupingBy(item ->item.getId()) ); System.out.println(studentMap); //{1=[Student{name='book', score=100}], 2=[Student{name='movie', score=90}, Student{name='fruit', score=80}], 4=[Student{name='vegetable', score=70}]}
//还可以结合前面的统计结果处理器来对结果进行分析 Map<Integer, LongSummaryStatistics> summaryStatisticsMap = studentList.stream().collect( Collectors.groupingBy( Student::getId, Collectors.summarizingLong(Student::getScore) ) );
LongSummaryStatistics statisticsOne = summaryStatisticsMap.get(1); LongSummaryStatistics statisticsTwo = summaryStatisticsMap.get(2);
System.out.println(statisticsOne.getMax()); //100 System.out.println(statisticsOne.getMin()); //100 System.out.println(statisticsOne.getAverage()); //100.0 System.out.println(statisticsOne.getCount()); //1 System.out.println(statisticsOne.getSum()); //100.0
System.out.println("*********"); System.out.println(statisticsTwo.getMax()); //90 System.out.println(statisticsTwo.getMin()); //80 System.out.println(statisticsTwo.getAverage()); //85.0 System.out.println(statisticsTwo.getCount()); //2 System.out.println(statisticsTwo.getSum()); //170 }
|
上面基本上把日常开发过程中可能会遇到的场景都进行了介绍,但是我觉得这是做了第一步如何使用它,后续会出一些文章来好好研究里面的源码,同时会对上面的一些方法进行更深层次的研究和使用。