61、迭代器模式(上)
迭代器模式:用来遍历集合对象,不过很多编程语言都将迭代器作为一个基础的类库,直接提供出来了
在平时开发中,特别是业务开发,我们直接使用即可,很少会自己去实现一个迭代器
知其然知其所以然,弄懂原理能帮助我们更好的使用这些工具类,所以还是有必要学习一下这个模式
我们知道,大部分编程语言都提供了多种遍历集合的方式,比如 for 循环、foreach 循环、迭代器等
所以今天我们除了讲解迭代器的原理和实现之外,还会重点讲一下,相对于其他遍历方式,利用迭代器来遍历集合的优势
1、迭代器模式的原理和实现
迭代器模式(Iterator Design Pattern),也叫作游标模式(Cursor Design Pattern)
在开篇中我们讲到,它用来遍历集合对象
这里说的 "集合对象" 也可以叫 "容器、聚合对象",实际上就是包含一组对象的对象,比如数组、链表、树、图、跳表
迭代器模式将集合对象的遍历操作从集合类中拆分出来,放到迭代器类中,让两者的职责更加单一
迭代器是用来遍历容器的,所以一个完整的迭代器模式一般会涉及容器和容器迭代器两部分内容
为了达到基于接口而非实现编程的目的,容器又包含容器接口、容器实现类,迭代器又包含迭代器接口、迭代器实现类
1.1、代码
开篇中我们有提到,大部分编程语言都提供了遍历容器的迭代器类,我们在平时开发中,直接拿来用即可,几乎不大可能从零编写一个迭代器
不过这里为了讲解迭代器的实现原理,我们假设某个新的编程语言的基础类库中,还没有提供线性容器对应的迭代器,需要我们从零开始开发
现在我们一块来看具体该如何去做
线性数据结构包括数组和链表,在大部分编程语言中都有对应的类来封装这两种数据结构,在开发中直接拿来用就可以了
假设在这种新的编程语言中,这两个数据结构分别对应 ArrayList 和 LinkedList 两个类
除此之外,我们从两个类中抽象出公共的接口,定义为 List 接口,以方便开发者基于接口而非实现编程,编写的代码能在两种数据存储结构之间灵活切换
现在我们针对 ArrayList 和 LinkedList 两个线性容器,设计实现对应的迭代器
按照之前给出的迭代器模式的类图,我们定义一个迭代器接口 Iterator,以及针对两种容器的具体的迭代器实现类 ArrayIterator 和 ListIterator,我们先来看下 Iterator 接口的定义
// 接口定义方式一 public interface Iterator<E> { // 询问当前位置是否有元素存在, 存在返回 true, 不存在返回 false boolean hasNext(); void next(); E currentItem(); } // 接口定义方式二 public interface Iterator<E> { // 询问当前位置是否有元素存在, 存在返回 true, 不存在返回 false boolean hasNext(); E next(); }
Iterator 接口有两种定义方式
- 在第一种定义中:next() 函数用来将游标后移一位元素,currentItem() 函数用来返回当前游标指向的元素
- 在第二种定义中:返回当前元素与后移一位这两个操作,要放到同一个函数 next() 中完成
第一种定义方式更加灵活一些,比如我们可以多次调用 currentItem() 查询当前元素,而不移动游标,所以在接下来的实现中,我们选择第一种接口定义方式
我们再来看下 ArrayIterator 的代码实现,具体如下所示,代码实现非常简单,不需要太多解释,你可以结合着我给出的 demo,自己理解一下
Iterator
public interface Iterator<E> { // 询问当前位置是否有元素存在, 存在返回 true, 不存在返回 false boolean hasNext(); void next(); E currentItem(); } public class ArrayIterator<E> implements Iterator<E> { private int cursor; // 光标 private ArrayList<E> arrayList; public ArrayIterator(ArrayList<E> arrayList) { this.cursor = 0; this.arrayList = arrayList; } @Override public boolean hasNext() { return cursor < arrayList.size(); // 注意这里, cursor 在指向最后一个元素的时候, hasNext() 仍旧返回 true } @Override public void next() { cursor++; } @Override public E currentItem() { if (cursor >= arrayList.size()) { throw new NoSuchElementException(); } return arrayList.get(cursor); } }
ArrayList
public interface List<E> { Iterator iterator(); // ... 省略其他接口函数 ... } public class ArrayList<E> implements List<E> { // ... private java.util.ArrayList<E> list; public ArrayList() { list = new java.util.ArrayList<>(); } public void add(E e) { list.add(e); } public E remove(int index) { return list.remove(index); } public E get(int index) { return list.get(index); } public int size() { return list.size(); } public Iterator<E> iterator() { return new ArrayIterator<>(this); } // 省略其他代码 ... }
Demo
public class Demo { public static void main(String[] args) { ArrayList<String> names = new ArrayList<>(); names.add("xzg"); names.add("wang"); names.add("zheng"); Iterator<String> iterator = names.iterator(); while (iterator.hasNext()) { System.out.println(iterator.currentItem()); iterator.next(); } } }
对于 LinkedIterator,它的代码结构跟 ArrayIterator 完全相同,我这里就不给出具体的代码实现了,你可以参照 ArrayIterator 自己去写一下
1.2、总结
结合刚刚的例子,我们来总结一下迭代器的设计思路
总结下来就三句话:迭代器中需要定义 hasNext()、currentItem()、next() 三个最基本的方法
待遍历的容器对象通过依赖注入传递到迭代器类中,容器通过 iterator() 方法来创建迭代器
2、迭代器模式的优势
一般来讲,遍历集合数据有三种方法:for 循环、foreach 循环、iterator 迭代器,对于这三种方式,我拿 Java 语言来举例说明一下
List<String> names = new ArrayList<>(); names.add("xzg"); names.add("wang"); names.add("zheng"); // 第一种遍历方式: for 循环 for (int i = 0; i < names.size(); i++) { System.out.println(names.get(i)); } // 第二种遍历方式: foreach 循环 for (String name : names) { System.out.println(name); } // 第三种遍历方式: 迭代器遍历 Iterator<String> iterator = names.iterator(); while (iterator.hasNext()) { System.out.println(iterator.next()); // Java 中的迭代器接口是第二种定义方式, next() 既移动游标又返回数据 }
实际上 foreach 循环只是一个语法糖而已,底层是基于迭代器来实现的
也就是说,上面代码中的第二种遍历方式(foreach 循环代码)的底层实现,就是第三种遍历方式(迭代器遍历代码)
这两种遍历方式可以看作同一种遍历方式,也就是迭代器遍历方式
从上面的代码来看,for 循环遍历方式比起迭代器遍历方式,代码看起来更加简洁,那我们为什么还要用迭代器来遍历容器呢,为什么还要给容器设计对应的迭代器呢
- 首先:对于类似数组和链表这样的数据结构,遍历方式比较简单,直接使用 for 循环来遍历就足够了
但对于复杂的数据结构(比如树、图)来说,有各种复杂的遍历方式,比如:树有前中后序、按层遍历,图有深度优先、广度优先遍历等等
如果由客户端代码来实现这些遍历算法,势必增加开发成本,而且容易写错,如果将这部分遍历的逻辑写到容器类中,也会导致容器类代码的复杂性
前面也多次提到,应对复杂性的方法就是拆分,我们可以将遍历操作拆分到迭代器类中
比如针对图的遍历,我们就可以定义 DFSIterator、BFSIterator 两个迭代器类,让它们分别来实现深度优先遍历和广度优先遍历 - 其次:将游标指向的当前位置等信息,存储在迭代器类中,每个迭代器独享游标信息
这样我们就可以创建多个不同的迭代器,同时对同一个容器进行遍历而互不影响 - 最后:容器和迭代器都提供了抽象的接口,方便我们在开发的时候,基于接口而非具体的实现编程
当需要切换新的遍历算法的时候,比如:从前往后遍历链表切换成从后往前遍历链表
客户端代码只需要将迭代器类从 LinkedIterator 切换为 ReversedLinkedIterator 即可,其他代码都不需要修改
除此之外,添加新的遍历算法,我们只需要扩展新的迭代器类,也更符合开闭原则
本文来自博客园,作者:lidongdongdong~,转载请注明原文链接:https://www.cnblogs.com/lidong422339/p/17538549.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步