23. 迭代器
一、什么是迭代器
迭代器 指的是迭代取值的工具,迭代是一个重复的过程,每次重复都是基于上一次的结果而继续的,单纯的重复并不是重复。迭代器是用来迭代取值的工具,而涉及到把多个值循环取出的数据类型有:列表、字符串、元组、字典、集合、打开的文件对象等。
我们可以通过 while 循环的方式取值,这种取值方式只适用于有索引的数据类型,如:列表、字符串、元组等。
names = ["Sakura","Mikoto","Shana"]
i = 0
while i < len(names):
print(names[i])
i += 1
为了解决基于索引迭代器取值的局限性,Python 需要提供一种能够不依赖索引的取值方式,这就是迭代器。在 Python 中,但凡是内置有 __iter__()
方法的对象都称为 可迭代对象。在 Python 中,列表、字符串、元组、字典、集合、打开的文件对象等都内置了 __iter__()
方法。调用可迭代对象的 __iter__()
方法会将其转换成迭代器对象。转换为迭代器对象后,我们可以通过 __next__()
方法获取迭代器对象的下一个值。
names = ["Sakura", "Mikoto", "Shana"]
iterator = person.__iter__()
print(iterator)
print(type(iterator), end="\n\n")
while True:
try:
print(iterator.__next__())
except StopIteration:
break
names = ["Sakura", "Mikoto", "Shana"]
iterator = iter(names)
print(iterator)
print(type(iterator), end="\n\n")
while True:
try:
print(next(iterator))
except StopIteration:
break
如果我们迭代到最后一项,再调用
__next__()
方法或next()
方法会抛出 StopIteration 异常;
迭代器对象 是指内置有 __next__()
方法和 __iter__()
方法的对象。调用迭代器对象的 __next__()
方法将得到迭代器对象的下一个值。调用迭代器对象的 __iter__()
方法将得到迭代器的本身,与没调用该方法一样。
person = {"name":"Sakura","age":10}
iterator = iter(person)
print(iterator is iterator.__iter__() is iterator.__iter__().__iter__())
如果我们想判断某一个数据类型或对象是否可以迭代,我们可以使用 collections 模块来判断;
from collections.abc import Iterable, Iterator
data = "Sakura"
print("可迭代对象-字符串:", isinstance(data, Iterable))
print("迭代器-字符串:", isinstance(data, Iterator))
print()
data = ["Sakukra", "Mikoto", "Shana"]
print("可迭代对象-列表:", isinstance(data, Iterable))
print("迭代器-列表:", isinstance(data, Iterator))
print()
data = ("Sakukra", "Mikoto", "Shana")
print("可迭代对象-元组:", isinstance(data, Iterable))
print("迭代器-元组:", isinstance(data, Iterator))
print()
data = {"Sakukra", "Mikoto", "Shana"}
print("可迭代对象-集合:", isinstance(data, Iterable))
print("迭代器-集合:", isinstance(data, Iterator))
print()
data = {"name": "Sakura", "age": 10}
print("可迭代对象-字典:", isinstance(data, Iterable))
print("迭代器-字典:", isinstance(data, Iterator))
print()
from collections.abc import Iterable, Iterator
class People:
def __init__(self):
self.container = []
people = People()
print("可迭代对象:", isinstance(people, Iterable))
print("迭代器:", isinstance(people, Iterator))
二、自定义迭代器
只要在类中定义 __iter__()
方法,那么这个类创建出来的对象一定是可迭代的。通俗的说:一个具备了 __iter__()
方法的对象,就是一个可迭代对象。
from collections.abc import Iterable, Iterator
class People:
def __init__(self):
self.container = []
def __iter__(self):
pass
people = People()
print(isinstance(people, Iterable))
print("迭代器:", isinstance(people, Iterator))
如果想实现自定义迭代器的话,除了在类中定义 __iter__()
方法还需要在类中再定义 __next__()
方法,即一个实现了 __iter__()
方法和 __next__()
方法的对象,就是迭代器。
from collections.abc import Iterable, Iterator
class People:
def __init__(self):
self.container = []
def add(self, name):
self.container.append(name)
def __iter__(self):
# 这个方法有两个功能:
# 1.标记用当前类创建出来的对象是一定是可迭代对下个你
# 2.当调用iter()函数时,这个方法会被自动调用,返回的自己指定的那个迭代器
return MyIterator(self)
class MyIterator:
def __init__(self, obj):
self.obj = obj
self.current = 0
def __iter__(self):
pass
def __next__(self):
# 这个方法有两个功能:
# 1.标记当前类创建的对象(一定有__iter__()方法)一定是迭代器
# 2.当调用next()函数时,这个方法会自动调用,它返回一个数据
if self.current < len(self.obj.container):
item = self.obj.container[self.current]
self.current += 1
return item
else:
raise StopIteration
people = People()
print("People-可迭代对象:", isinstance(people, Iterable))
print("People-迭代器:", isinstance(people, Iterator))
print()
iterator = MyIterator(people)
print("MyIterator-可迭代对象:", isinstance(iterator, Iterable))
print("MyIterator-迭代器:", isinstance(iterator, Iterator))
print()
people.add("Sakura")
people.add("Mikoto")
people.add("Shana")
for item in people:
print(item)
for 循环是一个已经实现的功能,它里面自带了 iter()、next() 方法,并且带有 StopIteration 异常判断,通过这个异常判断来决定是否还需要获取迭代器对象。如果自己规定用 None 来表示数据获取完毕,但是 for 循环的代码依然用的是异常处理,所以 for 循环会产生死循环。
from collections.abc import Iterable, Iterator
class People:
def __init__(self):
self.container = []
self.current = 0
def add(self, name):
self.container.append(name)
def __iter__(self):
# 这个方法有两个功能:
# 1.标记用当前类创建出来的对象是一定是可迭代对下个你
# 2.当调用iter()函数时,这个方法会被自动调用,返回的自己指定的那个迭代器
return self
def __next__(self):
# 这个方法有两个功能:
# 1.标记当前类创建的对象(一定有__iter__()方法)一定是迭代器
# 2.当调用next()函数时,这个方法会自动调用,它返回一个数据
if self.current < len(self.container):
item = self.container[self.current]
self.current += 1
return item
else:
self.current = 0
raise StopIteration
people = People()
people.add("Sakura")
people.add("Mikoto")
people.add("Shana")
for item in people:
当对一个可迭代对象调用 iter() 方法时,它会自动调用这个可迭代对象的
__iter__()
方法,这个方法返回的对象当做迭代器;当对一个迭代器对象i调用 next() 方法时,它会自动调用这个迭代器对象的
__next__()
方法,这个方法返回想要的那个数据;