Python iter() 函数（完整教程）

Python iter() 函数：理解迭代器的起点

在 Python 中，iter() 函数是所有迭代操作的起点。它看似简单，却承载着 Python 高效处理数据的核心机制——迭代器协议。如果你曾用 for 循环遍历列表、字符串，甚至自定义类的对象，背后都离不开 iter() 的默默支持。

想象一下，你去图书馆借书。图书馆的书架是“可迭代”的，你不能一次性拿走所有书，但可以一本一本拿。Python 的 for 循环就像你的借书流程，而 iter() 就是那张借书卡的“激活凭证”——它告诉你：“现在可以开始借了”。

今天，我们就从最基础的用法开始，一步步揭开 iter() 函数的神秘面纱，让你真正理解 Python 是如何“优雅地”处理数据流的。

什么是迭代器？iter() 函数如何启动它

在 Python 中，任何可以被 for 循环遍历的对象，都叫做“可迭代对象”（Iterable）。比如列表、字符串、元组、字典、集合等。但这些对象本身并不直接“输出”元素，它们需要一个“中间人”来逐个取出数据——这个中间人就是“迭代器”（Iterator）。

iter() 函数的作用，就是将一个可迭代对象转换为一个迭代器。

my_list = [1, 2, 3, 4, 5]

my_iter = iter(my_list)

print(type(my_iter))  # <class 'list_iterator'>

注释：iter() 接收一个可迭代对象（如列表），返回一个迭代器对象。这个迭代器对象拥有 __next__() 方法，用于逐个获取元素。

你可以把 iter() 想象成“打开一个数据盒的开关”——它不直接给你内容，但让你可以按顺序一个一个地拿出来。

使用 next() 配合 iter() 实现手动遍历

iter() 返回的迭代器对象，最核心的方法是 __next__()（通常通过 next() 函数调用）。每次调用，都会返回下一个元素，直到没有更多元素时抛出 StopIteration 异常。

numbers = [10, 20, 30]
iterator = iter(numbers)

print(next(iterator))  # 输出 10
print(next(iterator))  # 输出 20
print(next(iterator))  # 输出 30

注释：next(iterator) 会调用迭代器的 __next__() 方法。当所有元素取完后，__next__() 会抛出 StopIteration，表示“数据已耗尽”。这是 Python 迭代机制的底层设计。

这个机制非常关键：它让 for 循环能自动处理“何时停止”，你只需关心“如何处理每个元素”。

iter() 与 for 循环的底层关系

你可能一直用 for 循环，却不知道它内部其实做了什么。其实，for 循环的执行流程，就是 iter() + next() + 异常捕获的组合。

data = ['a', 'b', 'c']

iterator = iter(data)

while True:
    try:
        item = next(iterator)
        print(item)  # 输出 a, b, c
    except StopIteration:
        break  # 停止循环

注释：这段代码完全等价于 for item in data: print(item)。for 循环本质上就是这样一个 try-except 的循环结构，iter() 是它的起点。

所以，iter() 函数是 Python 实现“懒加载”和“高效内存使用”的关键。它不一次性加载全部数据，而是按需获取，特别适合处理大数据或无限序列。

自定义类支持 iter()：实现可迭代对象

你可以让自己的类变成可迭代对象，只要实现 __iter__() 方法。这个方法必须返回一个迭代器对象。

class CountDown:
    def __init__(self, start):
        self.start = start

    def __iter__(self):
        # 返回一个迭代器对象
        return self

    def __next__(self):
        # 每次调用返回下一个值
        if self.start <= 0:
            raise StopIteration
        self.start -= 1
        return self.start + 1  # 返回当前值，从 start 开始递减

countdown = CountDown(3)

iter_count = iter(countdown)

for num in iter_count:
    print(num)  # 输出 3, 2, 1

注释：__iter__() 返回 self，意味着实例本身是迭代器。__next__() 实现了“每次减 1”的逻辑。当 start <= 0 时抛出 StopIteration，表示结束。

这个例子展示了 iter() 的强大——它不限于内置类型，还能用于你自定义的逻辑流程，比如倒计时、文件行读取、数据流处理等。

iter() 的第二个参数：实现“默认值”机制

iter() 还支持第二个可选参数，这在处理“文件读取”“网络流”等场景特别有用。

with open('example.txt', 'r', encoding='utf-8') as file:
    # iter(file.readline, '') 会不断调用 readline，直到返回空字符串 ''
    for line in iter(file.readline, ''):
        print(line.strip())

注释：iter(func, sentinel) 是 iter() 的高级用法。它会不断调用 func()，直到返回值等于 sentinel（哨兵值）为止。这里 sentinel 是空字符串 ''，表示读到空行或文件末尾时停止。

这个技巧非常实用：它把“读取直到条件满足”变成一行简洁代码，避免了手动写 while True 和 if 判断。

常见误区与最佳实践

误区一：iter() 会复制数据

很多人以为 iter() 会把整个列表复制一遍，其实不是。它只创建一个“指针”对象，指向原始数据的起始位置。内存开销极小。

误区二：迭代器只能用一次

这是正确的。一旦迭代器耗尽，就不能重用。如果需要再次遍历，必须重新调用 iter()。

data = [1, 2, 3]
it = iter(data)

print(list(it))  # [1, 2, 3]
print(list(it))  # [] —— 为空，因为已经耗尽

正确做法：如果需要多次遍历，不要用 iter()，直接用原始可迭代对象。

最佳实践：优先使用 for 循环，但理解底层

for 循环是最推荐的写法。只有在需要手动控制迭代过程（如跳过某些元素、提前终止、调试）时，才考虑使用 iter() + next()。

结语

Python iter() 函数 是理解 Python 迭代机制的钥匙。它不仅是 for 循环的幕后英雄，更是构建高效、内存友好的程序的核心工具。

从列表到文件，从自定义类到无限序列，iter() 让我们能以统一的方式处理各种数据流。掌握它，意味着你真正理解了 Python 的“迭代哲学”——不一次性加载全部数据，而是按需获取，高效又灵活。

下次当你写一个 for 循环时，不妨想一想：它背后，是 iter() 悄悄为你打开的那扇门。