Python File readlines() 方法（手把手讲解）

什么是 Python File readlines() 方法？

在 Python 中处理文件时，读取文件内容是常见的操作。而 readlines() 方法，正是我们读取文本文件内容时最常用的工具之一。它能够一次性将文件的每一行读取为一个字符串，并存储在一个列表中，方便后续处理。

想象一下，你有一本厚厚的日记本，每一页记录着一天的心情。如果你要逐页翻阅并整理内容，readlines() 就像是把整本日记的每一页都摘录下来，放进一个文件夹里，方便你随时查看和分析。这个“文件夹”就是 Python 中的列表，而“每一页”就是文件中的一行文本。

readlines() 方法的语法非常简单：

file.readlines()

它返回的是一个字符串列表，每个元素对应文件中的一行内容，包括换行符 \n。这个特性在需要逐行处理文本数据时非常有用，比如日志分析、配置文件读取、数据清洗等。

readlines() 方法的基本用法

让我们从一个简单的例子开始。假设你有一个名为 example.txt 的文本文件，内容如下：

这是第一行。
这是第二行。
这是第三行。
这是第四行。

我们来用 readlines() 方法读取这个文件的内容：

with open('example.txt', 'r', encoding='utf-8') as file:
    # 使用 readlines() 读取所有行，返回一个列表
    lines = file.readlines()

print(lines)

输出结果为：

['这是第一行。\n', '这是第二行。\n', '这是第三行。\n', '这是第四行。\n']

可以看到，每一行都被当作列表中的一个元素，而且末尾还保留了换行符 \n。这个细节很重要，因为如果你后续要进行字符串处理或拼接，可能会因为多余的换行符而产生意外的结果。

💡 小提示：with 语句是 Python 中推荐的文件操作方式，它能自动关闭文件，避免忘记关闭导致资源泄漏。

处理换行符：去除 \n 的常见方法

在上一个例子中，我们发现 readlines() 保留了每行末尾的换行符。这在某些场景下可能不是我们想要的。比如你想统计每行的字符数，或者将这些行合并成一段完整的文本。

这时，我们可以使用 strip() 方法来去除首尾的空白字符，包括换行符：

with open('example.txt', 'r', encoding='utf-8') as file:
    lines = file.readlines()

clean_lines = [line.strip() for line in lines]

print(clean_lines)

输出结果为：

['这是第一行。', '这是第二行。', '这是第三行。', '这是第四行。']

这样就得到了干净的文本行，没有多余的换行符了。

📌 说明：strip() 方法会移除字符串开头和结尾的空白字符，包括空格、制表符和换行符。它比直接使用 replace('\n', '') 更安全，因为它能处理多种空白字符。

逐行处理数据：常见应用场景

readlines() 最大的优势在于它能一次性把所有行读入内存，方便我们进行后续的遍历和处理。这在处理中小型文件时效率很高。

场景一：统计文件行数

with open('example.txt', 'r', encoding='utf-8') as file:
    lines = file.readlines()

line_count = len(lines)

print(f"文件共有 {line_count} 行。")

场景二：筛选特定内容

假设你想找出所有包含“第三行”的行：

with open('example.txt', 'r', encoding='utf-8') as file:
    lines = file.readlines()

for i, line in enumerate(lines):
    if '第三行' in line:
        print(f"第 {i + 1} 行包含关键词：{line.strip()}")

输出结果：

第 3 行包含关键词：这是第三行。

场景三：合并所有行成一段文本

with open('example.txt', 'r', encoding='utf-8') as file:
    lines = file.readlines()

content = ''.join(lines)

print(content)

输出结果：

这是第一行。
这是第二行。
这是第三行。
这是第四行。

与 read() 和 readline() 的对比

为了更深入理解 readlines()，我们不妨和另外两个读取方法做个对比。

方法	返回值	适用场景	是否推荐
`read()`	整个文件内容（字符串）	读取小文件，整体处理	适合小文件
`readline()`	一行内容（字符串）	逐行读取，控制读取过程	适合大文件
`readlines()`	所有行组成的列表	需要逐行处理，频繁访问	适合中等大小文件

read() 会把整个文件读进一个大字符串，适合内容不多的文件。
readline() 每次只读一行，适合大文件，避免内存溢出。
readlines() 把所有行存进列表，适合需要多次访问或按索引操作的场景。

⚠️ 注意：如果文件非常大（比如几 GB），使用 readlines() 可能会导致内存占用过高，建议改用 readline() 或逐行遍历。

实际案例：读取配置文件

假设你有一个配置文件 config.txt，内容如下：

host=localhost
port=8080
debug=true
timeout=30

你可以用 readlines() 读取并解析这些配置项：

with open('config.txt', 'r', encoding='utf-8') as file:
    lines = file.readlines()

config = {}

for line in lines:
    line = line.strip()  # 去除首尾空白
    if line and '=' in line:  # 确保不是空行且包含等号
        key, value = line.split('=', 1)  # 以第一个等号分割
        config[key] = value

print(config)

输出结果：

{'host': 'localhost', 'port': '8080', 'debug': 'true', 'timeout': '30'}

这个例子展示了 readlines() 在实际项目中的强大实用性，尤其适合处理结构化的文本配置。

常见错误与注意事项

在使用 readlines() 时，有几个常见问题需要特别注意：

文件路径错误：确保文件路径正确，尤其是相对路径。建议使用绝对路径或 os.path 模块辅助处理。
编码问题：如果文件是 UTF-8 编码，必须显式指定 encoding='utf-8'，否则可能报错或出现乱码。
大文件内存问题：如前所述，大文件使用 readlines() 会加载全部内容到内存，可能导致程序卡顿甚至崩溃。
换行符处理不一致：不同操作系统换行符不同（Windows 是 \r\n，Unix 是 \n），readlines() 会自动处理，但如果你手动处理字符串，需注意这一点。

总结：掌握 Python File readlines() 方法

readlines() 方法是 Python 文件操作中的一个核心工具，它让读取和处理文本文件变得简单高效。无论是读取日志、解析配置，还是做数据清洗，它都能派上用场。

通过本篇文章，你已经学会了：

如何使用 readlines() 读取文件内容
如何处理换行符
如何在实际项目中应用该方法
如何与其他读取方式做对比选择

记住：没有“最好”的方法，只有“最合适”的方法。对于小文件，readlines() 是高效且直观的选择；对于大文件，建议使用逐行读取的方式。

掌握 readlines()，你就掌握了 Python 文件处理的“钥匙”。从今天开始，尝试在你的项目中使用它，让文本处理变得更简单、更优雅。