Java 实例 – 获取目录大小（手把手讲解）

Java 实例 – 获取目录大小：从零开始掌握文件系统操作

在日常开发中，我们经常需要对文件或目录进行操作，比如备份、清理、监控磁盘使用情况等。其中，“获取目录大小”是一个非常实用的功能，尤其在处理日志文件、缓存目录或用户上传资源时，显得尤为重要。

想象一下，你正在开发一个图片管理系统，用户上传的照片越来越多，系统需要定期检查某个用户目录是否占用过多空间。这时候，能准确获取目录大小，就相当于给系统装上了一双“眼睛”，能实时看到数据的“体积”变化。

今天我们就来手把手教你如何用 Java 实现这个功能。这不是简单的“打印文件名”那种小任务，而是一个涉及递归、IO 流、路径处理的综合实践。通过这个 Java 实例 – 获取目录大小，你不仅能学到具体代码，还能理解背后的设计思想。

文件系统与目录大小的本质

在开始编码之前，先搞清楚“目录大小”到底意味着什么。

一个目录本身不占用太多空间（通常只有几 KB），但它里面包含的所有文件、子目录加起来的总大小，才是我们真正关心的。这就像一个大行李箱：箱子本身很轻，但装满衣服、书本、电器后，总重量就变得很可观。

所以，获取目录大小的核心任务是：递归遍历目录下的所有文件和子目录，累加每个文件的大小。

Java 提供了 java.nio.file 包（从 Java 7 开始引入），它比旧的 java.io.File 更强大、更高效。我们将使用 Path 和 Files 类来完成这项工作。

使用 Files.walkFileTree 递归遍历目录

Java 提供了一个非常优雅的工具类：Files.walkFileTree。它允许你以树形结构遍历文件系统，同时支持对每个文件或目录执行自定义逻辑。

让我们先看一个基础示例：

import java.io.IOException;
import java.nio.file.*;
import java.util.concurrent.atomic.AtomicLong;

public class DirectorySizeCalculator {

    public static void main(String[] args) {
        // 指定要查询的目录路径
        String directoryPath = "/Users/yourname/Documents";

        // 使用 AtomicLong 来安全地累加文件大小（多线程场景下推荐）
        AtomicLong totalSize = new AtomicLong(0);

        try {
            // walkFileTree 方法会递归遍历整个目录树
            // 第一个参数：起始路径
            // 第二个参数：FileVisitor 实现类，用于处理每个文件/目录
            Files.walkFileTree(Paths.get(directoryPath), new SimpleFileVisitor<Path>() {
                @Override
                public FileVisitResult visitFile(Path file, BasicFileAttributes attrs) {
                    // 当访问到一个文件时，累加其大小
                    // attrs.size() 返回文件大小（字节）
                    totalSize.addAndGet(attrs.size());
                    return FileVisitResult.CONTINUE; // 继续遍历
                }

                @Override
                public FileVisitResult preVisitDirectory(Path dir, BasicFileAttributes attrs) {
                    // 在访问目录之前调用，可以做预处理
                    return FileVisitResult.CONTINUE;
                }

                @Override
                public FileVisitResult visitFileFailed(Path file, IOException exc) {
                    // 如果访问某个文件失败（如权限不足），可以记录日志
                    System.err.println("无法访问文件: " + file + "，错误: " + exc.getMessage());
                    return FileVisitResult.CONTINUE;
                }
            });

            // 输出最终结果
            System.out.println("目录总大小: " + formatBytes(totalSize.get()));

        } catch (IOException e) {
            System.err.println("读取目录时发生错误: " + e.getMessage());
        }
    }

    // 工具方法：将字节数转换为易读格式（如 KB、MB、GB）
    private static String formatBytes(long bytes) {
        if (bytes < 1024) return bytes + " B";
        int unit = 1024;
        int exp = (int) (Math.log(bytes) / Math.log(unit));
        String[] units = new String[] {"B", "KB", "MB", "GB", "TB"};
        return String.format("%.2f %s", bytes / Math.pow(unit, exp), units[exp - 1]);
    }
}

代码解析（重点！）

Paths.get(directoryPath)：将字符串路径转换为 Path 对象，这是 NIO 的核心类型。
Files.walkFileTree(...)：递归遍历目录树，是实现“遍历所有子文件”的关键。
SimpleFileVisitor<Path>：一个抽象类，我们重写了其中的方法来响应不同事件。
visitFile：当访问到一个文件时触发，此时可以获取 attrs.size()，即文件字节数。
AtomicLong：用于安全累加，即使在多线程环境下也不会出现数据竞争问题。
formatBytes：将字节转换为可读格式（如 1.23 MB），提升用户体验。

💡 小贴士：如果你不熟悉 AtomicLong，可以把它想象成一个“共享计数器”，多个线程同时往里加数时也不会出错。

处理符号链接与权限问题

在实际环境中，目录可能包含符号链接（symlink）或权限受限的文件。walkFileTree 默认会跟随符号链接，这可能导致无限循环或访问错误。

我们可以添加一个选项来控制行为：

// 在 walkFileTree 调用时添加选项
Files.walkFileTree(Paths.get(directoryPath), EnumSet.of(FileVisitOption.FOLLOW_LINKS), 10, new SimpleFileVisitor<Path>() {
    // ...
});

EnumSet.of(FileVisitOption.FOLLOW_LINKS)：允许跟随符号链接。
第二个参数是最大递归深度（这里设为 10），防止无限嵌套。

如果你不希望跟随链接，可省略此参数，或使用 EnumSet.noneOf(FileVisitOption.class)。

此外，当遇到无权限访问的文件时，visitFileFailed 会触发，我们可以选择跳过或记录日志。

优化性能：避免频繁调用 BasicFileAttributes

每次调用 attrs.size() 都会触发一次系统调用。如果目录下有成千上万个文件，性能会下降。

一个更高效的方式是：只在必要时获取属性信息。例如，使用 Files.readAttributes() 显式获取，或结合 FileStore 查询磁盘使用率。

不过对于大多数应用来说，walkFileTree 已经足够高效。除非你处理的是几百万个文件的大型数据目录，否则无需过度优化。

实际应用场景举例

场景一：日志清理系统

假设你正在开发一个日志服务，每天生成大量日志文件。系统需要定期检查日志目录大小，若超过 1GB，则自动归档旧日志。

if (totalSize.get() > 1_000_000_000) {
    System.out.println("日志目录已超过 1GB，准备归档...");
    // 触发归档逻辑
}

场景二：用户空间监控

在云存储或网盘应用中，每个用户都有自己的存储目录。系统可以定时扫描目录大小，提醒用户“您已使用 95% 的空间”。

常见问题与解决方案

问题	原因	解决方案
目录大小为 0	路径不存在或无读权限	检查路径拼写，确认用户有读权限
程序卡死或崩溃	递归过深或符号链接循环	使用 `walkFileTree` 的深度限制参数
返回结果不准确	文件被其他进程占用	尽量在系统空闲时运行，或捕获异常
字节单位看不懂	未做格式化	使用 `formatBytes` 方法转换为 KB/MB

代码可复用封装建议

为了方便在多个项目中使用，建议将核心逻辑封装成工具类：

public class DirectoryUtils {

    public static long getDirectorySize(String path) {
        Path dirPath = Paths.get(path);
        if (!Files.exists(dirPath) || !Files.isDirectory(dirPath)) {
            throw new IllegalArgumentException("路径不存在或不是目录: " + path);
        }

        AtomicLong size = new AtomicLong(0);
        try {
            Files.walkFileTree(dirPath, new SimpleFileVisitor<Path>() {
                @Override
                public FileVisitResult visitFile(Path file, BasicFileAttributes attrs) {
                    size.addAndGet(attrs.size());
                    return FileVisitResult.CONTINUE;
                }

                @Override
                public FileVisitResult visitFileFailed(Path file, IOException exc) {
                    System.err.println("跳过文件: " + file + "，原因: " + exc.getMessage());
                    return FileVisitResult.CONTINUE;
                }
            });
        } catch (IOException e) {
            throw new RuntimeException("无法读取目录: " + path, e);
        }

        return size.get();
    }
}

使用时只需调用：

long size = DirectoryUtils.getDirectorySize("/path/to/dir");
System.out.println("大小: " + formatBytes(size));

这样既简洁，又提高了代码复用性。

总结

通过本篇内容，我们深入探讨了 Java 实例 – 获取目录大小的完整实现过程。从基础的 walkFileTree 递归遍历，到异常处理、性能优化、实际应用场景，再到封装建议，层层递进。

你已经掌握了：

如何使用 Path 和 Files 操作文件系统
如何递归遍历目录并累加文件大小
如何处理权限、符号链接等边界情况
如何将逻辑封装为可复用的工具方法

这些技能不仅适用于“获取目录大小”，更可迁移到文件搜索、备份系统、磁盘监控等更复杂的任务中。

记住，编程不是记住代码，而是理解“为什么这么写”。当你下次看到一个目录大小为 5.2 GB，你会知道：这背后是成千上万次 attrs.size() 的累加，是递归树的遍历，是 Java NIO 的强大支持。

动手试试吧，把这段代码跑起来，看看你电脑里的某个目录到底有多大。你会发现，原来数据的“重量”是可以被测量的。