Memcached 教程（手把手讲解）

什么是 Memcached？它为何在高并发场景中如此重要？

在构建现代 Web 应用时，性能优化是绕不开的话题。当你的网站访问量突然飙升，数据库响应变慢，页面加载卡顿，你可能会发现：真正拖垮系统的，往往不是代码逻辑，而是频繁读取数据库带来的压力。

这时候，一个轻量级、高效的缓存系统就显得尤为重要。Memcached 就是这样一位“幕后英雄”。它不是数据库，也不是消息队列，而是一个分布式的内存缓存系统。简单来说，它就像一个高速的临时存储柜，专门用来存放那些频繁被读取但不常变化的数据，比如用户登录状态、热门文章内容、配置信息等。

想象一下：你每天去便利店买咖啡，如果每次都要排队点单、等待制作，效率会很低。但如果便利店提前把常卖的几款咖啡放在柜台上，顾客直接拿走就能走，效率自然大幅提升。Memcached 就是这个“前置柜台”的技术实现。

与传统数据库相比，Memcached 的核心优势在于内存存储。数据直接存在内存中，读写速度比磁盘数据库快上百倍。而且它采用“键值对”（Key-Value）模型，结构简单，操作高效。无论是 PHP、Python、Java 还是 Node.js，几乎都能无缝集成。

本篇 Memcached 教程将带你从零开始，掌握它的安装、使用、原理和最佳实践，帮助你构建更快速、更稳定的系统。

安装与启动 Memcached 服务

在开始使用 Memcached 之前，我们需要先安装并启动服务。不同操作系统安装方式略有不同，这里以 Linux（Ubuntu/Debian）为例。

打开终端，执行以下命令：

sudo apt update

sudo apt install memcached -y

sudo apt install telnet -y

安装完成后，启动 Memcached 服务：

sudo systemctl start memcached

sudo systemctl enable memcached

sudo systemctl status memcached

注意：如果你在本地开发，可以使用 memcached -d -m 64 -p 11211 命令直接启动，-d 表示后台运行，-m 64 表示分配 64MB 内存。

验证 Memcached 是否正常运行，可以用 telnet 连接：

telnet localhost 11211

如果连接成功，你会看到：

Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.

此时，你已经进入 Memcached 的命令行交互模式，可以输入命令进行测试。

基本操作：增删改查（CRUD）详解

Memcached 的核心操作只有四个：set（设置）、get（获取）、delete（删除）、replace（替换）。这些命令都通过 Telnet 或客户端库调用。

下面通过实际例子演示如何操作：

set user:1001 0 60 5
Alice

命令解析：

set：设置操作
user:1001：键名，用于唯一标识数据
0：标志位（flag），可留空，用于存储额外信息
60：过期时间（秒），60 秒后自动失效
5：值的长度（字符数）
Alice：实际数据内容

提示：如果键已存在，set 会覆盖旧值；如果想只更新已存在的键，用 replace 命令。

获取数据：

get user:1001

返回结果：

VALUE user:1001 0 5
Alice
END

VALUE 开头表示成功返回数据
0 是标志位
5 是数据长度
Alice 是实际值
END 表示传输结束

删除数据：

delete user:1001

返回 DELETED 表示删除成功。

这些命令虽然简单，但却是构建高性能系统的基础。记住：缓存的命中率越高，系统性能越好。所以合理设计键名、设置合适的过期时间，至关重要。

使用编程语言连接 Memcached（以 Python 为例）

虽然 Telnet 可以测试，但生产环境必须用编程语言调用。这里以 Python 为例，展示如何连接 Memcached。

首先安装客户端库：

pip install python-memcached

然后编写代码：

import memcache

client = memcache.Client(['127.0.0.1:11211'], debug=0)

client.set('page:home', '<h1>Welcome to Homepage</h1>', time=300)

cached_html = client.get('page:home')

if cached_html:
    print("从缓存获取内容：", cached_html)
else:
    print("缓存未命中，需从数据库加载")

client.delete('page:home')

注释说明：

memcache.Client(['127.0.0.1:11211'])：连接本地 Memcached 服务

time=300：设置缓存 5 分钟后过期

get() 返回 None 表示未命中，需回源（如数据库）

这个例子展示了如何在 Web 应用中实现“缓存优先”策略：先查缓存，缓存没有再查数据库，最后把结果写入缓存。这种模式能极大减少数据库压力。

高级特性：分布式缓存与一致性哈希

随着业务增长，单台 Memcached 服务器可能无法承载全部缓存需求。这时，就需要部署多台 Memcached 实例，形成分布式集群。

但问题来了：如何决定某个键应该存到哪台机器上？直接哈希键名会带来“雪崩效应”——一旦新增或移除节点，几乎所有键的映射都会改变，导致缓存大量失效。

为了解决这个问题，Memcached 使用一致性哈希（Consistent Hashing）算法。简单理解，它把所有节点和键都映射到一个环形空间上，每个键只属于最近的顺时针节点。当新增节点时，只有部分键需要迁移，大大降低影响范围。

举个例子：
想象你有 4 个缓存服务器（A、B、C、D），它们按顺时针排列在圆环上。当你存一个键 user:1001，系统会计算它的哈希值，然后在环上顺时针找到第一个服务器，比如是 B。下次访问时，依然会找到 B，即使你加了新服务器 E，也只影响一小部分键。

这种设计让 Memcached 在扩展性上表现出色，是它被广泛采用的重要原因。

最佳实践与常见陷阱

在实际项目中，合理使用 Memcached 能显著提升性能，但若使用不当，也可能带来问题。

1. 合理设置过期时间
过期时间太短，缓存失效频繁，无法发挥效果；太长又可能导致数据不一致。建议根据数据更新频率设置，比如配置信息设为 300 秒，用户会话设为 1800 秒。

2. 避免缓存大对象
Memcached 每个键值对最大支持 1MB，且内存是有限的。不要缓存大文件或大数组，避免 OOM（内存溢出）。

3. 命名规范清晰
使用统一的命名前缀，如 user:, config:, page:，便于管理和排查问题。

4. 监控缓存命中率
通过 stats 命令查看命中率：

stats

重点关注 cmd_get（请求次数）和 get_hits（命中次数），命中率应尽量高于 90%。

5. 不要将 Memcached 当作持久化存储
缓存是临时的，重启服务后数据会丢失。切勿依赖它存储关键数据。

总结：Memcached 教程的最终价值

Memcached 虽然诞生已久，但依然是高并发系统中的重要一环。它轻量、高效、易用，特别适合处理“读多写少”的场景。

本篇 Memcached 教程从安装到实战，从原理到最佳实践，层层递进，帮助你真正理解并掌握这一关键技术。无论是初学者还是中级开发者，只要掌握“缓存优先”思想，就能在项目中快速提升性能。

记住：性能优化不是盲目加服务器，而是让系统更聪明地工作。而 Memcached，正是让系统变聪明的关键工具之一。