CAP原理缓存策略总结 | Felix’s Micro Space

type

date

slug

一、CAP 与缓存：为什么必须做权衡？

在分层系统（CPU↔内存↔磁盘，或软件缓存↔硬件状态）中，数据副本分布在不同层级，层级之间的通信链路可能中断、延迟或不可靠——这就是 P（Partition，分区）。

⚡

核心结论：P 是物理存在的，无法消除。因此缓存策略的本质就是在 C（Consistency，一致性/数据准确） 与 A（Availability，可用性/响应速度） 之间做权衡。

P 的具体表现：

Page Cache（DDR）与磁盘（NAND/SSD）之间：掉电 = 分区（DDR 中 dirty 数据与磁盘瞬间断联）

软件缓存与 Modbus 硬件状态之间：通信超时 = 分区

CPU Cache 与主内存之间：缓存行失效延迟 = 分区

二、读路径策略：谁负责回源？

读路径的核心问题：Cache Miss 时，由谁去后端加载数据？ 这个问题把读策略分成了两个阵营。

2.1 Cache-Aside（旁路缓存 / Lazy Loading）

缓存对调用方不透明——所有缓存逻辑（查缓存、回源、回填）均由调用方业务代码显式管理。

读：调用方先查 Cache → Miss → 调用方自行读 DB → 回填 Cache。

写：先写 DB → 成功后删除/失效 Cache（"Lazy" 更新，下次读时才重载）。

CAP 权衡：偏向 AP

优点	缺点
结构简单，数据模型灵活	读-写竞争：写 DB 后、删 Cache 前，其他线程可能读到脏数据
Cache 中仅包含热点数据，节约空间	无防击穿能力：N 个线程同时 Miss 同一 Key → 发出 N 次重复请求

应用场景：

应用开发：典型的 Redis + MySQL 架构。业务代码先查 Redis，Miss 则查 MySQL 并手动回填 Redis；写入时先更新 MySQL，再删除 Redis 对应 Key。适合读多写少、非强一致的 Web 服务。

Linux 内核：网络协议栈路由缓存，由网络子系统显式管理条目的添加与失效。

2.2 Read-Through（读穿）

与 Cache-Aside 形成鲜明对比：缓存对调用方完全透明。调用方只管向缓存发请求，缓存组件内部自动完成回源、回填。

读：调用方查 Cache → Miss → 由 Cache 组件自动读 DB → 更新 Cache → 返回（调用方无感知）。

写：通常配合 Write-Through 或 Write-Behind 使用。

CAP 权衡：CP 或 AP（取决于回源是否阻塞）

优点	缺点
调用方代码解耦：业务代码无需缓存管理逻辑，只需调用统一 API	首次读取延迟较高（Penetration）
防击穿（Singleflight）：10 线程同时 Miss → 只触发 1 次后端查询，其余 9 个等待结果

应用场景：

应用开发：封装带 TTL 的状态查询接口（如 get_device_status()）。内部自动判断缓存是否过期，过期则查询硬件/数据库并刷新缓存，外部调用者无需感知底层 IO。常见于 ORM 框架的 L2 Cache、CDN 回源机制。

Linux 内核：Page Cache 的读路径[2]。用户进程调用 read()，内核查 Page Cache，Miss 则触发文件系统读盘，进程睡眠等待数据就绪。

读路径对比

🔑

一句话区分：Cache-Aside 是"你自己去拿"，Read-Through 是"我帮你拿"。核心区别在于缓存管理逻辑的归属方。

	Cache-Aside	Read-Through
Miss 时谁回源	调用方（业务代码）	缓存组件自身
缓存对调用方	不透明，需显式管理	透明，只管读缓存
防击穿	❌ 无	✅ Singleflight 合并请求
代码复杂度	高（缓存逻辑散落在业务中）	低（统一 API）

三、写路径策略：一致性 vs 性能的三种选择

写路径围绕一个核心问题：写操作何时算"完成"？ 三种策略给出了从强一致到极致性能的完整谱系。

3.1 Write-Through（直写 / 写穿）— 强一致

写操作必须同步写入缓存和后端存储，两者都成功才算"写成功"。

CAP 权衡：强 CP（一致性优先）

优点	缺点
强一致性：Cache 和 Store 始终同步	写性能差：受限于慢速存储 IO
掉电安全：数据零丢失	后端挂则写失败（A 降低）

应用场景：

应用开发：工业控制系统中的关键指令（急停、阀门开合），必须确保硬件寄存器写入成功后才更新界面状态，确保显示的是"事实"而非"意图"。金融交易系统中的订单提交同理——必须等持久化确认后才返回成功。

Linux 内核：O_SYNC 标志 / sync 挂载模式。保证 write() 返回时数据已物理落盘，用于数据库日志（WAL）等场景。

3.2 Write-Back / Write-Behind（回写）— 极致性能

写操作更新缓存后立即返回，由后台线程异步批量同步到后端存储。

Writeback 线程触发条件（pdflush / flusher，新内核为 per-BDI writeback worker）：

触发条件	说明
定时唤醒	`dirty_writeback_interval`（默认 5s），flusher 周期性扫描
后台阈值	dirty page 占比超过 `dirty_background_ratio` → flusher 异步写回（进程不阻塞）
硬阈值	超过 `dirty_ratio` → 写进程本身被阻塞，强制同步写回，防止内存耗尽
显式调用	用户态 `sync()` / `fsync()` / `fdatasync()`
内存压力	kswapd 回收页面时触发 dirty page 写回

CAP 权衡：极致 AP（可用性/性能优先）

优点	缺点
写性能极高（内存级响应）	弱一致性
写合并（Coalescing）：多次写合并为一次 IO	掉电数据丢失风险（未 flush 的 dirty 数据）

应用场景：

Linux 内核：Page Cache 的默认写策略[2]。write() 瞬间完成，数据留在 RAM 中，flusher 线程稍后写盘。这是 Linux 文件 IO 高效的核心原因。

应用开发：高频传感器数据采集。先写入内存 Ring Buffer，后台线程每秒打包写入 SQLite 或通过网络上传。

3.3 Write-Around（绕写）— 防缓存污染

数据直接写入后端存储，不经过/不更新缓存。

CAP 权衡：C（一致性）

优点	缺点
防止缓存污染（Cache Pollution）	刚写完的数据立刻读 → Cache Miss
避免一次性数据挤占热点缓存空间

应用场景 — O_DIRECT 深度解析：

数据库（如 MySQL InnoDB）主动绕过内核 Page Cache，原因有三：

🔍

为什么绕过？

防缓存污染：大文件备份、全表扫描产生大量一次性数据，冲掉 Page Cache 中的热点页，导致其他进程性能骤降。

避免双重缓存：InnoDB 有自己的 Buffer Pool，再经 Page Cache 导致同一份数据在内存中存两份。

IO 时机可控：Page Cache 的 Write-Back 由内核 flusher 异步刷盘，数据库无法控制落盘时机，无法满足 ACID 中 Durability 的要求。

⚠️

绕过后的额外责任：使用 O_DIRECT 后，数据库必须自行承担：

自建缓存池：如 InnoDB Buffer Pool，自行管理 LRU 淘汰、预读、脏页刷写。

IO 对齐：地址和大小必须按磁盘扇区对齐（通常 512B 或 4KB），否则报错。

显式刷盘：配合 fsync() / fdatasync() 确保数据落盘，因为 O_DIRECT 只绕过 Page Cache，不保证数据已越过磁盘控制器写缓存。

应用开发：大文件上传/下载服务。文件流直接存盘，不通过应用层缓存对象。

写路径三策略对比

	Write-Through	Write-Back	Write-Around
写延迟	高（等磁盘 IO）	极低（内存级）	中（直接写磁盘）
掉电数据丢失	零	最近未 flush 的 dirty 数据	零
一致性	强	弱（异步延迟）	强
CAP 偏向	CP	AP	C
典型场景	`O_SYNC` / 急停指令	Page Cache / 传感器日志	`O_DIRECT` / 大文件

四、预测路径策略：Refresh-Ahead（预加载 / 预热）

在数据即将过期或被预测访问前，后台主动刷新缓存。这是唯一一个不依赖用户请求触发的策略。

CAP 权衡：AP（高可用）

优点	缺点
读延迟极低：用户永远读到热数据	预测不准时浪费带宽加载无用数据
避免 TTL 到期时的瞬间高延迟

Linux 内核 Readahead 机制详解[3]：

内核维护一个 readahead 窗口（ra_pages），自适应调整预读策略：

💡

关键行为：当访问模式从顺序读突然变为随机读时，内核立即缩小或关闭预读窗口，回退到按需加载，避免浪费 IO 带宽和污染 Page Cache。这正是 Refresh-Ahead 缺点的具体体现。

应用场景：

Linux 内核：Readahead 预读机制，大幅提升顺序读性能。

应用开发：后台定时轮询外部数据源（如 Modbus 设备状态、第三方 API 汇率），前端查询时直接返回内存中的最新值，实现近 0ms 响应。常见于监控仪表盘、实时行情展示。

五、总结选择指南

全局策略谱系

策略	路径	关键特征	CAP
Cache-Aside	读	业务代码手动管	AP
Read-Through	读	封装 IO，自动回源	CP/AP
Write-Through	写	写必落盘，强一致	CP
Write-Back	写	写内存即飞，极速	AP
Write-Around	写	绕过缓存，防污染	C
Refresh-Ahead	预测	后台预加载，0ms 读	AP

六、综合练习

练习 1：嵌入式项目策略选型

假设你在做一个嵌入式项目，需要同时处理以下三类数据。为每类数据选择最合适的缓存策略并说明理由：

数据类型	特征
急停信号	发送后必须确认硬件已执行
温度传感器	每 100ms 采集一次，前端每秒显示一次
固件升级包	一次性写入 Flash，写完不再读

参考答案

数据类型	策略	理由
急停信号	Write-Through	必须确认硬件寄存器写入成功才返回，牺牲写性能换取强一致性，界面显示"事实"而非"意图"。
温度传感器	Refresh-Ahead	核心需求是读延迟低。后台线程每 100ms 采集温度主动更新内存缓存，前端读取时直接命中，0ms 延迟。（注意：不是 Write-Back——Write-Back 解决的是写入存储的效率，而非读取侧的低延迟。）
固件升级包	Write-Around	一次性写入、写后不读，绕过缓存防污染，避免挤占热点数据的缓存空间。

练习 2：Linux 服务器混合负载策略

你维护一台 Linux 服务器，同时运行以下三个服务。为每个服务的 IO 模式选择最合适的缓存策略/内核配置：

服务	IO 特征
MySQL 数据库	混合读写，事务提交必须持久化，自带 Buffer Pool
Nginx 静态文件服务	大量小文件顺序读取，读远多于写
每日凌晨全量备份脚本	读取整个数据目录（数百 GB），写入远程存储

参考答案

服务	策略/配置	理由
MySQL	Write-Around (`O_DIRECT`) • Write-Through (`fsync`)	InnoDB 用 `O_DIRECT` 绕过 Page Cache 避免双重缓存，事务提交时用 `fsync()` 确保 WAL 日志持久化（Write-Through 语义），满足 ACID Durability。
Nginx 静态文件	Read-Through (Page Cache) • Refresh-Ahead (Readahead)	小文件通过 Page Cache 透明缓存（Read-Through），顺序读取时内核 Readahead 自动预加载后续页面（Refresh-Ahead），热点文件常驻缓存。
全量备份	Write-Around (`O_DIRECT` 或 `posix_fadvise(DONTNEED)`)	数百 GB 的一次性顺序读如果走 Page Cache 会冲掉所有热点页面（缓存污染），必须绕过或提示内核丢弃已读页面，保护 MySQL 和 Nginx 的缓存命中率。

🎯

关键洞察：真实系统往往组合使用多种策略。MySQL 同时使用 Write-Around（绕过 Page Cache）和 Write-Through 语义（fsync 确保落盘）；Nginx 同时受益于 Read-Through（Page Cache）和 Refresh-Ahead（Readahead）。理解单个策略是基础，组合运用才是实战核心。

一、CAP 与缓存：为什么必须做权衡？

二、读路径策略：谁负责回源？

2.1 Cache-Aside（旁路缓存 / Lazy Loading）

2.2 Read-Through（读穿）

读路径对比

三、写路径策略：一致性 vs 性能的三种选择

3.1 Write-Through（直写 / 写穿）— 强一致

3.2 Write-Back / Write-Behind（回写）— 极致性能

3.3 Write-Around（绕写）— 防缓存污染

写路径三策略对比

四、预测路径策略：Refresh-Ahead（预加载 / 预热）

五、总结选择指南

全局策略谱系

六、综合练习

练习 1：嵌入式项目策略选型

练习 2：Linux 服务器混合负载策略

felixfixit

交流频道

去知识星球参与更多讨论