双写一致性问题

发表于 2025-08-21 更新于 2025-09-01 分类于分布式系统一致性本文字数： 989 阅读时长 ≈ 4 分钟

背景

在 缓存 + 数据库 的经典架构里，缓存通常作为加速层来缓解数据库压力。
但在更新数据时，如果操作顺序处理不当，就可能导致缓存与数据库之间出现短暂的不一致。

常见的更新顺序有两种：

因此我们大多时候会选择先写数据库再写缓存。

在写缓存的时候我们可以选择删除或者更新，大多数时候我们会选择更新，因为[1]：

	删除缓存 (Cache-Aside)	更新缓存
复杂程度	简单	复杂
幂等性	天然幂等（无论怎么删，最终结果都是缓存被删除了）	非幂等操作
并发写安全	安全 (删除顺序不影响最终状态)	不安全 (并发更新可能导致缓存数据错乱或覆盖，即使是redis也只保证单个命令是安全的)
效率	高 (直接删除，不关心数据)	低 (可能频繁更新一个后续无人读取的值，消耗CPU和带宽，特别是当你在维护一个复杂的缓存时)
数据最终一致性	更易保证 (删除不依赖数据)	更难保证 (依赖数据，若顺序错误可能脏甚至是错误)

写数据库，删除缓存，下次请求重建缓存，简单可靠。

双删也是经常提到的办法，属于一种增强版的写数据库后删除缓存，能够减少不一致窗口期。

在更新数据库之后，执行两次缓存删除操作：

第二次删除缓存通常会延迟，目的是解决以下问题：

弱一致性

令人纠结的时间

实际上，延迟双删更多是工程妥协：在读多写少、对短时间不一致可容忍的业务场景下适用（个人感觉有点骚操作，不过能保证最终一致性的同时还能减少脏数据时间总是好的）。

[1] 删除是 KISS原则和 YAGNI原则的体现。此外，好的设计往往是对需求的精准把握，我们作为设计师要从需求好好考虑，找到最关键的问题，简单并不是简陋。