25 | 缓存异常（上）：如何解决缓存和数据库的数据不一致问题？

2021/8/25 19:06:34

编程Tag： 缓存数据库更新线程队列并发 25

本文主要是介绍25 | 缓存异常（上）：如何解决缓存和数据库的数据不一致问题？，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

缓存和数据库的数据不一致是如何发生的？

如何解决数据不一致问题？

重试机制

大量并发请求可能读到不一致的数据

情况一：先删除缓存，再更新数据库。

解决方案

情况二：先更新数据库值，再删除缓存值。

总结

问题

缓存和数据库的数据不一致是如何发生的？

数据的一致性”具体是啥意思

缓存中有数据，那么，缓存的数据值需要和数据库中的值相同；
缓存中本身没有数据，那么，数据库中的值必须是最新值。

不符合这两种情况的，就属于缓存和数据库的数据不一致问题了。

只读缓存在新增、删改时遇到的问题

如何解决数据不一致问题？

重试机制

把要删除的缓存值或者是要更新的数据库值暂存到消息队列中（例如使用Kafka 消息队列）。当应用没有能够成功地删除缓存值或者是更新数据库值时，可以从消息队列中重新读取这些值，然后再次进行删除或更新。

当消息不自动ack时，如果更新db/redis失败了，消息是不会丢失的，重回队列后可再次读取处理。

如果能够成功地删除或更新，我们就要把这些值从消息队列中去除，以免重复操作，此时，我们也可以保证数据库和缓存的数据一致了。否则的话，我们还需要再次进行重试。如果重试超过的一定次数，还是没有成功，我们就需要向业务层发送报错信息了。

大量并发请求可能读到不一致的数据

丢队列重试只能cover单线程的情况，当多线程时就算将删改操作丢人队列还可能读到脏数据.

情况一：先删除缓存，再更新数据库。

解决方案

延迟双删

redis.delKey(X)
db.update(X)
Thread.sleep(N)
redis.delKey(X)

其中N 需要统计下线程读数据和写缓存的操作时间，以此为基础来进行估算。

情况二：先更新数据库值，再删除缓存值。

总结

问题

只读缓存中进行数据的删改操作时，需要在缓存中删除相应的缓存值.如果是直接更新缓存的值，你觉得和删除缓存值相比，有什么好处和不足吗？

这种情况相当于把Redis当做读写缓存使用，删改操作同时操作数据库和缓存。

1、先更新数据库，再更新缓存：如果更新数据库成功，但缓存更新失败，此时数据库中是最新值，但缓存中是旧值，后续的读请求会直接命中缓存，得到的是旧值。

2、先更新缓存，再更新数据库：如果更新缓存成功，但数据库更新失败，此时缓存中是最新值，数据库中是旧值，后续读请求会直接命中缓存，但得到的是最新值，短期对业务影响不大。但是，一旦缓存过期或者满容后被淘汰，读请求就会从数据库中重新加载旧值到缓存中，之后的读请求会从缓存中得到旧值，对业务产生影响。

同样地，针对这种其中一个操作可能失败的情况，也可以使用重试机制解决，把第二步操作放入到消息队列中，消费者从消息队列取出消息，再更新缓存或数据库，成功后把消息从消息队列删除，否则进行重试，以此达到数据库和缓存的最终一致。

以上是没有并发请求的情况。如果存在并发读写，也会产生不一致，分为以下4种场景。

1、先更新数据库，再更新缓存，写+读并发：线程A先更新数据库，之后线程B读取数据，此时线程B会命中缓存，读取到旧值，之后线程A更新缓存成功，后续的读请求会命中缓存得到最新值。这种场景下，线程A未更新完缓存之前，在这期间的读请求会短暂读到旧值，对业务短暂影响。

2、先更新缓存，再更新数据库，写+读并发：线程A先更新缓存成功，之后线程B读取数据，此时线程B命中缓存，读取到最新值后返回，之后线程A更新数据库成功。这种场景下，虽然线程A还未更新完数据库，数据库会与缓存存在短暂不一致，但在这之前进来的读请求都能直接命中缓存，获取到最新值，所以对业务没影响。

3、先更新数据库，再更新缓存，写+写并发：线程A和线程B同时更新同一条数据，更新数据库的顺序是先A后B，但更新缓存时顺序是先B后A，这会导致数据库和缓存的不一致。

4、先更新缓存，再更新数据库，写+写并发：与场景3类似，线程A和线程B同时更新同一条数据，更新缓存的顺序是先A后B，但是更新数据库的顺序是先B后A，这也会导致数据库和缓存的不一致。

场景1和2对业务影响较小，场景3和4会造成数据库和缓存不一致，影响较大。也就是说，在读写缓存模式下，写+读并发对业务的影响较小，而写+写并发时，会造成数据库和缓存的不一致。

针对场景3和4的解决方案是，对于写请求，需要配合分布式锁使用。写请求进来时，针对同一个资源的修改操作，先加分布式锁，这样同一时间只允许一个线程去更新数据库和缓存，没有拿到锁的线程把操作放入到队列中，延时处理。用这种方式保证多个线程操作同一资源的顺序性，以此保证一致性。

综上，使用读写缓存同时操作数据库和缓存时，因为其中一个操作失败导致不一致的问题，同样可以通过消息队列重试来解决。而在并发的场景下，读+写并发对业务没有影响或者影响较小，而写+写并发时需要配合分布式锁的使用，才能保证缓存和数据库的一致性。

另外，读写缓存模式由于会同时更新数据库和缓存，优点是，缓存中一直会有数据，如果更新操作后会立即再次访问，可以直接命中缓存，能够降低读请求对于数据库的压力（没有了只读缓存的删除缓存导致缓存缺失和再加载的过程）。缺点是，如果更新后的数据，之后很少再被访问到，会导致缓存中保留的不是最热的数据，缓存利用率不高（只读缓存中保留的都是热数据），所以读写缓存比较适合用于读写相当的业务场景

对于场景3和4 例如目前业务中的fileLoader 并发解析文件。

同一份index file只能被一个线程解析，代码如下图

这篇关于25 | 缓存异常（上）：如何解决缓存和数据库的数据不一致问题？的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

25 | 缓存异常（上）：如何解决缓存和数据库的数据不一致问题？

缓存和数据库的数据不一致是如何发生的？

如何解决数据不一致问题？

重试机制

大量并发请求可能读到不一致的数据

情况一：先删除缓存，再更新数据库。

解决方案

情况二：先更新数据库值，再删除缓存值。

总结

问题

相关编程文章