在java中构建高效的结果缓存

缓存是现代应用服务器中非常常用的组件。除了第三方缓存以外,我们通常也需要在java中构建内部使用的缓存。那么怎么才能构建一个高效的缓存呢? 本文将会一步步的进行揭秘。

使用HashMap

缓存通常的用法就是构建一个内存中使用的Map,在做一个长时间的操作比如计算之前,先在Map中查询一下计算的结果是否存在,如果不存在的话再执行计算操作。

我们定义了一个代表计算的接口:

  1. public interface Calculator<A, V> {
  2. V calculate(A arg) throws InterruptedException;
  3. }

该接口定义了一个calculate方法,接收一个参数,并且返回计算的结果。

我们要定义的缓存就是这个Calculator具体实现的一个封装。

我们看下用HashMap怎么实现:

  1. public class MemoizedCalculator1<A, V> implements Calculator<A, V> {
  2. private final Map<A, V> cache= new HashMap<A, V>();
  3. private final Calculator<A, V> calculator;
  4. public MemoizedCalculator1(Calculator<A, V> calculator){
  5. this.calculator=calculator;
  6. }
  7. @Override
  8. public synchronized V calculate(A arg) throws InterruptedException {
  9. V result= cache.get(arg);
  10. if( result ==null ){
  11. result= calculator.calculate(arg);
  12. cache.put(arg, result);
  13. }
  14. return result;
  15. }
  16. }

MemoizedCalculator1封装了Calculator,在调用calculate方法中,实际上调用了封装的Calculator的calculate方法。

因为HashMap不是线程安全的,所以这里我们使用了synchronized关键字,从而保证一次只有一个线程能够访问calculate方法。

虽然这样的设计能够保证程序的正确执行,但是每次只允许一个线程执行calculate操作,其他调用calculate方法的线程将会被阻塞,在多线程的执行环境中这会严重影响速度。从而导致使用缓存可能比不使用缓存需要的时间更长。

使用ConcurrentHashMap

因为HashMap不是线程安全的,那么我们可以尝试使用线程安全的ConcurrentHashMap来替代HashMap。如下所示:

  1. public class MemoizedCalculator2<A, V> implements Calculator<A, V> {
  2. private final Map<A, V> cache= new ConcurrentHashMap<>();
  3. private final Calculator<A, V> calculator;
  4. public MemoizedCalculator2(Calculator<A, V> calculator){
  5. this.calculator=calculator;
  6. }
  7. @Override
  8. public V calculate(A arg) throws InterruptedException {
  9. V result= cache.get(arg);
  10. if( result ==null ){
  11. result= calculator.calculate(arg);
  12. cache.put(arg, result);
  13. }
  14. return result;
  15. }
  16. }

上面的例子中虽然解决了之前的线程等待的问题,但是当有两个线程同时在进行同一个计算的时候,仍然不能保证缓存重用,这时候两个线程都会分别调用计算方法,从而导致重复计算。

我们希望的是如果一个线程正在做计算,其他的线程只需要等待这个线程的执行结果即可。很自然的,我们想到了之前讲到的FutureTask。FutureTask表示一个计算过程,我们可以通过调用FutureTask的get方法来获取执行的结果,如果该执行正在进行中,则会等待。

下面我们使用FutureTask来进行改写。

FutureTask

  1. @Slf4j
  2. public class MemoizedCalculator3<A, V> implements Calculator<A, V> {
  3. private final Map<A, Future<V>> cache= new ConcurrentHashMap<>();
  4. private final Calculator<A, V> calculator;
  5. public MemoizedCalculator3(Calculator<A, V> calculator){
  6. this.calculator=calculator;
  7. }
  8. @Override
  9. public V calculate(A arg) throws InterruptedException {
  10. Future<V> future= cache.get(arg);
  11. V result=null;
  12. if( future ==null ){
  13. Callable<V> callable= new Callable<V>() {
  14. @Override
  15. public V call() throws Exception {
  16. return calculator.calculate(arg);
  17. }
  18. };
  19. FutureTask<V> futureTask= new FutureTask<>(callable);
  20. future= futureTask;
  21. cache.put(arg, futureTask);
  22. futureTask.run();
  23. }
  24. try {
  25. result= future.get();
  26. } catch (ExecutionException e) {
  27. log.error(e.getMessage(),e);
  28. }
  29. return result;
  30. }
  31. }

上面的例子,我们用FutureTask来封装计算,并且将FutureTask作为Map的value。

上面的例子已经体现了很好的并发性能。但是因为if语句是非原子性的,所以对这一种先检查后执行的操作,仍然可能存在同一时间调用的情况。

这个时候,我们可以借助于ConcurrentHashMap的原子性操作putIfAbsent来重写上面的类:

  1. @Slf4j
  2. public class MemoizedCalculator4<A, V> implements Calculator<A, V> {
  3. private final Map<A, Future<V>> cache= new ConcurrentHashMap<>();
  4. private final Calculator<A, V> calculator;
  5. public MemoizedCalculator4(Calculator<A, V> calculator){
  6. this.calculator=calculator;
  7. }
  8. @Override
  9. public V calculate(A arg) throws InterruptedException {
  10. while (true) {
  11. Future<V> future = cache.get(arg);
  12. V result = null;
  13. if (future == null) {
  14. Callable<V> callable = new Callable<V>() {
  15. @Override
  16. public V call() throws Exception {
  17. return calculator.calculate(arg);
  18. }
  19. };
  20. FutureTask<V> futureTask = new FutureTask<>(callable);
  21. future = cache.putIfAbsent(arg, futureTask);
  22. if (future == null) {
  23. future = futureTask;
  24. futureTask.run();
  25. }
  26. try {
  27. result = future.get();
  28. } catch (CancellationException e) {
  29. log.error(e.getMessage(), e);
  30. cache.remove(arg, future);
  31. } catch (ExecutionException e) {
  32. log.error(e.getMessage(), e);
  33. }
  34. return result;
  35. }
  36. }
  37. }
  38. }

上面使用了一个while循环,来判断从cache中获取的值是否存在,如果不存在则调用计算方法。

上面我们还要考虑一个缓存污染的问题,因为我们修改了缓存的结果,如果在计算的时候,计算被取消或者失败,我们需要从缓存中将FutureTask移除。

本文的例子可以参考https://github.com/ddean2009/learn-java-concurrency/tree/master/MemoizedCalculate

更多内容请访问 flydean的博客

在java中构建高效的结果缓存的更多相关文章

  1. 161101、在Java中如何高效判断数组中是否包含某个元素

    如何检查一个数组(无序)是否包含一个特定的值?这是一个在Java中经常用到的并且非常有用的操作.同时,这个问题在Stack Overflow中也是一个非常热门的问题.在投票比较高的几个答案中给出了几种 ...

  2. 在Java中如何高效的判断数组中是否包含某个元素

    原文出处: hollischuang(@Hollis_Chuang) 如何检查一个数组(无序)是否包含一个特定的值?这是一个在Java中经常用到的并且非常有用的操作.同时,这个问题在Stack Ove ...

  3. 在Java中怎样高效的推断数组中是否包括某个元素

    来自 http://www.hollischuang.com/archives/1269? 怎样检查一个数组(无序)是否包括一个特定的值?这是一个在Java中经经常使用到的并且非常实用的操作.同一时候 ...

  4. java中常用的几种缓存类型介绍

    在平时的开发中会经常用到缓存,比如locache.redis等,但一直没有对缓存有过比较全面的总结.下面从什么是缓存.为什么使用缓存.缓存的分类以及对每种缓存的使用分别进行分析,从而对缓存有更深入的了 ...

  5. 在Java中如何高效判断数组中是否包含某个元素

    如何检查一个数组(无序)是否包含一个特定的值?这是一个在Java中经常用到的并且非常有用的操作.同时,这个问题在Stack Overflow中也是一个非常热门的问题.在投票比较高的几个答案中给出了几种 ...

  6. 转:使用memc-nginx和srcache-nginx模块构建高效透明的缓存机制

    原文地址:http://blog.codinglabs.org/articles/nginx-memc-and-srcache.html 为了提高性能,几乎所有互联网应用都有缓存机制,其中Memcac ...

  7. [转] 使用memc-nginx和srcache-nginx模块构建高效透明的缓存机制

    为了提高性能,几乎所有互联网应用都有缓存机制,其中Memcache是使用非常广泛的一个分布式缓存系统.众所周知,LAMP是非常经典的Web架构方式,但是随着Nginx的 成熟,越来越多的系统开始转型为 ...

  8. java中如何高效的判断数组中是否包含某个元素---

    package zaLearnpackage; import org.apache.commons.lang3.ArrayUtils; import java.util.Arrays; import ...

  9. Java中如何使用Redis做缓存

    基本功能测试 1.程序基本结构 2.主要类 1)功能类 package com.redis; import java.util.ArrayList; import java.util.Iterator ...

随机推荐

  1. jvm的类加载机制总结

    类的加载机制分为如下三个阶段:加载,连接,初始化.其中连接又分为三个小阶段:验证,准备,解析. 加载阶段 将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法区内,然后再堆内创 ...

  2. C/C++知识总结 二 C/C++基础知识

    C/C++基础知识 C/C++基本格式说明 C/C++基本常识说明 C/C++基本格式说明 C语言基本格式 #include<stdio.h> //预处理文件 int main() //自 ...

  3. Spring的jdbcTemplate操作

    Spring的jdbcTemplate操作 dao层,使用jdbcTemplate Spring对不同的持久化层技术的支持,都进行了封装 JDBC Hibernate5.0 MyBatis JPA 相 ...

  4. 《Three.js 入门指南》3.1.1 - 基本几何形状 -圆环面(TorusGeometry)

    3.1 基本几何形状 圆环面(TorusGeometry) 构造函数 THREE.TorusGeometry(radius, tube, radialSegments, tubularSegments ...

  5. Spring 中使用 ActiveMQ 笔记

    首先需要在 pom.xml 中添加如下两个 jar 包:spring-jms 与 activemq-core,其依赖的 jar 包会自动下载 接着进行相关配置 @Configuration publi ...

  6. RHCS概述

    RHCS概述 创建RHCS集群环境 创建高可用Apache服务 1 创建RHCS集群环境 1.1 问题 准备四台KVM虚拟机,其三台作为集群节点,一台安装luci并配置iSCSI存储服务,实现如下功能 ...

  7. (js描述的)数据结构[集合结构](6)

    (js描述的)数据结构[集合结构](6) 一.集合结构特点 1.集合中的元素不能重复. 2.集合是无序的. 二.集合的代码实现 function Set() { this.items = {} //1 ...

  8. Flask 入门 (十一)

    上篇文章讲的是一对多,这篇文章应该说多对多了 但是多对多无法用两张表来实现,因为外键......,你懂,哈哈哈!,所以中间需要加一张表来实现 承接上文,修改main.py中的代码如下: #encodi ...

  9. 五个简单的shell脚本

    1.编写shell脚本 ex1.sh,提示用户输入用户名,并判断此用户名是否存在. (提示:利用read.grep和/etc/passwd) #!/bin/bash echo "请输入用户名 ...

  10. L19深度学习中的优化问题和凸性介绍

    优化与深度学习 优化与估计 尽管优化方法可以最小化深度学习中的损失函数值,但本质上优化方法达到的目标与深度学习的目标并不相同. 优化方法目标:训练集损失函数值 深度学习目标:测试集损失函数值(泛化性) ...