SpringBoot：高并发下浏览量入库设计

一、背景

文章浏览量统计，low的做法是：用户每次浏览，前端会发送一个GET请求获取一篇文章详情时，会把这篇文章的浏览量+1，存进数据库里。

1.1 这么做，有几个问题：

在GET请求的业务逻辑里进行了数据的写操作！
并发高的话，数据库压力太大；
同时，如果文章做了缓存和搜索引擎如ElasticSearch的存储，同步更新缓存和ElasticSearch 更新同步更新太耗时，不更新就会导致数据不一致性。

1.2 解决方案

HyperLogLog

HyperLogLog是Probabilistic data Structures的一种，这类数据结构的基本大的思路就是使用统计概率上的算法，牺牲数据的精准性来节省内存的占用空间及提升相关操作的性能。

设计思路

为保证真实的博文浏览量，根据用户访问的ip和文章id,进行唯一校验，即同一个用户多次访问同一篇文章，改文章访问量只增加1；
将用户的浏览量用opsForHyperLogLog().add(key,value)的存储在Redis中，在半夜浏览量低的时候，通过定时任务，将浏览量更新至数据库中。

二、手把手实现

2.1 项目配置

sql

DROP TABLE IF EXISTS `article`;

CREATE TABLE `article` (

  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键',

  `title` varchar(100) NOT NULL COMMENT '标题',

  `content` varchar(1024) NOT NULL COMMENT '内容',

  `url` varchar(100) NOT NULL COMMENT '地址',

	`views` bigint(20) NOT NULL COMMENT '浏览量',

  `create_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',

  PRIMARY KEY (`id`)

) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

INSERT INTO article VALUES(1,'测试文章','content','url',10,NULL);

插入了一条数据，并设计访问量已经为10了，便于测试。

项目依赖pom.xml

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-web</artifactId>

</dependency>

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-aop</artifactId>

</dependency>

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-test</artifactId>

</dependency>

<!--mysql-->

<dependency>

    <groupId>mysql</groupId>

    <artifactId>mysql-connector-java</artifactId>

</dependency>

<!-- mybatis -->

<dependency>

    <groupId>org.mybatis.spring.boot</groupId>

    <artifactId>mybatis-spring-boot-starter</artifactId>

    <version>1.3.2</version>

</dependency>

<!-- redis -->

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-data-redis</artifactId>

</dependency>

<dependency>

    <groupId>org.apache.commons</groupId>

    <artifactId>commons-pool2</artifactId>

    <version>2.0</version>

</dependency>

<!-- lombok-->

<dependency>

    <groupId>org.projectlombok</groupId>

    <artifactId>lombok</artifactId>

    <optional>true</optional>

</dependency>

application.yml

spring:

  # 数据库配置

  datasource:

    url: jdbc:mysql://47.98.178.84:3306/dev

    username: dev

    password: password

    driver-class-name: com.mysql.cj.jdbc.Driver

  redis:

    host: 47.98.178.84

    port: 6379

    database: 1

    password: password

    timeout: 60s  # 连接超时时间，2.0 中该参数的类型为Duration，这里在配置的时候需要指明单位

    # 连接池配置，2.0中直接使用jedis或者lettuce配置连接池（使用lettuce，依赖中必须包含commons-pool2包）

    lettuce:

      pool:

        # 最大空闲连接数

        max-idle: 500

        # 最小空闲连接数

        min-idle: 50

        # 等待可用连接的最大时间，负数为不限制

        max-wait:  -1s

        # 最大活跃连接数，负数为不限制

        max-active: -1

# mybatis

mybatis:

  mapper-locations: classpath:mapper/*.xml

#  type-aliases-package: cn.van.redis.view.entity

2.2 浏览量的切面设计

自定义一个注解，用于新增文章浏览量到Redis中

@Target({ElementType.PARAMETER, ElementType.METHOD})

@Retention(RetentionPolicy.RUNTIME)

@Documented

public @interface PageView {

    /**

     * 描述

     */

    String description()  default "";

}

切面处理

 @Aspect

@Configuration

@Slf4j

public class PageViewAspect {

    @Autowired

    private RedisUtils redisUtil;

    /**

     * 切入点

     */

    @Pointcut("@annotation(cn.van.redis.view.annotation.PageView)")

    public void PageViewAspect() {

    }

    /**

     * 切入处理

     * @param joinPoint

     * @return

     */

    @Around("PageViewAspect()")

    public  Object around(ProceedingJoinPoint joinPoint) {

        Object[] object = joinPoint.getArgs();

        Object articleId = object[0];

        log.info("articleId:{}", articleId);

        Object obj = null;

        try {

            String ipAddr = IpUtils.getIpAddr();

            log.info("ipAddr:{}", ipAddr);

            String key = "articleId_" + articleId;

            // 浏览量存入redis中

            Long num = redisUtil.add(key,ipAddr);

            if (num == 0) {

                log.info("该ip:{},访问的浏览量已经新增过了", ipAddr);

            }

            obj = joinPoint.proceed();

        } catch (Throwable e) {

            e.printStackTrace();

        }

        return obj;

    }

}

工具类RedisUtils.java

 @Component

public  class RedisUtils {

    @Resource

    private RedisTemplate<String, Object> redisTemplate;

    /**

     * 删除缓存

     * @param key 可以传一个值 或多个

     */

    public void del(String... key) {

        redisTemplate.delete(key[0]);

    }

    /**

     * 计数

     * @param key

     * @param value

     */

    public Long add(String key, Object... value) {

        return redisTemplate.opsForHyperLogLog().add(key,value);

    }

    /**

     * 获取总数

     * @param key

     */

    public Long size(String key) {

        return redisTemplate.opsForHyperLogLog().size(key);

    }

}

工具类 IpUtils.java

该工具类我在Mac下测试没问题，Windows下如果有问题，请反馈给我

 @Slf4j

public class IpUtils {

    public static String getIpAddr() {

        try {

            Enumeration<NetworkInterface> allNetInterfaces = NetworkInterface.getNetworkInterfaces();

            InetAddress ip = null;

            while (allNetInterfaces.hasMoreElements()) {

                NetworkInterface netInterface = (NetworkInterface) allNetInterfaces.nextElement();

                if (netInterface.isLoopback() || netInterface.isVirtual() || !netInterface.isUp()) {

                    continue;

                } else {

                    Enumeration<InetAddress> addresses = netInterface.getInetAddresses();

                    while (addresses.hasMoreElements()) {

                        ip = addresses.nextElement();

                        if (ip != null && ip instanceof Inet4Address) {

                            log.info("获取到的ip地址：{}", ip.getHostAddress());

                            return ip.getHostAddress();

                        }

                    }

                }

            }

        } catch (Exception e) {

            log.error("获取ip地址失败，{}",e);

        }

        return null;

    }

}

2.3 同步任务`ArticleViewTask.java`

ArticleService.java里面的代码比较简单，详见文末源码。

@Component

@Slf4j

public class ArticleViewTask {

    @Resource

    private RedisUtils redisUtil;

    @Resource

    ArticleService articleService;

	// 每天凌晨一点执行

    @Scheduled(cron = "0 0 1 * * ? ")

    @Transactional(rollbackFor=Exception.class)

    public void createHyperLog() {

        log.info("浏览量入库开始");

        List<Long> list = articleService.getAllArticleId();

        list.forEach(articleId ->{

            // 获取每一篇文章在redis中的浏览量，存入到数据库中

            String key  = "articleId_"+articleId;

            Long view = redisUtil.size(key);

            if(view>0){

                ArticleDO articleDO = articleService.getById(articleId);

                Long views = view + articleDO.getViews();

                articleDO.setViews(views);

                int num = articleService.updateArticleById(articleDO);

                if (num != 0) {

                    log.info("数据库更新后的浏览量为：{}", views);

                    redisUtil.del(key);

                }

            }

        });

        log.info("浏览量入库结束");

    }

}

2.4 测试接口`PageController.java`

@RestController

@Slf4j

public class PageController {

    @Autowired

    private ArticleService articleService;

    @Autowired

    private RedisUtils redisUtil;

    /**

     * 访问一篇文章时，增加其浏览量:重点在的注解

     * @param articleId：文章id

     * @return

     */

    @PageView

    @RequestMapping("/{articleId}")

    public String getArticle(@PathVariable("articleId") Long articleId) {

        try{

            ArticleDO blog = articleService.getById(articleId);

            log.info("articleId = {}", articleId);

            String key = "articleId_"+articleId;

            Long view = redisUtil.size(key);

            log.info("redis 缓存中浏览数：{}", view);

            //直接从缓存中获取并与之前的数量相加

            Long views = view + blog.getViews();

            log.info("文章总浏览数：{}", views);

        } catch (Throwable e) {

            return  "error";

        }

        return  "success";

    }

}

这里，具体的Service中的方法因为都被我放在Controller中处理了，所以就是剩下简单的Mapper调用了，这里就不浪费时间了，详见文末源码。（按理说，这些逻辑处理，应该放在Service处理的，请按实际情况优化）

三、测试

启动项目，测试访问量，先请求http://localhost:8080/1,日志打印如下：

2019-03-2623:50:50.047  INFO 2970 --- [nio-8080-exec-1]  cn.van.redis.view.aspect.PageViewAspect  : articleId:1

2019-03-2623:50:50.047  INFO 2970 --- [nio-8080-exec-1] cn.van.redis.view.utils.IpUtils          : 获取到的ip地址：192.168.1.104

2019-03-2623:50:50.047  INFO 2970 --- [nio-8080-exec-1] cn.van.redis.view.aspect.PageViewAspect  : ipAddr:192.168.1.104

2019-03-2623:50:50.139  INFO 2970 --- [nio-8080-exec-1] io.lettuce.core.EpollProvider            : Starting without optional epoll library

2019-03-2623:50:50.140  INFO 2970 --- [nio-8080-exec-1] io.lettuce.core.KqueueProvider           : Starting without optional kqueue library

2019-03-2623:50:50.349  INFO 2970 --- [nio-8080-exec-1] com.zaxxer.hikari.HikariDataSource       : HikariPool-1 - Starting...

2019-03-2623:50:50.833  INFO 2970 --- [nio-8080-exec-1] com.zaxxer.hikari.HikariDataSource       : HikariPool-1 - Start completed.

2019-03-2623:50:50.872  INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController    : articleId = 1

2019-03-2623:50:50.899  INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController    : redis 缓存中浏览数：1

2019-03-2623:50:50.900  INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController    : 文章总浏览数：11

观察一下，数据库，访问量确实没有增加，本机再次访问，发现，日志打印如下:

2019-03-2623:51:14.658  INFO 2970 --- [nio-8080-exec-3]

cn.van.redis.view.aspect.PageViewAspect  : articleId:1

2019-03-2623:51:14.658  INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.utils.IpUtils          : 获取到的ip地址：192.168.1.104

2019-03-2623:51:14.658  INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.aspect.PageViewAspect  : ipAddr:192.168.1.104

2019-03-2623:51:14.692  INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.aspect.PageViewAspect  : 该ip:192.168.1.104,访问的浏览量已经新增过了

2019-03-2623:51:14.752  INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController    : articleId = 1

2019-03-2623:51:14.760  INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController    : redis 缓存中浏览数：1

2019-03-2623:51:14.761  INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController    : 文章总浏览数：11

定时任务触发，日志打印如下

2019-03-27 01:00:00.265  INFO 2974 --- [   scheduling-1] cn.van.redis.view.task.ArticleViewTask   : 浏览量入库开始

2019-03-27 01:00:00.448  INFO 2974 --- [   scheduling-1] io.lettuce.core.EpollProvider            : Starting without optional epoll library

2019-03-27 01:00:00.449  INFO 2974 --- [   scheduling-1] io.lettuce.core.KqueueProvider           : Starting without optional kqueue library

2019-03-27 01:00:00.663  INFO 2974 --- [   scheduling-1] cn.van.redis.view.task.ArticleViewTask   : 数据库更新后的浏览量为：11

2019-03-27 01:00:00.682  INFO 2974 --- [   scheduling-1] cn.van.redis.view.task.ArticleViewTask   : 浏览量入库结束

观察一下数据库，发现数据库中的浏览量增加到11，同时，Redis中的浏览量没了，说明成功！

四、源码及说明

4.1 源码地址

Github 示例代码

SpringBoot：高并发下浏览量入库设计的更多相关文章

从SpringBoot构建十万博文聊聊高并发文章浏览量设计
前言在经历了,缓存.限流.布隆穿透等等一系列加强功能,十万博客基本算是成型,网站上线以后也加入了百度统计来见证十万+ 的整个过程. 但是百度统计并不能对每篇博文进行详细的浏览量统计,如果做一些热点博 ...
springboot~高并发下耗时操作的实现
高并发下的耗时操作高并发下,就是请求在一个时间点比较多时,很多写的请求打过来时,你的服务器承受很大的压力,当你的一个请求处理时间长时,这些请求将会把你的服务器线程耗尽,即你的主线程池里的线程将不会再 ...
高并发下的缓存架构设计演进及redis常见的缓存应用异象解决方案
待总结缓存穿透缓存击穿缓存雪崩等
C#爬虫使用代理刷csdn文章浏览量
昨天写了一篇关于“c#批量抓取免费代理并验证有效性”的文章,接着昨天的目标继续完成吧,最终实现的目的就是刷新csdn文章的浏览量(实际上很简单,之前博客园的文章也是可以使用代理ip来刷的,后来不行了) ...
分布式高并发下Actor模型
分布式高并发下Actor模型写在开始一般来说有两种策略用来在并发线程中进行通信:共享数据和消息传递.使用共享数据方式的并发编程面临的最大的一个问题就是数据条件竞争.处理各种锁的问题是让人十分头痛的 ...
Tumblr：150亿月浏览量背后的架构挑战
Tumblr:150亿月浏览量背后的架构挑战 2013/04/08 · IT技术, 开发 · 9.9K 阅读 · HBase, Tumblr, 架构英文原文:High Scalability,编译: ...
Stack Overflow 上 370万浏览量的一个问题：如何比较 Java 的字符串？
在逛 Stack Overflow 的时候,发现了一些访问量像喜马拉雅山一样高的问题,比如说这个:如何比较 Java 的字符串?访问量足足有 370万+,这不得了啊!说明有很多很多的程序员被这个问题困 ...
大数据量数据库设计与优化方案(SQL优化)
转自:http://blog.sina.com.cn/s/blog_6c0541d50102wxen.html 一.数据库结构的设计如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的 ...
海量数据和高并发下的 Redis 业务优化实践
本文内容是我在 6 月 23 日参加的深圳 GIAC 技术大会上演讲的文字稿. 观众朋友们,我是来自掌阅的工程师钱文品,掘金小册<Redis 深度历险>的作者.今天我带来的是分享主题是:R ...

随机推荐

LINUX下查找大文件及大的文件夹
原帖地址:https://www.cnblogs.com/iyoume2008/p/6105590.html 今天正好碰到这样的问题,在博客园中看到有以上地址的一篇文章,照着上面的操作解决了问题,但是 ...
KNN算法实现手写体区分
KNN算法在python里面可以使用pip install指令安装,我在实现之前查看过安装的KNN算法,十分全面,包括了对于手写体数据集的处理.我这里只是实现了基础的识别方法,能力有限,没有数据处理方 ...
JSP第一章动态网页的基础
什么是动态网站(dynamic website)? 动态网站: 误区:初学者一般认为动态网页,就是会动的网页,但实际上不是这样的. 动态网页是指在服务器端运行的,使用程序语言设计的交互式网页,它们会根 ...
Jquery 小结
1. 名词解释实例对象:var p1=new Person(); p1就是实例对象构造:function Person(){} 原型对象:在 JavaScript 中,每当定义一个对象(函数也是 ...
PHP Composer安装使用
1.安装composer curl -sS https:\\getcomposer.org/install | php 如果出现这样的提示,打开php.ini检查是否开启openssl扩展 2.下载成 ...
转发后找不到css
当在jsp中引入css时,如果其相对路径相对于当前jsp文件的,而在一个和这个jsp的路径不一样的servlet中forward这个jsp时,就会发现这个css样式根本没有起作用. 这是因为在serv ...
【Android Studio】Gradle DSL method not found:'android()'
如图所示: 参考:http://www.jianshu.com/p/d370d41fb7da 又遇到了这个问题: 参考:http://stackoverflow.com/questions/24204 ...
Android 虹软人脸识别SDK-人脸对比
准备 : 登录官方网站,获取SDK,进行个人验证后新建项目,获取APP_ID,和SDK_KEY: https://ai.arcsoft.com.cn/ucenter/resource/build/in ...
Android--SharedPreferences数据存储方案
SharedPreferences是使用键值对的形式存储的,并且支持多种不同的数据类型,存的是String,取得值也是String. 使用SharedPreferenc ...
[译]使用golang每分钟处理百万请求
[译]使用golang每分钟处理百万请求在Malwarebytes,我们正在经历惊人的增长,自从我在1年前加入硅谷的这家公司以来,我的主要职责是为多个系统做架构和开发,为这家安全公司的快速发展以及百 ...