原始地址见 这里

本文是工作中一点点简单的思考,不能保证是完全正确的,可能也仅仅是适用于部分场景。

场景 1:获取用户关注的好友列表中,每个好友的名字、头像等信息。

在很多公司中,不同的服务是由不同的人甚至是不同的部门维护的,这中间会通过一些定义好的接口进行交互(这里就用 RPC接口来说明了)。假设我们的服务是维护用户的关注关系,而用户的基本信息会维护在用户服务中。用户服务提供了如下两个接口:

get_user_info(user_id):
return {name='name', avatar='avatar'} batch_get_user_info(user_ids):
return map{user_id=user_info, user_id2=user_info}

假设我们提供给用户的关注好友列表,开始的时候是先获取用户的所有关注好友,然后依次去获取每个关注好友的信息,则提供给用户的接口 P95 可能会是 300ms,初始伪代码如下:

def get_following_info():
following_ids = [1, 2, 4, 5]
user_infos = []
for f_id in following_ids:
user_infos.append(get_user_info(f_id))
return user_infos

我们知道,和 IO 比起来,一般来说,内存计算要快得多,所以,针对以上代码,我们可以使用批量接口,直接获取到所有的用户信息。

def get_following_info():
following_ids = [1, 2, 4, 5]
return batch_get_user_info(following_ids)

使用了以上代码之后,可能接口的性能会提高到 100 ms,此外,由于网络 IO 的减少,接口的错误也会少了很多。这就是一个优化。

当然,如果一个用户关注了很多的好友,可能没办法一次获取到所有的好友消息,这时候就需要分页了。

场景2: 批量查询表中数据

一般情况下,应用服务器和数据库存储并不是在同一台服务器上,如果要进行数据库的查询操作,很多时候就需要通过网络来进行。

对于 MySQL 来说,数据是按照主键来进行物理存储的,如果表中没有主键,则会设置一个默认的主键。二级索引都会查询到主键之后,再次回表查询。也就是说,根据主键,可以认为更快的进行数据的查询。对于下面的表,如果我们想进行表的扫描,获取到 user_id,则可以首先获取到表的最大和最小主键 ID,然后批量获取两个 ID 之间的数据。

CREATE TABLE `user_name` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增id',
`user_id` bigint(20) NOT NULL COMMENT ' 用户 id',
`user_name` varchar(64) NOT NULL COMMENT '姓名',
PRIMARY KEY (`id`),
UNIQUE KEY `unq_uid` (`user_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; select max(id) from `user_name`;
select min(id) from `user_name`;

获取到了最大最小的 ID 之后,就可以批量获取两个 ID 之间的数据了,不过多数情况下,两个 ID 之间是有几百万甚至上亿数据的,这时候就需要在程序中设置一个阈值,避免一下获取太多,反而减缓速度,甚至没法获取到。当然,一次获取数据太多,内存也可能存在不足的问题了。

select user_name from `user_name` where 0 < id < 200;

这样一来,只需要在程序中设置好每次查询的数据量,就可以一次查询多条数据了。

通过减少 IO 实现性能的优化的更多相关文章

  1. Java性能之优化RPC网络通信

    服务框架的核心 大型服务框架的核心:RPC通信 微服务的核心是远程通信和服务治理 远程通信提供了服务之间通信的桥梁,服务治理提供了服务的后勤保障 服务的拆分增加了通信的成本,因此远程通信很容易成为系统 ...

  2. python面试总结3(性能分析优化,GIl常考题)

    python性能分析和优化,GIL常考题 什么是Cpython GIL Cpython解释器的内存管理并不是线程安全的 保护多线程情况下对python对象访问 Cpython使用简单的锁机制避免多个线 ...

  3. [转帖]Java虚拟机(JVM)体系结构概述及各种性能参数优化总结

    Java虚拟机(JVM)体系结构概述及各种性能参数优化总结 2014年09月11日 23:05:27 zhongwen7710 阅读数 1437 标签: JVM调优jvm 更多 个人分类: Java知 ...

  4. Windows五种IO模型性能分析和Linux五种IO模型性能分析

    Windows五种IO模型性能分析和Linux五种IO模型性能分析 http://blog.csdn.net/jay900323/article/details/18141217 http://blo ...

  5. Java性能 -- Lock优化

    Lock / synchronized Lock锁的基本操作是通过乐观锁实现的,由于Lock锁也会在阻塞时被挂起,依然属于悲观锁   synchronized Lock 实现方式 JVM层实现 Jav ...

  6. 在ASP.NET Core中用HttpClient(四)——提高性能和优化内存

    到目前为止,我们一直在使用字符串创建请求体,并读取响应的内容.但是我们可以通过使用流提高性能和优化内存.因此,在本文中,我们将学习如何在请求和响应中使用HttpClient流. 什么是流 流是以文件. ...

  7. fir.im Weekly - APP 性能监测优化 二三事

    每一个成功的 App,都拥有强大的性能体验.本期 fir.im Weekly 整理了微信读书.美团外卖. 天猫.美团点评技术团队的关于性能监测优化方面策略和工具的分享,一起来看看. 微信读书 iOS ...

  8. paip.提升性能---mysql 优化cpu多核以及lan性能的关系.

    paip.提升性能---mysql 优化cpu多核以及lan性能的关系. 作者Attilax  艾龙,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http:/ ...

  9. php性能效率优化

    [size=5][color=Red]php性能效率优化[/color][/size] 最近在公司一边自学一边写PHP程序,由于公司对程序的运行效率要求很高,而自己又是个新手,一开始就注意程序的效率很 ...

随机推荐

  1. 范仁义html+css课程---1、html基本结构

    范仁义html+css课程---1.html基本结构 一.总结 一句话总结: html标签中包含head标签和body标签,head标签里面主要写用户不可见的内容,比如字符集编码,body标签里面主要 ...

  2. 范仁义web前端介绍课程---1、课程意义

    范仁义web前端介绍课程---1.课程意义 一.总结 一句话总结: 提供的这一整套学习方法和资源,配合艾宾浩斯遗忘曲线等各种复习.学习算法和后续会有的娱乐化学习方式,能否真正做到让学过的东西不再忘记. ...

  3. PHP如何解决网站大流量与高并发的问题(三)

    七层负载均衡的实现 基于URL等应用层信息的负载均衡 Nginx的proxy是一个很强大的功能,实现了7层负载均衡 功能强大.性能卓越,运行稳定 配置简单灵活 能自动提出工作不正常的后端服务器 上传文 ...

  4. C#多线程和异步——Task和async/await详解

    阅读目录 一.什么是异步 二.Task介绍 1 Task创建和运行 2 Task的阻塞方法(Wait/WaitAll/WaitAny) 3 Task的延续操作(WhenAny/WhenAll/Cont ...

  5. Springmvc & Report: FineReport vs BIRT vs Jasperreport

    Springmvc与jasperreport结合生成报表的一种方法 - OneThin的个人空间 - OSCHINAhttps://my.oschina.net/onethin/blog/14360 ...

  6. Mac OS docker挂载文件夹

    sudo docker run -p 3306:3306 --name mysql -v /var/run/docker.sock:/var/run/docker.sock -v ~/mysql/co ...

  7. 【转载】 tf.split函数的用法

    原文地址: https://blog.csdn.net/uestc_c2_403/article/details/73350457 由于tensorflow 版本更新问题   用法略有修改 ----- ...

  8. 【问题解决】Flasgger mapping values are not allowed here?

    参考来源:https://stackoverflow.com/questions/9055371/python-and-pyaml-yaml-scanner-scannererror-mapping- ...

  9. break 和 continue 的用法

    break 是结束循环 continue 是结束本次循环,接下下一个循环

  10. 【prometheus 抓取源】

    配置prometheus从prometheus爬取数据 prometheus提供了下面这个端口来让其他prometheus来抓取(scrape)自己的时序数据: http://prometheus_i ...