Erlang pool management -- Emysql pool
从这篇开始,这一系列主要分析在开源社区中,Erlang 相关pool 的管理和使用.
在开源社区,Emysql 是Erlang 较为受欢迎的一个MySQL 驱动. Emysql 对pool 的管理和使用是非常典型的,pool 的管理角色中,主要有available(记录当前pool 中可供使用的成员),locked(记录当前pool 中正在被使用的成员),waiting(记录当前正在处理等待该pool 的用户).用户进程在使用pool 过程中, pool 中的成员在这三个角色中来回迁移.
pool 数据结构
Emysql pool 的数据结构如下:
-record(pool, {pool_id :: atom(),
size :: number(),
user :: string(),
password :: string(),
host :: string(),
port :: number(),
database :: string(),
encoding :: utf8 | latin1 | {utf8, utf8_unicode_ci} | {utf8, utf8_general_ci},
available=queue:new() :: queue(),
locked=gb_trees:empty() :: gb_tree(),
waiting=queue:new() :: queue(),
start_cmds=[] :: string(),
conn_test_period=0 :: number(),
connect_timeout=infinity :: number() | infinity,
warnings=false :: boolean()}).
L1 处的pool_id 为pool 的标识
L2 定义了pool 中成员的数量
L3 L4 为用以连接MySQL 数据库的用户名和密码
L5 L6 L7 L8 为连接MySQL 数据库的IP, 端口, 默认数据库, 编码
L9 用以记录当前pool 中可用的成员
L10 用以记录当前pool 中正在被使用的成员
L11 用以记录当前等待pool 中成员的用户
L12 为在与数据库建立连接后的初始化命令
L14 是用于gen_tcp:connect 时的超时参数
pool 添加操作
在Emysql 项目中,emysql module 定义了所有外部操作的API, 其中添加操作的API有:
1, add_pool/2
2, add_pool/8
3, add_pool/9
以下代码片段为add_pool 的实质性处理逻辑:
add_pool(#pool{pool_id=PoolId,size=Size,user=User,password=Password,host=Host,port=Port,
database=Database,encoding=Encoding,start_cmds=StartCmds,
connect_timeout=ConnectTimeout,warnings=Warnings}=PoolSettings)->
config_ok(PoolSettings),
case emysql_conn_mgr:has_pool(PoolId) of
true ->
{error,pool_already_exists};
false ->
Pool = #pool{
pool_id = PoolId,
size = Size,
user = User,
password = Password,
host = Host,
port = Port,
database = Database,
encoding = Encoding,
start_cmds = StartCmds,
connect_timeout = ConnectTimeout,
warnings = Warnings
},
Pool2 = case emysql_conn:open_connections(Pool) of
{ok, Pool1} -> Pool1;
{error, Reason} -> throw(Reason)
end,
emysql_conn_mgr:add_pool(Pool2)
end.
处理逻辑主要有:
1, 确认参数的数据类型
2, 检查当前是否已经有相同ID的 pool
3, 与MySQL server 建立connection
4, 在emysql_conn_mgr 中添加 该pool
在当前的Emysql 项目中,emysql_conn_mgr 是用来管理所有pool 的gen_server 进程. 对于所有的pool 而言,其内部成员的状态管理, 都是由emysql_conn_mgr 调度的, 包括某个pool 中connection 成员的使用,归还等.
确认参数的数据类型
确认参数的数据类型主要使用erlang:is_{{type}} bif func, 在Erlang VM 内存,对于每种数据类型都是以后缀来识别的.
config_ok(#pool{pool_id=PoolId,size=Size,user=User,password=Password,host=Host,port=Port,
database=Database,encoding=Encoding,start_cmds=StartCmds,
connect_timeout=ConnectTimeout,warnings=Warnings})
when is_atom(PoolId),
is_integer(Size),
is_list(User),
is_list(Password),
is_list(Host),
is_integer(Port),
is_list(Database) orelse Database == undefined,
is_list(StartCmds),
is_integer(ConnectTimeout) orelse ConnectTimeout == infinity,
is_boolean(Warnings) ->
encoding_ok(Encoding);
config_ok(_BadOptions) ->
erlang:error(badarg). encoding_ok(Enc) when is_atom(Enc) -> ok;
encoding_ok({Enc, Coll}) when is_atom(Enc), is_atom(Coll) -> ok;
encoding_ok(_) -> erlang:error(badarg).
因此, 这部分的操作足够高效.以 is_list/1为例:
#define TAG_PRIMARY_LIST 0x1
#define is_list(x) (((x) & _TAG_PRIMARY_MASK) == TAG_PRIMARY_LIST)
#define is_not_list(x) (!is_list((x)))
与MySQL server 建立链接
此处与MySQL server 建立链接是调用emysql_conn module 中的open_connections 函数.
%% @doc Opens connections for the necessary pool.
%%
%% If connection opening fails, removes all connections from the pool
%% Does not remove pool from emysql_conn_mgr due to a possible deadlock.
%% Caller must do it by itself.
open_connections(Pool) ->
%-% io:format("open connections loop: .. "),
case (queue:len(Pool#pool.available) + gb_trees:size(Pool#pool.locked)) < Pool#pool.size of
true ->
case catch open_connection(Pool) of
#emysql_connection{} = Conn ->
open_connections(Pool#pool{available = queue:in(Conn, Pool#pool.available)});
{'EXIT', Reason} ->
AllConns = lists:append(
queue:to_list(Pool#pool.available),
gb_trees:values(Pool#pool.locked)
),
lists:foreach(fun emysql_conn:close_connection/1, AllConns),
{error, Reason}
end;
false ->
{ok, Pool}
end.
链接的总数为pool 结构中的size 字段(L8),成功建立链接后,将Conn 放入 available queue 中(L12).
在emysql_conn_mgr 中添加 pool
当pool 与MySQL server 建立链接完成后,需要将pool 添加到emysql_conn_mgr 中, 以便emysql_conn_mgr gen_server 进程对pool 进行管理.
添加pool add_pool/1 的操作:
add_pool(Pool) ->
do_gen_call({add_pool, Pool}). ... handle_call({add_pool, Pool}, _From, State) ->
case find_pool(Pool#pool.pool_id, State#state.pools) of
{_, _} ->
{reply, {error, pool_already_exists}, State};
undefined ->
{reply, ok, State#state{pools = [Pool|State#state.pools]}}
end;
如果当前emysql_conn_mgr gen_server 进程中,并未记录(L8)该pool 的话,就将该pool 添加到emysql_conn_mgr gen_server 进程的state 数据中(L11).
has_pool/1 的操作:
has_pool(Pool) ->
do_gen_call({has_pool, Pool}). .... handle_call({has_pool, PoolID}, _From, State) ->
case find_pool(PoolID, State#state.pools) of
{_, _} ->
{reply, true, State};
undefined ->
{reply, false, State}
end;
以上,即为add_pool 操作的整个流程. emysql_conn_mgr gen_server 进程是管理pool 的非常重要的进程.
pool 使用管理
取出connection
在execute 执行一条SQL语句时, 用户进程需要先请求emysql_conn_mgr gen_server 进程从给定pool_id 的pool 中取出一个成员.
execute(PoolId, Query, Args, Timeout) when (is_list(Query) orelse is_binary(Query)) andalso is_list(Args) andalso (is_integer(Timeout) orelse Timeout == infinity) ->
Connection = emysql_conn_mgr:wait_for_connection(PoolId),
monitor_work(Connection, Timeout, [Connection, Query, Args]);
wait_for_connection(PoolId ,Timeout)->
%% try to lock a connection. if no connections are available then
%% wait to be notified of the next available connection
%-% io:format("~p waits for connection to pool ~p~n", [self(), PoolId]),
case do_gen_call({lock_connection, PoolId, true, self()}) of
unavailable ->
%-% io:format("~p is queued~n", [self()]),
receive
{connection, Connection} -> Connection
after Timeout ->
do_gen_call({abort_wait, PoolId}),
receive
{connection, Connection} -> Connection
after
0 -> exit(connection_lock_timeout)
end
end;
Connection ->
%-% io:format("~p gets connection~n", [self()]),
Connection
end.
然后对于wait_for_connection/2 函数的操作, 首先会调用emysql_conn_mgr gen_server handle_call 操作 lock_connection
而lock_next_connection 函数的主要功能是从pool 的available queue 中out 一个元素, 并monitor 调用进程(以防调用进程异常退出而没有归还conn).
lock_next_connection(Available ,Locked, Who) ->
case queue:out(Available) of
{{value, Conn}, OtherAvailable} ->
MonitorRef = erlang:monitor(process, Who),
NewConn = connection_locked_at(Conn, MonitorRef),
MonitorTuple = {MonitorRef,
{NewConn#emysql_connection.pool_id, NewConn#emysql_connection.id}},
NewLocked = gb_trees:enter(NewConn#emysql_connection.id, NewConn, Locked),
{ok, NewConn, OtherAvailable, NewLocked, MonitorTuple};
{empty, _} ->
unavailable
end.
L2 处会尝试从available queue 中取出元素conn, 如果queue 此时不为空, emysql_conn_mgr 进程就会monitor (L4)用户进程,然后将该conn gb_tress enter 到locked tree 中(L8).
在"无可用的conn"的情况下, emysql_conn_mgr gen_server 进程会将用户进程写入到pool 的waiting queue中, 并且返回'unavailable', 用户进程就会等待conn 的其他使用者归还conn .
归还connection
在用户使用完conn 之后,应该及时归还给pool, 以防链接资源泄露.
在 emysql_conn_mgr module 中定义了pass_connection/1 函数以及在 handl_call callback 中实现了 handle_call({{replace_connection, Kind}, OldConn, NewConn}, _From, State).
在handle_call callback 函数中, 首先会从locked tree 中delete 掉该conn.然后从waiting queue 中取出之前等待的用户进程ID, 将conn 发送给alive 的等待进程, 并更新locked tree waiting queue. 如果waiting queue 中无alive 等待进程, 就将conn 还回给available queue, 并更新相关的管理角色.
serve_waiting_pids(Waiting, Available, Locked, MonitorRefs) ->
case queue:is_empty(Waiting) of
false ->
Who = queue:get(Waiting),
case lock_next_connection(Available, Locked, Who) of
{ok, Connection, OtherAvailable, NewLocked, NewRef} ->
{{value, Pid}, OtherWaiting} = queue:out(Waiting),
case erlang:is_process_alive(Pid) of
true ->
erlang:send(Pid, {connection, Connection}),
serve_waiting_pids(OtherWaiting, OtherAvailable, NewLocked, [NewRef | MonitorRefs]);
_ ->
serve_waiting_pids(OtherWaiting, Available, Locked, MonitorRefs)
end;
unavailable ->
{Waiting, Available, Locked, MonitorRefs}
end;
true ->
{Waiting, Available, Locked, MonitorRefs}
end.
conn 使用进程退出
如果某用户进程在从pool 中取出conn 使用, 但是在使用过程中, 用户进程异常退出, 无法调用pass_connection/1 函数归还conn , 就会出现资源泄露的问题.
在emysql_conn_mgr module 中, 是使用monitor 用户进程的方式处理的. 在用户进程获得一个conn 之后, emysql_conn_mgr 会使用BIF erlang:monitor/2 函数 monitor 用户进程.当用户进程异常退出后,emysql_conn_mgr 进程就会收到'DOWN' 的message.然后在emysql_conn_mgr module 中的handle_info callback 函数中处理:
handle_info({'DOWN', MonitorRef, _, _, _}, State) ->
case dict:find(MonitorRef, State#state.lockers) of
{ok, {PoolId, ConnId}} ->
case find_pool(PoolId, State#state.pools) of
{Pool, _} ->
case gb_trees:lookup(ConnId, Pool#pool.locked) of
{value, Conn} -> async_reset_conn(State#state.pools, Conn);
_ -> ok
end;
_ ->
ok
end;
_ ->
ok
end,
{noreply, State};
可以看出,在emysql_conn_mgr 进程接收到'DOWN' 的message 之后, 会在进程dict 的locker 中 查找poolID和 connID, 继而重置conn .
等待进程 abort_wait
某进程在获取pool 中 conn 时, 在Timeout 之后, 用户进程会调用abort_wait, emysql_conn_mgr 进程就会从waiting queue 中, 将不再等待的用户进程remove
handle_call({abort_wait, PoolId}, {From, _Mref}, State) ->
case find_pool(PoolId, State#state.pools) of
{Pool, OtherPools} ->
%% Remove From from the wait queue
QueueNow = queue:filter(
fun(Pid) -> Pid =/= From end,
Pool#pool.waiting),
PoolNow = Pool#pool{ waiting = QueueNow },
%% See if the length changed to know if From was removed.
OldLen = queue:len(Pool#pool.waiting),
NewLen = queue:len(QueueNow),
if
OldLen =:= NewLen ->
Reply = not_waiting;
true ->
Reply = ok
end,
{reply, Reply, State#state{pools=[PoolNow|OtherPools]}};
undefined ->
{reply, {error, pool_not_found}, State}
end;
这样的设计同样是为了尽可能的保证避免资源的泄露,试想如果emysql_conn_mgr 进程将conn 发送给已经不再等待(不再需要)的进程,那该conn 就不可能再被归还.
在大多数情况下,这种设计是可以保证conn 不会被发送给不再等待的用户进程,但是在达成"gen_server 进程的处理是顺序性"这样共识的前提下考虑以下情况:
也就是在处理pass_connection , emysql_conn_mgr 进程从waiting queue 取出了ProcessA进程的同时, ProcessA 进程因为Timeout 调用了abort_wait 且exit 退出. emysql_conn_mgr 的顺序性处理,使得只有在处理完pass_connection 之后, 才能处理abort_wait 操作. 最终导致的结果就是将conn 发送给已经exit (但是还没有从waiting queue remove) 的用户进程ProcessA, 是conn 不能再被归还.
当这种情况出现的时候,就应该在发送conn 给 ProcessA 进程之前, 判断ProcessA 是否alive(这个pr 已经被merged了).
总结
在Emysql 的pool 管理中,主要使用了:
1, available queue 记录所有可用的pool 成员
2, locked tree 记录所有正在被使用的pool 成员
3, waiting queue 记录所有正在等待的用户进程
4, monitor 所有正在使用pool 成员的用户进程, 处理异常退出的case
5, 处理等待进程的abort_wait 请求, 更新waiting queue
6, 在发送pool 成员之前, 应该判断用户进程是否alive, 防止资源泄露
遗漏
现在的emysql_conn_mgr gen_server 进程属于单点,也就是所有的pool 的管理调度都是由一个进程来完成.
------------------------------
觉得写的还可以,就扫个码,打个赏呗。
Erlang pool management -- Emysql pool的更多相关文章
- Erlang pool management -- Emysql pool optimize
在上一篇关于Emysql pool (http://www.cnblogs.com/--00/p/4281938.html)的分析的最后提到 现在的emysql_conn_mgr gen_server ...
- Erlang pool management -- RabbitMQ worker_pool
在RabbitMQ中,pool 是以worker_pool 的形式存在的, 其主要用途之一是对Mnesia transaction 的操作. 而在RabbitMQ 中, pool 中的worker 数 ...
- Erlang pool management -- RabbitMQ worker_pool 2
上一篇已经分析了rpool 的三个module , 以及简单的物理关系. 这次主要分析用户进程和 worker_pool 进程还有worker_pool_worker 进程之间的调用关系. 在开始之前 ...
- 使用boost实现线程池thread pool | boost thread pool example
本文首发于个人博客https://kezunlin.me/post/f241bd30/,欢迎阅读! boost thread pool example Guide boost thread pool ...
- The Run-Time Constant Pool The Constant Pool
http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.4 http://docs.oracle.com/javase ...
- [转载][概念]Storage Pool, Private RAID Group, Private LUN
Storage Pool的起源 ========================== Some time ago, EMC introduced the concept of Virtual Prov ...
- Oracle-buffer cache、shared pool
http://blog.csdn.net/panfelix/article/details/38347059 buffer pool 和shared pool 详解 http://blog.csd ...
- [转载】——故障排除:Shared Pool优化和Library Cache Latch冲突优化 (文档 ID 1523934.1)
原文链接:https://support.oracle.com/epmos/faces/DocumentDisplay?_adf.ctrlstate=23w4l35u5_4&id=152393 ...
- python进程池:multiprocessing.pool
本文转至http://www.cnblogs.com/kaituorensheng/p/4465768.html,在其基础上进行了一些小小改动. 在利用Python进行系统管理的时候,特别是同时操作多 ...
随机推荐
- Redis QPS测试
1.计算qps: 1)redis发布版本中自带了redis-benchmark性能测试工具,可以使用它计算qps.示例:使用50个并发连接,发出100000个请求,每个请求的数据为2kb,测试host ...
- Python OOP(3) staticmethod和classmethod统计实例
staticmethod 统计实例 #!python2 #-*- coding:utf-8 -*- class c1: amount_instance=0 def __init__(self): c1 ...
- Oracle数据库体系结构(3)数据库进程
一.Oracle进程概述 在oracle中进程分为用户进程(User Process).服务器进程(server process)和后天进程3种. 1.用户进程:当用户连接到数据库执行一个应用程序是, ...
- 每天一个Linux命令(11)nl命令
nl命令读取 file 参数(缺省情况下标准输入),计算输入中的行号,将计算过的行号写入标准输出. 其默认的结果与cat -n有点不太一样, nl 可以将行号做比较多的显示设计,包括位数与是否自动补齐 ...
- [原创]Scala学习:函数的定义
方式一:标准的定义函数 def 函数名(参数1: 参数类型,参数2: 参数类型): 返回值类型 = { 函数体 } 例子 def max(x: Int,y: Int): Int ={ if(x > ...
- PHP新写的大转盘抽奖源码
中奖概率 抽奖大转盘演示:http://www.sucaihuo.com/php/3301.html function getRand($proArr, $proCount) { $result = ...
- 浅谈Android系统开发中LOG的使用【转】
本文转载自:http://blog.csdn.net/luoshengyang/article/details/6581828 在程序开发过程中,LOG是广泛使用的用来记录程序执行过程的机制,它既可以 ...
- String类型的对象,是保存在堆里还是在栈里呢?
在Java的实现中,new出来的String对象一般是放在堆中的. 如果是 String s ="xxx"; 这种,那就是放在常量池中. JDK6将常量池放在方法区中. 方法区此时 ...
- DELPHI-Delphi常用类型及定义单元
DELPHI-Delphi常用类型及定义单元 Type Unit Date SysUtils DeleteFile SysUtils or Windows (different versions) D ...
- 算法(Algorithms)第4版 练习 1.5.22
package com.qiusongde; import edu.princeton.cs.algs4.StdOut; import edu.princeton.cs.algs4.StdStats; ...