本节内容

  1. transfer功能

    • transfer接收数据来源
    • transfer数据去向
    • transfer的一致性hash
    • transfer的一致性hash key的计算
  2. transfer源码分析
    • 2.1 初始化连接池,发送队列
    • 2.2 初始化rpc和socket接收端
    • 2.3 初始化http服务
  3. transfer设计优缺点
    • 优点:
    • 缺点:

1. transfer功能

transfer模块的作用是接收所有被监控服务器上发送过来的数据进行一些判断和处理之后转发至后面的graph和judge模块。

transfer接收数据来源

transfer主要从四个来源接收数据:

  1. agent采集的数据
  2. agent执行用户自定义插件返回的数据
  3. client-library,业务系统内嵌的监控收集数据并上报
  4. 用户自己产生的一些自定义数据,可通过RPC接口上报

transfer数据去向

transfer设计时支持三种数据后端,分别是:judge、graph、OpenTSDB.传输给judge是为了对收集上来的数据进行实时告警判断,graph是使用RRD技术存储监控数据的组件,OpenTSDB是开源的时间序列数据存储服务。

transfer的一致性hash

transfer的后端judge和graph为了提供高可用及负载均衡,都可能部署了多节点,transfer使用一致性hash对数据映射到不同节点。而OpenTSDB没有使用一致性hash,只提供了一个接口写数据。

transfer的一致性hash key的计算

transfer通过接收的数据的endpoint+metric+排序后的tags组成的pk作为key,进行hash(进行crc32循环冗余校验),最后获取该数据应该发送到的node。下面是pk生成的源码:

func PK(endpoint, metric string, tags map[string]string) string {
if tags == nil || len(tags) == 0 {
return fmt.Sprintf("%s/%s", endpoint, metric)
}
return fmt.Sprintf("%s/%s/%s", endpoint, metric, SortedTags(tags))
}

2. transfer源码分析

transfer源码分析需要结合数据流动的方向来进行梳理。

2.1 初始化连接池,发送队列

初始化时首先初始化连接池,然后初始化发送队列,最后初始化一致性hash环。
初始化完成之后开始执行发送数据任务startSendTasks将会定期将队列中的数据发送到不同的后端,至于最后的startSenderCron是开启定时任务,记录不同队列发送数据的情况。

  • 创建连接池时,judge集群是循环获取judge集群中的每一个node,生成一个node连接池组成的连接池。graph集群是循环集群中的每个node,每个node可能又有多个主机地址,最后把这所有的地址进行去重后创建一个大的连接池。
  • 创建发送队列时,judge根据每个node创建一个safe listgraph是两层循环,拼接成node+addr创建一个safe list。tsdb如果开启,创建了一个safe list
  • 调用initNodeRings创建一致性hash环时,只获取了judgegraph的node名称,通过名称生成hash值,再生成hash环。
  • 调用startSendTasks发送数据时,对于judge,循环每个judge node队列中的数据,将其发送到对应的node中,对于graph node队列,将循环该node列表中的所有地址,每个地址将接收到一份数据,这样,同一份数据被拷贝了len(node.addr)份发送。
// 初始化数据发送服务, 在main函数中调用
func Start() {
// 初始化默认参数
MinStep = g.Config().MinStep
if MinStep < 1 {
MinStep = 30 //默认30s
}
//
initConnPools()
initSendQueues()
initNodeRings()
// SendTasks依赖基础组件的初始化,要最后启动
startSendTasks()
startSenderCron()
log.Println("send.Start, ok")
}

2.2 初始化rpc和socket接收端

transfer接收数据有三种方式,除了Http提供数据接收之外,另两种,一种是使用golang的rpc模块,另一种是使用socket直接传输数据,两种方式将在下面介绍:

  1. RPC方式:
rpc方法 接收数据 作用
Ping 检测transfer是否存活,code=0说明正常,code=1说明请求异常
Update MetricValue列表 将上报的数据进行简单处理,检测是否满足格式条件,最后将数据发送到队列中
  1. socket方式:
    socket方式提供两个接口,一个是quit,用来退出数据发送,另一个是update,上报数据,数据之间用\n进行分割。
socket指令 接收数据 作用
quit 退出该次处理
update 上报数据,用\n分隔 上报数据进行处理后发送到对应的发送队列中

在open-falcon中基本都是使用rpc和http进行传输数据,这里添加了socket支持,可能是为了用户使用其他语言写的客户端,发送一些自定义的监控数据的上报,基本不使用。

2.3 初始化http服务

http服务含有一个上报数据的接口,是"/api/push",该接口可以接受其他服务push上来的数据,其他主要是一些关于transfer统计信息,状态信息等的获取。

3. transfer设计优缺点

优点:

  • transfer将数据集中汇总,再分散到不同的后端处理程序,相当于充当了数据集散地的作用

缺点:

  • transfer提供的数据接入方式除了golang能用的rpcHttp以外,另外提供的socket感觉不友好,希望能够改进以支持其他语言编写的服务能够比较方便的上报数据。
 
 
 

openfalcon源码分析之transfer的更多相关文章

  1. openfalcon源码分析之graph

    openfalcon源码分析之graph 本节内容 graph功能 graph源码分析 2.1 graph中重要的数据结构 2.2 graph的简要流程图 2.3 graph处理数据过程 2.4 gr ...

  2. openfalcon源码分析之Judge

    openfalcon源码分析之Judge 本节内容 Judge功能 源码分析 设计优缺点 1. Judge功能 在open-falcon中,Judge模块的功能是通过从HBS上同步告警的strateg ...

  3. openfalcon源码分析之hbs

    openfalcon源码分析之hbs 本节内容 hbs功能 hbs源码分析 hbs设计优劣 1. hbs功能 hbs在整个open-falcon项目中承担的角色就是连接数据库,作为数据库缓存,缓存配置 ...

  4. openfalcon源码分析之agent

    本节内容 agent功能 1.1 agent上报数据 1.2 agent与HBS同步 1.3 agent Http服务 agent源码分析 2.1 初始化config配置 2.2 初始化根目录,本地I ...

  5. Java并发包源码分析

    并发是一种能并行运行多个程序或并行运行一个程序中多个部分的能力.如果程序中一个耗时的任务能以异步或并行的方式运行,那么整个程序的吞吐量和可交互性将大大改善.现代的PC都有多个CPU或一个CPU中有多个 ...

  6. 【JUC】JDK1.8源码分析之ConcurrentHashMap(一)

    一.前言 最近几天忙着做点别的东西,今天终于有时间分析源码了,看源码感觉很爽,并且发现ConcurrentHashMap在JDK1.8版本与之前的版本在并发控制上存在很大的差别,很有必要进行认真的分析 ...

  7. 【JUC】JDK1.8源码分析之SynchronousQueue(九)

    一.前言 本篇是在分析Executors源码时,发现JUC集合框架中的一个重要类没有分析,SynchronousQueue,该类在线程池中的作用是非常明显的,所以很有必要单独拿出来分析一番,这对于之后 ...

  8. HashMap实现原理及源码分析

    哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表,而HashMap的实现原理也常常出 ...

  9. Java集合源码分析(七)HashMap<K, V>

    一.HashMap概述 HashMap基于哈希表的 Map 接口的实现.此实现提供所有可选的映射操作,并允许使用 null 值和 null 键.(除了不同步和允许使用 null 之外,HashMap  ...

随机推荐

  1. SQL基础--查询之一--单表查询

    SQL基础--查询之一--单表查询

  2. centos linux系统日常管理复习 CPU物理数逻辑核数,iftop ,iotop ,sar ,ps,netstat ,一网卡多IP,mii-tool 连接,ethtool速率,一个网卡配置多个IP,mii-tool 连接,ethtool速率 ,crontab备份, 第十八节课

    centos linux系统日常管理复习 物理CPU和每颗CPU的逻辑核数,uptime ,w,vmstat,iftop ,iotop ,sar ,ps,netstat ,一个网卡配置多个IP,mii ...

  3. JAVA问题定位跟踪技术

    常用的JAVA调试技巧: 线程堆栈解读 性能瓶颈分析 远程调试 内存泄露检测 常用工具集: proc工具集 系统跟踪命令truss/strace Core文件管理coreadm 进程状态监控prsta ...

  4. Randcher 2.0部署K8s集群(一)

    环境准备 1.系统版本 CentOS7.5 + docker ee 2.配置阿里云yum源 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirro ...

  5. 博客迁移至新平台ixirong.com

    很久没有在博客园上写文章了,一是时间有些忙,更重要的是自己还是没有抽出时间来坚持写下去,由于15年后自己的一些打算,在前一段时间的时候,建立了自己的个人博客站点,http://www.ixirong. ...

  6. MyBatis—动态SQL

    什么是动态SQL? 1.基于OGNL表达式 2.完成多条件查询的逻辑 3.动态SQL的主要元素 (if,trim,where,set,choose,foreach) where标签 可以根据if中是否 ...

  7. Tcp/Ip:Telnet指令

    作用: 1,客户端连接服务端,并对服务端操作: (此功能已逐渐废弃,代替他的远程桌面): 2,telnet ip地址 端口号   用来测试Ip地址下,端口号是否可以被访问

  8. vue.js指令v-model实现方法

    原文链接:http://www.jb51.net/article/99097.htm V-MODEL 是VUE 的一个指令,在input 控件上使用时,可以实现双向绑定. 通过看文档,发现他不过是一个 ...

  9. Signing package index... Cannot open file '/home/jello/openwrt/key-build' for reading

    一.环境 发行版:Ubuntu 18.04.1 LTS 代号:bionic 内核版本:4.15.0-30-generic 二.背景 在编译Openwrt/LEDE时出现以下错误,进而自动终止了编译: ...

  10. ExtJS错误解决 Cannot read property 'on' of undefined

    背景 用ExtJS新写了一个功能,运行时控制台打印错误Cannot read property 'on' of undefined,出错代码位置是Ext.define.bindStoreListene ...