Go实现日志收集系统3

再次整理了一下这个日志收集系统的框，如下图

这次要实现的代码的整体逻辑为：

完整代码地址为:

etcd介绍

高可用的分布式key-value存储，可以用于配置共享和服务发现

类似的项目：zookeeper和consul

开发语言：go

接口：提供restful的接口，使用简单

实现算法：基于raft算法的强一致性，高可用的服务存储目录

etcd的应用场景：

服务发现和服务注册
配置中心(我们实现的日志收集客户端需要用到)
分布式锁
master选举

官网对etcd的有一个非常简明的介绍：

etcd搭建：
下载地址：https://github.com/coreos/etcd/releases/
根据自己的环境下载对应的版本然后启动起来就可以了

启动之后可以通过如下命令验证一下：

[root@localhost etcd-v3.2.18-linux-amd64]# ./etcdctl set name zhaofan 

zhaofan

[root@localhost etcd-v3.2.18-linux-amd64]# ./etcdctl get name

zhaofan

[root@localhost etcd-v3.2.18-linux-amd64]#

context 介绍和使用

其实这个东西翻译过来就是上下文管理，那么context的作用是做什么，主要有如下两个作用：

控制goroutine的超时
保存上下文数据

通过下面一个简单的例子进行理解：

package main

import (

    "fmt"

    "time"

    "net/http"

    "context"

    "io/ioutil"

)

type Result struct{

    r *http.Response

    err error

}

func process(){

    ctx,cancel := context.WithTimeout(context.Background(),2*time.Second)

    defer cancel()

    tr := &http.Transport{}

    client := &http.Client{Transport:tr}

    c := make(chan Result,1)

    req,err := http.NewRequest("GET","http://www.google.com",nil)

    if err != nil{

        fmt.Println("http request failed,err:",err)

        return

    }

    // 如果请求成功了会将数据存入到管道中

    go func(){

        resp,err := client.Do(req)

        pack := Result{resp,err}

        c <- pack

    }()

    select{

    case <- ctx.Done():

        tr.CancelRequest(req)

        fmt.Println("timeout!")

    case res := <-c:

        defer res.r.Body.Close()

        out,_:= ioutil.ReadAll(res.r.Body)

        fmt.Printf("server response:%s",out)

    }

    return

}

func main() {

    process()

}

写一个通过context保存上下文，代码例子如：

package main

import (

    "github.com/Go-zh/net/context"

    "fmt"

)

func add(ctx context.Context,a,b int) int {

    traceId := ctx.Value("trace_id").(string)

    fmt.Printf("trace_id:%v\n",traceId)

    return a+b

}

func calc(ctx context.Context,a, b int) int{

    traceId := ctx.Value("trace_id").(string)

    fmt.Printf("trace_id:%v\n",traceId)

    //再将ctx传入到add中

    return add(ctx,a,b)

}

func main() {

    //将ctx传递到calc中

    ctx := context.WithValue(context.Background(),"trace_id","123456")

    calc(ctx,20,30)

}

结合etcd和context使用

关于通过go连接etcd的简单例子：(这里有个小问题需要注意就是etcd的启动方式，默认启动可能会连接不上，尤其你是在虚拟你安装，所以需要通过如下命令启动：
./etcd --listen-client-urls http://0.0.0.0:2371 --advertise-client-urls http://0.0.0.0:2371 --listen-peer-urls http://0.0.0.0:2381
)

package main

import (

    etcd_client "github.com/coreos/etcd/clientv3"

    "time"

    "fmt"

)

func main() {

    cli, err := etcd_client.New(etcd_client.Config{

        Endpoints:[]string{"192.168.0.118:2371"},

        DialTimeout:5*time.Second,

    })

    if err != nil{

        fmt.Println("connect failed,err:",err)

        return

    }

    fmt.Println("connect success")

    defer cli.Close()

}

下面一个例子是通过连接etcd，存值并取值

package main

import (

    "github.com/coreos/etcd/clientv3"

    "time"

    "fmt"

    "context"

)

func main() {

    cli,err := clientv3.New(clientv3.Config{

        Endpoints:[]string{"192.168.0.118:2371"},

        DialTimeout:5*time.Second,

    })

    if err != nil{

        fmt.Println("connect failed,err:",err)

        return

    }

    fmt.Println("connect succ")

    defer cli.Close()

    ctx,cancel := context.WithTimeout(context.Background(),time.Second)

    _,err = cli.Put(ctx,"logagent/conf/","sample_value")

    cancel()

    if err != nil{

        fmt.Println("put failed,err",err)

        return

    }

    ctx, cancel = context.WithTimeout(context.Background(),time.Second)

    resp,err := cli.Get(ctx,"logagent/conf/")

    cancel()

    if err != nil{

        fmt.Println("get failed,err:",err)

        return

    }

    for _,ev := range resp.Kvs{

        fmt.Printf("%s:%s\n",ev.Key,ev.Value)

    }

}

关于context官网也有一个例子非常有用，用于控制开启的goroutine的退出，代码如下：

package main

import (

    "context"

    "fmt"

)

func main() {

    // gen generates integers in a separate goroutine and

    // sends them to the returned channel.

    // The callers of gen need to cancel the context once

    // they are done consuming generated integers not to leak

    // the internal goroutine started by gen.

    gen := func(ctx context.Context) <-chan int {

        dst := make(chan int)

        n := 1

        go func() {

            for {

                select {

                case <-ctx.Done():

                    return // returning not to leak the goroutine

                case dst <- n:

                    n++

                }

            }

        }()

        return dst

    }

    ctx, cancel := context.WithCancel(context.Background())

    defer cancel() // cancel when we are finished consuming integers

    for n := range gen(ctx) {

        fmt.Println(n)

        if n == 5 {

            break

        }

    }

}

关于官网文档中的WithDeadline演示的代码例子：

package main

import (

    "context"

    "fmt"

    "time"

)

func main() {

    d := time.Now().Add(50 * time.Millisecond)

    ctx, cancel := context.WithDeadline(context.Background(), d)

    // Even though ctx will be expired, it is good practice to call its

    // cancelation function in any case. Failure to do so may keep the

    // context and its parent alive longer than necessary.

    defer cancel()

    select {

    case <-time.After(1 * time.Second):

        fmt.Println("overslept")

    case <-ctx.Done():

        fmt.Println(ctx.Err())

    }

}

通过上面的代码有了一个基本的使用，那么如果我们通过etcd来做配置管理，如果配置更改之后，我们如何通知对应的服务器配置更改，通过下面例子演示：

package main

import (

    "github.com/coreos/etcd/clientv3"

    "time"

    "fmt"

    "context"

)

func main() {

    cli,err := clientv3.New(clientv3.Config{

        Endpoints:[]string{"192.168.0.118:2371"},

        DialTimeout:5*time.Second,

    })

    if err != nil {

        fmt.Println("connect failed,err:",err)

        return

    }

    defer cli.Close()

    // 这里会阻塞

    rch := cli.Watch(context.Background(),"logagent/conf/")

    for wresp := range rch{

        for _,ev := range wresp.Events{

            fmt.Printf("%s %q : %q\n", ev.Type, ev.Kv.Key, ev.Kv.Value)

        }

    }

}

实现一个kafka的消费者代码的简单例子：

package main

import (

    "github.com/Shopify/sarama"

    "strings"

    "fmt"

    "time"

)

func main() {

    consumer,err := sarama.NewConsumer(strings.Split("192.168.0.118:9092",","),nil)

    if err != nil{

        fmt.Println("failed to start consumer:",err)

        return

    }

    partitionList,err := consumer.Partitions("nginx_log")

    if err != nil {

        fmt.Println("Failed to get the list of partitions:",err)

        return

    }

    fmt.Println(partitionList)

    for partition := range partitionList{

        pc,err := consumer.ConsumePartition("nginx_log",int32(partition),sarama.OffsetNewest)

        if err != nil {

            fmt.Printf("failed to start consumer for partition %d:%s\n",partition,err)

            return

        }

        defer pc.AsyncClose()

        go func(partitionConsumer sarama.PartitionConsumer){

            for msg := range pc.Messages(){

                fmt.Printf("partition:%d Offset:%d Key:%s Value:%s",msg.Partition,msg.Offset,string(msg.Key),string(msg.Value))

            }

        }(pc)

    }

    time.Sleep(time.Hour)

    consumer.Close()

}

但是上面的代码并不是最佳代码，因为我们最后是通过time.sleep等待goroutine的执行，我们可以更改为通过sync.WaitGroup方式实现

package main

import (

    "github.com/Shopify/sarama"

    "strings"

    "fmt"

    "sync"

)

var (

    wg sync.WaitGroup

)

func main() {

    consumer,err := sarama.NewConsumer(strings.Split("192.168.0.118:9092",","),nil)

    if err != nil{

        fmt.Println("failed to start consumer:",err)

        return

    }

    partitionList,err := consumer.Partitions("nginx_log")

    if err != nil {

        fmt.Println("Failed to get the list of partitions:",err)

        return

    }

    fmt.Println(partitionList)

    for partition := range partitionList{

        pc,err := consumer.ConsumePartition("nginx_log",int32(partition),sarama.OffsetNewest)

        if err != nil {

            fmt.Printf("failed to start consumer for partition %d:%s\n",partition,err)

            return

        }

        defer pc.AsyncClose()

        go func(partitionConsumer sarama.PartitionConsumer){

            wg.Add(1)

            for msg := range partitionConsumer.Messages(){

                fmt.Printf("partition:%d Offset:%d Key:%s Value:%s",msg.Partition,msg.Offset,string(msg.Key),string(msg.Value))

            }

            wg.Done()

        }(pc)

    }

    //time.Sleep(time.Hour)

    wg.Wait()

    consumer.Close()

}

将客户端需要收集的日志信息放到etcd中

关于etcd处理的代码为：

package main

import (

    "github.com/coreos/etcd/clientv3"

    "time"

    "github.com/astaxie/beego/logs"

    "context"

    "fmt"

)

var Client *clientv3.Client

var logConfChan chan string

// 初始化etcd

func initEtcd(addr []string,keyfmt string,timeout time.Duration)(err error){

    var keys []string

    for _,ip := range ipArrays{

        //keyfmt = /logagent/%s/log_config

        keys = append(keys,fmt.Sprintf(keyfmt,ip))

    }

    logConfChan = make(chan string,10)

    logs.Debug("etcd watch key:%v timeout:%v", keys, timeout)

    Client,err = clientv3.New(clientv3.Config{

        Endpoints:addr,

        DialTimeout: timeout,

    })

    if err != nil{

        logs.Error("connect failed,err:%v",err)

        return

    }

    logs.Debug("init etcd success")

    waitGroup.Add(1)

    for _, key := range keys{

        ctx,cancel := context.WithTimeout(context.Background(),2*time.Second)

        // 从etcd中获取要收集日志的信息

        resp,err := Client.Get(ctx,key)

        cancel()

        if err != nil {

            logs.Warn("get key %s failed,err:%v",key,err)

            continue

        }

        for _, ev := range resp.Kvs{

            logs.Debug("%q : %q\n",  ev.Key, ev.Value)

            logConfChan <- string(ev.Value)

        }

    }

    go WatchEtcd(keys)

    return

}

func WatchEtcd(keys []string){

    // 这里用于检测当需要收集的日志信息更改时及时更新

    var watchChans []clientv3.WatchChan

    for _,key := range keys{

        rch := Client.Watch(context.Background(),key)

        watchChans = append(watchChans,rch)

    }

    for {

        for _,watchC := range watchChans{

            select{

            case wresp := <-watchC:

                for _,ev:= range wresp.Events{

                    logs.Debug("%s %q : %q\n", ev.Type, ev.Kv.Key, ev.Kv.Value)

                    logConfChan <- string(ev.Kv.Value)

                }

            default:

            }

        }

        time.Sleep(time.Second)

    }

    waitGroup.Done()

}

func GetLogConf()chan string{

    return logConfChan

}

同样的这里增加对了限速的处理，毕竟日志收集程序不能影响了当前业务的性能，所以增加了limit.go用于限制速度：

package main

import (

    "time"

    "sync/atomic"

    "github.com/astaxie/beego/logs"

)

type SecondLimit struct {

    unixSecond int64

    curCount int32

    limit int32

}

func NewSecondLimit(limit int32) *SecondLimit {

    secLimit := &SecondLimit{

        unixSecond:time.Now().Unix(),

        curCount:0,

        limit:limit,

    }

    return secLimit

}

func (s *SecondLimit) Add(count int) {

    sec := time.Now().Unix()

    if sec == s.unixSecond {

        atomic.AddInt32(&s.curCount,int32(count))

        return

    }

    atomic.StoreInt64(&s.unixSecond,sec)

    atomic.StoreInt32(&s.curCount, int32(count))

}

func (s *SecondLimit) Wait()bool {

    for {

        sec := time.Now().Unix()

        if (sec == atomic.LoadInt64(&s.unixSecond)) && s.curCount == s.limit {

            time.Sleep(time.Microsecond)

            logs.Debug("limit is running,limit:%d s.curCount:%d",s.limit,s.curCount)

            continue

        }

        if sec != atomic.LoadInt64(&s.unixSecond) {

            atomic.StoreInt64(&s.unixSecond,sec)

            atomic.StoreInt32(&s.curCount,0)

        }

        logs.Debug("limit is exited")

        return false

    }

}

GO学习-(34) Go实现日志收集系统3的更多相关文章

GO学习-(35) Go实现日志收集系统4
Go实现日志收集系统4 到这一步,我的收集系统就已经完成很大一部分工作,我们重新看一下我们之前画的图: 我们已经完成前面的部分,剩下是要完成后半部分,将kafka中的数据扔到ElasticSear ...
GO学习-(33) Go实现日志收集系统2
Go实现日志收集系统2 一篇文章主要是关于整体架构以及用到的软件的一些介绍,这一篇文章是对各个软件的使用介绍,当然这里主要是关于架构中我们agent的实现用到的内容关于zookeeper+kaf ...
GO学习-(32) Go实现日志收集系统1
Go实现日志收集系统1 项目背景每个系统都有日志,当系统出现问题时,需要通过日志解决问题当系统机器比较少时,登陆到服务器上查看即可满足当系统机器规模巨大,登陆到机器上查看几乎不现实当然即使是机 ...
Go语言学习之11 日志收集系统kafka库实战
本节主要内容: 1. 日志收集系统设计2. 日志客户端开发 1. 项目背景 a. 每个系统都有日志,当系统出现问题时,需要通过日志解决问题 b. 当系统机器比较少时,登陆到服务器上查看即可 ...
ELK+kafka构建日志收集系统
ELK+kafka构建日志收集系统原文 http://lx.wxqrcode.com/index.php/post/101.html 背景: 最近线上上了ELK,但是只用了一台Redis在 ...
Apache Flume日志收集系统简介
Apache Flume是一个分布式.可靠.可用的系统,用于从大量不同的源有效地收集.聚合.移动大量日志数据进行集中式数据存储. Flume简介 Flume的核心是Agent,Agent中包含Sour ...
容器云平台No.9~kubernetes日志收集系统EFK
EFK介绍 EFK,全称Elasticsearch Fluentd Kibana ,是kubernetes中比较常用的日志收集方案,也是官方比较推荐的方案. 通过EFK,可以把集群的所有日志收集到El ...
Flume -- 开源分布式日志收集系统
Flume是Cloudera提供的一个高可用的.高可靠的开源分布式海量日志收集系统,日志数据可以经过Flume流向需要存储终端目的地.这里的日志是一个统称,泛指文件.操作记录等许多数据. 一.Flum ...
[转载] 一共81个，开源大数据处理工具汇总（下），包括日志收集系统/集群管理/RPC等
原文: http://www.36dsj.com/archives/25042 接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统.消息系统.分布式服务 ...

随机推荐

Java中的线程池用过吧？来说说你是怎么理解线程池吧？
前言 Java中的线程池用过吧?来说说你是怎么使用线程池的?这句话在面试过程中遇到过好几次了.我甚至这次标题都想写成[Java八股文之线程池],但是有点太俗套了.虽然,线程池是一个已经被说烂的知识点了 ...
python 利用opencv去除图片水印
python 去除水印"人工"智能去除水印这两天公司来了一个新的需求--去除水印,对于我一个从未接触过的这种事情的人来说,当时我是蒙的.不过首先我就去搜索了一下是否有该种合适的功 ...
PAT 乙级 -- 1007 -- 素数对猜想
题目简述让我们定义 dn 为:dn = pn+1 - pn,其中 pi 是第i个素数.显然有 d1=1 且对于n>1有 dn 是偶数."素数对猜想"认为"存在无穷 ...
Python中Scapy网络嗅探模块的使用
目录 Scapy scapy的安装和使用发包发包和收包抓包将抓取到的数据包保存查看抓取到的数据包格式化输出过滤抓包 Scapy scapy是python中一个可用于网络嗅探的非常强大的第 ...
Windows核心编程第九章线程与内核对象的同步(上)
第9章线程与内核对象的同步上一章介绍了如何使用允许线程保留在用户方式中的机制来实现线程同步的方法.用户方式同步的优点是它的同步速度非常快.如果强调线程的运行速度,那么首先应该确定用户方式的线程同步 ...
Day005 for循环
for循环虽然所有循环结构都可以用while或者do-while表示,但java提供了另一种语句--for循环,使一些循环结构变得更加简单. for循环语句是支持迭代的一种通用结构,是最有效.最灵活 ...
springboot国际化与@valid国际化支持
springboot国际化 springboot对国际化的支持还是很好的,要实现国际化还简单.主要流程是通过配置springboot的LocaleResolver解析器,当请求打到springboot ...
NumPy之:ndarray多维数组操作
NumPy之:ndarray多维数组操作目录简介创建ndarray ndarray的属性 ndarray中元素的类型转换 ndarray的数学运算 index和切片基本使用 index wit ...
如何更好理解Peterson算法？
如何更好理解Peterson算法? 1 Peterson算法提出的背景在我们讲述Peterson算法之间,我们先了解一下Peterson算法提出前的背景(即:在这个算法提出之前,前人们都做了哪些工作 ...
EFCore之增删改查
1. 连接数据库通过依赖注入配置应用程序,通过startup类的ConfigureService方法中的AddDbContext将EFCore添加到依赖注入容器 public void Config ...

GO学习-(34) Go实现日志收集系统3