Kafka教程(一)基础入门
  •  
    1.基本概念
    •  
      背景
      •  
        领英->Apache
      •  
        分布式、消息发布订阅系统
    •  
      角色
      •  
        存储系统
      •  
        消息系统
      •  
        流处理平台-Kafka Streaming
    •  
      特点
      •  
        高吞吐、低延迟
        •  
          cg消费不同分区
      •  
        可扩展性(热扩展)
      •  
        持久性、可靠性
      •  
        容错性(n-1个replica)
      •  
        高并发(数千个客户端☆)
    •  
      作用
      •  
        削峰填谷(Peak cut)+解耦
      •  
        流式计算:计算系统的前置缓存和输出结果缓存
  •  
    2.安装部署
    •  
      zookeeper集群
      •  
        zoo.cfg
        •  
          server.1/2/3(big02:2888:3888)
          •  
            2888(leader监听此端口、用于zk内部通信)
          •  
            3888(leader选举)
        •  
          clientPort:2181
          •  
            为客户端提供服务
        •  
          dataDir
      •  
        myid文件生成
        •  
          data目录下创建
        •  
          echo 1 > myid
        •  
          对应server1、2、3
      •  
        /etc/profile配置环境变量
      •  
        配置分发与启停zkServer.sh
      •  
        集群一键启停-ssh
    •  
      kafka集群
      •  
        server.propertis
        •  
          log数据存储目录
        •  
          zk集群地址2181(zk只配端口)
      •  
        profile
        •  
          配置export PATH=$PATH:$KAFKA/bin
        •  
          source生效文件
      •  
        启停与操作
        •  
          kafka-server-start/stop.sh
        •  
          kafka-topics.sh
        •  
          kafka-console-producer/consumer.sh
  •  
    3.运维监控
    •  
      Kafka Eagle(EFAK)
      •  
        配置数据库
      •  
        ke.sh启动
    •  
      Kafka Manager(CMAK)
      •  
        JMX远程连接端口
      •  
        RMI实际通信端口
      •  
        sh文件内配置
        •  
          server-start
        •  
          run-class
      •  
        启动时指定
        •  
          JMX_PORT=9999 bin/kafka-server-start.sh
    •  
      Kafka Offset Monitor
    •  
      Kafka Web Console
      •  
        scala编写的java web程序
      •  
        类似Monitor,但更复杂
      •  
        需要配置数据库
      •  
        安装sbt 打包、运行run
    •  
      JMX自开发管理系统
  •  
    4.命令行工具
    •  
      概述
      •  
        启停、配置
      •  
        生产消费、主题管理
      •  
        性能测试perf-test
      •  
        日志内容查看dump-log
      •  
        优先副本选举prefered-replica-election
      •  
        分区再分配reassign
    •  
      topics
      •  
        信息查看--describe
        •  
          Replica
        •  
          ISR
        •  
          OSR
      •  
        创建--create
        •  
          基本方式
          •  
            指定分区个数和副本数量replication-factor
        •  
          手动指定分区分配
          •  
            --replica-assignment
          •  
            0:1:3,1:2:6(分别指两个分区的节点id)
      •  
        修改配置--alter
        •  
          增加分区数
          •  
            --partitions 3
        •  
          动态配置topic参数
          •  
            --config compression=gzip
    •  
      console-producer
    •  
      console-consumer
      •  
        指定分区--pratition
      •  
        偏移量指定策略
        •  
          earliest
        •  
          latest
        •  
          指定
          •  
            指定偏移量--offset 2
        •  
          默认:之前记录的偏移量
      •  
        消费者组
        •  
          groupId配置与查看
          •  
            查看:consumer-groups.sh --list
        •  
          数量变更触发rebalance
        •  
          用于提高消费并行度
        •  
          组与组之间无关系,组内分配partition消费
      •  
        消费位移
        •  
          __consumer_offset
          •  
            指定formatter工具类解析topic内的数据
        •  
          确定groupid的分区
          •  
            groupId的哈希码对总分区数取余
    •  
      configs
      •  
        指令类型
        •  
          变更alter
        •  
          查看describe
      •  
        支持类型
        •  
          topic主题
        •  
          broker
        •  
          用户
        •  
          客户端
      •  
        命令
        •  
          指定类型(--entity-type)
        •  
          指定具体名(--entity-name)
      •  
        配置
        •  
          添加修改配置
          •  
            --config compression.type=gzip
          •  
            --add-config xxx
        •  
          删除配置
          •  
            --delete-config compression.type
以上内容整理于幕布文档

Kafka教程(一)基础入门:基本概念、安装部署、运维监控、命令行使用的更多相关文章

  1. Azure DevOps Server 入门实践与安装部署

    一,引言 最近一段时间,公司希望在自己的服务器上安装本地版的 Azure DevOps Service(Azure DevOps Server),用于项目内的测试,学习.本着学习的目的,我也就开始学习 ...

  2. JVM基础系列第15讲:JDK性能监控命令

    查看虚拟机进程:jps 命令 jps 命令可以列出所有的 Java 进程.如果 jps 不加任何参数,可以列出 Java 程序的进程 ID 以及 Main 函数短名称,如下所示. $ jps 6540 ...

  3. 运维监控-Open-Falcon安装Agent实战篇

    运维监控-Open-Falcon安装Agent实战篇 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 本文参考链接来自:http://book.open-falcon.org/zh/ ...

  4. 安装了nodejs后在命令行运行npm报错

    安装了nodejs后在命令行运行npm报错:Error: Cannot find module 'internal/util/types' 解决方法:删除目录“C:\Users\mengxiaobo\ ...

  5. 在Docker中安装.NET Core(使用命令行工具)

    在Docker中安装.NET Core目前共有两种方法:1,使用命令行工具安装2,使用VS2017来安装 本文主要介绍使用命令行工具来安装: 1,安装Docker(如果本机已经有Docker环境,可以 ...

  6. 在CentOS7.6上安装自动化运维工具Ansible以及playbook案例实操

    前言 Ansible是一款优秀的自动化IT运维工具,具有远程安装.远程部署应用.远程管理能力,支持Windows.Linux.Unix.macOS和大型机等多种操作系统. 下面就以CentOS 7.6 ...

  7. Oracle安装完成后,如何用命令行启动和关闭数据库?

    Oracle安装完成后,如何用命令行启动和关闭数据库? 解答: 打开:STARTUP [FORCE] [RESTRICT] [PFILE= filename] [OPEN [RECOVER][ dat ...

  8. centos 7 查看系统/硬件信息及运维常用命令+联想Y430P无线网卡驱动安装

     centos 7 查看系统/硬件信息及运维常用命令 当前环境:联想Y430P  CentOS 7.3 [root@yan-001 ~] # uname -a # 查看内核/操作系统/CPU信息的Li ...

  9. Windows下安装appium桌面版和命令行版

    安装appium桌面版和命令行版   一 桌面版(打开很慢,常用于辅助元素定位) 1.官网下载window版本:  github search appium desktop download late ...

  10. (大数据工程师学习路径)第一步 Linux 基础入门----基本概念及操作

    本节联练习主要有: 1.环境介绍 2.常用 Shell 命令及快捷键 3.Linux 使用小技巧 一.Linux 桌面环境介绍 相对于现在的 Windows 系统,UNIX/Linux 本身是没有图形 ...

随机推荐

  1. k8s-ingress配置websocket支持

    具体来说,使用的ingress-controller不一样,有关的设置也不太一样 Kubernetes Ingress Controller (k8s官方) 参考 http://github.com/ ...

  2. Elastic:使用ElastAlert发送通知

    ElastAlert是一个简单的框架,用于从Elasticsearch中的数据中发出异常,尖峰或其他感兴趣模式的警报.我们可以在地址https://elastalert.readthedocs.io/ ...

  3. filebeat知识点

    在Filebeat的根目录下,有一个叫做filebeat.yml的文件. filebeat.inputs: - type: log enabled: true paths: - ./sample.lo ...

  4. Centos7主机安装Cockpit管理其他主机

    前提条件:需要管理的每台服务器上都需要安装cockpit 假设Centos7主机安装Cockpit的为A,其他主机为B 如果B上有A的公钥,那么直接连接至B,否则,输入B的用户名密码连接. 问题:在A ...

  5. 21. Fluentd输出插件:rewrite_tag_filter用法详解

    我们在做日志处理时,往往会从多个源服务器收集日志,然后在一个(或一组)中心服务器做日志聚合分析. 源服务器上的日志可能属于同一应用类型,也可能属于不同应用类型.我们可能需要在聚合服务器上对这些不同类型 ...

  6. 在Ubuntu 主机上使用 Cockpit 管理容器

    如果你管理着一台 Linux 服务器,那么你可能正在寻找一个可靠的管理工具.为了这个你可能已经看了 Webmin 和 cPanel 这类软件.但是,如果你正在寻找一种简单的方法来管理还包括了 Dock ...

  7. linux安装Texinfo

    安装步骤 tar zxvf texinfo-5.2.tar.gz cd texinfo-5.2 ./configure --prefix=/usr make make check make insta ...

  8. 工作7年收集到的git命令

    概念 git 中的术语解释: 仓库也叫版本库(repository) stage:暂存区,add 后会存到暂存区,commit 后提交到版本库 git 安装 linux 下安装 git 第一种方法:y ...

  9. P7361 「JZOI-1」拜神 (字符串)

    题意: 给一个串,\(Q\) 次询问区间 \([l,r]\) 中至少出现两次的子串的最大长度. 写LCT是什么东东 以下做法很经典: 先求出 SA 以及 height 数组,然后按 height 从大 ...

  10. 结构体struct知识

    2022-10-12 08:52:03 //    结构体知识#define _CRT_SECURE_NO_WARNINGS 1#include<stdio.h>#include<m ...