高吞吐量的分布式发布订阅消息系统Kafka-- 管理工具 Kafka Manager

一、概述

Kafka在雅虎内部被很多团队使用,媒体团队用它做实时分析流水线,可以处理高达20Gbps(压缩数据)的峰值带宽。
　　为了简化开发者和服务工程师维护Kafka集群的工作，构建了一个叫做Kafka管理器的基于Web工具，叫做 Kafka Manager。这个管理工具可以很容易地发现分布在集群中的哪些topic分布不均匀，或者是分区在整个集群分布不均匀的的情况。它支持管理多个集群、选择副本、副本重新分配以及创建Topic。同时，这个管理工具也是一个非常好的可以快速浏览这个集群的工具。
　　该软件是用Scala语言编写的。目前(2015年02月03日)雅虎已经开源了Kafka Manager工具。这款Kafka集群管理工具主要支持以下几个功能：
　　1、管理几个不同的集群；
　　2、很容易地检查集群的状态(topics, brokers, 副本的分布, 分区的分布)；
　　3、选择副本；
　　4、产生分区分配(Generate partition assignments)基于集群的当前状态；
　　5、重新分配分区。

二、Kafka Manager下载及安装

项目地址：https://github.com/yahoo/kafka-manager

这个项目比 https://github.com/claudemamo/kafka-web-console 要好用一些，显示的信息更加丰富，kafka-manager本身可以是一个集群。

不过kafka-manager也没有权限管理功能。

下载：

git clone git@github.com:yahoo/kafka-manager.git

下载完后，只能源代码你什么也做不了，我们要把项目编译打包，该软件是用Scala语言编写，把有编译打包很麻烦，他依赖于sbt。sbt比较难安装。

三、sbt安装

1、下载sbt-0.13.11

我的服务器是centos 自动安装几次没有成功，我还是选择手动安装。

请自己到http://www.scala-sbt.org/download.html下载最新版本，我的版本是sbt-0.13.11

$ sudo mkdir /opt/scala/sbt

$ sudo tar zxvf sbt-0.13.11.tgz -C /opt/scala/

　 3、建立启动sbt的脚本文件

/*选定一个位置，建立启动sbt的脚本文本文件，如/opt/scala/sbt/ 目录下面新建文件名为sbt的文本文件*/

$ cd /opt/scala/sbt/

$ vim sbt

/*在sbt文本文件中添加

BT_OPTS="-Xms512M -Xmx1536M -Xss1M -XX:+CMSClassUnloadingEnabled -XX:MaxPermSize=256M"

java $SBT_OPTS -jar /opt/scala/sbt/bin/sbt-launch.jar "$@"

然后按esc键 输入 :wq 保存退出，注意红色字体中的路径可以是绝对路径也可以是相对路径，只要能够正确的定位到解压的sbt文件包中的sbt-launch.jar文件即可*/

　　并修改sbt文件权限

$ chmod u+x sbt

　　4、配置PATH环境变量，保证在控制台中可以使用sbt命令

$ vim /etc/profile

/*在文件尾部添加如下代码后，保存退出*/

export PATH=/opt/scala/sbt/:$PATH

/*使配置文件立刻生效*/

$ source /etc/profile

　 5、测试sbt是否安装成功
第一次执行时，会下载一些文件包，然后才能正常使用，要确保联网了，下载的过程分很慢。安装成功后显示如下

sbt sbt-version
[info] Set current project to sbt (in build file:/opt/scala/sbt/)
[info] 0.13.11

四、编绎打包

cd kafka-manager

sbt clean dist

　　生成的包会在kafka-manager/target/universal 下面。生成的包只需要java环境就可以运行了，在部署的机器上不需要安装sbt。

如果打包会很慢的要有点耐心呀，还有可能打包失败，可以考虑配置代理。

四、Kafka Manager部署

1、打好包好，在部署机器上解压，修改好配置文件，就可以运行了--解压

unzip kafka-manager-1.0-SNAPSHOT.zip

　2、修改conf/application.conf，把kafka-manager.zkhosts改为自己的zookeeper服务器地址

kafka-manager.zkhosts="192.168.1.237:2181"

　3、启动

cd kafka-manager-1.0-SNAPSHOT/bin

./kafka-manager -Dconfig.file=../conf/application.conf

　4、查看帮助和后台运行

./kafka-manager -h

nohup ./kafka-manager -Dconfig.file=../conf/application.conf >/dev/null 2>&1 &

　说明：正常来说，play框架应该会自动加载conf/application.conf配置里的内容，但是貌似这个不起作用，要显式指定才行。

参考： https://github.com/yahoo/kafka-manager/issues/16

5、默认http端口是9000，可以修改配置文件里的http.port的值，或者通过命令行参数传递：

./kafka-manager -Dhttp.port=9001

五、sbt 配置代理

sbt的配置http代理的参考文档：http://www.scala-sbt.org/0.12.1/docs/Detailed-Topics/Setup-Notes.html#http-proxy

通过-D设置叁数即可：

java -Dhttp.proxyHost=myproxy -Dhttp.proxyPort=8080 -Dhttp.proxyUser=username -Dhttp.proxyPassword=mypassword

　　也可以用下面这种方式，设置一下SBT_OPTS的环境变量即可：

export SBT_OPTS="$SBT_OPTS -Dhttp.proxyHost=myproxy -Dhttp.proxyPort=myport"

　　注意：myproxy，这个值里不要带http前缀，也不要带端口号。

比如，你的代理是http://localhost:8123，那么应该这样配置：

export SBT_OPTS="$SBT_OPTS -Dhttp.proxyHost=localhost -Dhttp.proxyPort=8123"

高吞吐量的分布式发布订阅消息系统Kafka-- 管理工具 Kafka Manager的更多相关文章

高吞吐量的分布式发布订阅消息系统Kafka--安装及测试
一.Kafka概述 Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据. 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因 ...
kafka 基础知识梳理-kafka是一种高吞吐量的分布式发布订阅消息系统
一.kafka 简介今社会各种应用系统诸如商业.社交.搜索.浏览等像信息工厂一样不断的生产出各种信息,在大数据时代,我们面临如下几个挑战: 如何收集这些巨大的信息如何分析它如何及时做到如上两点 ...
Kafka — 高吞吐量的分布式发布订阅消息系统【转】
1.Kafka独特设计在什么地方?2.Kafka如何搭建及创建topic.发送消息.消费消息?3.如何书写Kafka程序?4.数据传输的事务定义有哪三种?5.Kafka判断一个节点是否活着有哪两个条件 ...
一脸懵逼学习KafKa集群的安装搭建--（一种高吞吐量的分布式发布订阅消息系统）
kafka的前言知识: :Kafka是什么? 在流式计算中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算.kafka是一个生产-消费模型. Producer:生产者,只负责数 ...
高吞吐量的分布式发布订阅消息系统Kafka之Producer源码分析
引言 Kafka是一款很棒的消息系统,今天我们就来深入了解一下它的实现细节,首先关注Producer这一方. 要使用kafka首先要实例化一个KafkaProducer,需要有brokerIP.序列化 ...
高吞吐量的分布式发布订阅消息系统Kafka--spring-integration-kafka的应用
一.概述 Spring Integration Kafka 是基于 Apache Kafka 和Spring Integration来集成Kafka,对开发配置提供了方便. 二.配置 1.spring ...
分布式发布订阅消息系统Kafka
高吞吐量的分布式发布订阅消息系统Kafka--安装及测试一.Kafka概述 Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据. 这种动作(网页浏览, ...
Kafka logo分布式发布订阅消息系统 Kafka
分布式发布订阅消息系统 Kafka kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳 ...
kafka高吞吐量的分布式发布订阅的消息队列系统
一:kafka介绍kafka(官网地址:http://kafka.apache.org)是一种高吞吐量的分布式发布订阅的消息队列系统,具有高性能和高吞吐率. 1.1 术语介绍BrokerKafka集群 ...

随机推荐

Git 常用几个操作
获取 git clone git@github.com:XXX/learning.git 更新 git pull 添加 git add XXX 上传本地 git commit -m "ap ...
PHP程序设计经典300例
不知道怎么转载,原文源自:http://bbs.php100.com/u-htm-uid-330857.html 来自:php100钟泽锋第一例<?php $s_html="< ...
配置ubuntu 14.04.3 LTS odoo 9.0开发环境
使用VMware Fusion 8.0.1创建ubuntu 64bit虚拟机:使用ubuntu-14.04.3-desktop-amd64.iso镜像缺省安装ubuntu,用户名odoo,密码1234 ...
[C#] 與Android共舞–透過GET方式傳資料給Server(含解決中文編碼問題) (转帖)
上一篇文章分享了透過POST 方式傳資料回Server,這一篇來談談有關於透過GET的方式傳遞首先,如我預期的一樣,透過網址傳遞,會產生編碼問題,這邊我就順代解掉,希望有碰到的人可以不用為此煩惱. ...
JQuery中动态生成元素的绑定事件（坑死宝宝了）
今天在做项目的时候,遇到了一个前端的问题,坑了我好长时间没有解决,今天就记录于此,也分享给大家. 问题是这样的,首先看看我的界面,有一个初始印象: 下面是操作列所对应的JS代码: { "da ...
团队项目—编写项目的Spec
一.Spec的目标 spec又叫Specification, 有两种.第一种是functional spec, 软件功能说明书, 主要用来说明软件的外部功能, 和用户的交互情况.第二种technica ...
作业七：团队项目——Alpha版本冲刺阶段-02
昨天进展:框架设计以及菜单设计. 今天安排:完善界面设计以及象棋图片的绘制. 小组一共三人,陈芝航因家里有事,与我们进行了QQ视屏会议.
[ACM_模拟][ACM_数学] LA 2995 Image Is Everything [由6个视图计算立方体最大体积]
Description Your new company is building a robot that can hold small lightweight objects. The robo ...
Javascript之document对象用法（很重要）
一.找到元素 document.getElementById("id"):根据id找层,最多找一个 var a=document.getElementById("id&q ...
1119 网页布局，css写下拉列表
<style type="text/css"> *{ margin:0px; padding:0px;} #body{ width:1000px; height:200 ...

高吞吐量的分布式发布订阅消息系统Kafka-- 管理工具 Kafka Manager

高吞吐量的分布式发布订阅消息系统Kafka-- 管理工具 Kafka Manager的更多相关文章

随机推荐

热门专题