Hadoop集成BTrace

1.BTrace

1.1BTrace部署

1.下载BTrace工具包，官网地址：https://kenai.com/projects/btrace/downloads/directory/releases

2.解压btrace-bin.tar.gz，命令如下：

tar -zxvf btrace-bin.tar.gz

3.配置环境变量

BTRACE_HOME=/usr/btrace-bin

PATH=$PATH:$BTRACE_HOME/bin

4.执行btrace（注意：$BTRACE_HOME/bin下btrace、btracec、btracer文件权限）命令如下，表示部署成功：

1.2BTrace脚本

BTrace测试脚本代码：

 importcom.sun.btrace.annotations.*; 

 import static com.sun.btrace.BTraceUtils.*;

 @BTrace

 public class TraceMR

 {

        @TLS privatestaticlongmapperSetupStartTime = 0l;

        @OnMethod(clazz="org.apache.hadoop.mapreduce.Mapper",

                        method="run",

                        location=@Location(where=Where.BEFORE, value=Kind.CALL,clazz="/.*/", method="setup"))

        public static void onMapper_run_Before_Call_setup() {

               mapperSetupStartTime =timeNanos();

               println(strcat("MAP\tSTARTUP_MEM\t",str(used(heapUsage()))));

        }

        @OnMethod(clazz="org.apache.hadoop.mapreduce.Mapper",

                        method="run",

                        location=@Location(where=Where.AFTER, value=Kind.CALL,clazz="/.*/", method="setup"))

        public static void onMapper_run_After_Call_setup() {

               println(strcat("MAP\tSETUP\t",str(timeNanos() -mapperSetupStartTime)));

               println(strcat("MAP\tSETUP_MEM\t",str(used(heapUsage()))));

        }

 }

1.3编译BTrace脚本

编译命令：btracec TraceMR.java

2.Hadoop配置

2.1分发文件

将BTrace文件：$BTRACE_HOME/build目录下的btrace-agent.jar和btrace-boot.jar，以及编译Btrace脚本后生成的class文件分发到各个子节点上。建议使用脚本分发，代码如下：

 #!/usr/bin/envbash

 #Usage:

 #  ./install_btrace.sh <slaves_file>

 #

 # where:

 #    slaves_file = File containing a list of slavemachines

 #

 #Example:

 #  ./install_btrace.sh /root/SLAVE_NAMES.txt

 #Make sure we have all the arguments

 if [$# -ne  ]; then

    echo "Usage: $0<slaves_file>"

    echo " slaves_file = File containing a list of slave machines"

    echo ""

    exit -

 fi

 #Get the slaves file

 declareSLAVES_FILE=$;

 iftest ! -e $SLAVES_FILE; then

    echo "ERROR: The file '$SLAVES_FILE'does not exist. Exiting"

    exit -

 fi

 #Get the slaves file

 declareSLAVES_FILE=$;

 iftest ! -e $SLAVES_FILE; then

    echo "ERROR: The file '$SLAVES_FILE'does not exist. Exiting"

    exit -

 fi

 MASTER_BTRACE_DIR=/home/wangpeng/zhiming/usr/btrace/build

 SLAVES_BTRACE_DIR=/home/wangpeng/zhiming/usr

 forslave in `cat "$SLAVES_FILE"`; do

 {

    printf "Installing on host:$slave\n"

    ssh $slave "mkdir -p$SLAVES_BTRACE_DIR"

    scp ${MASTER_BTRACE_DIR}/btrace-agent.jar$slave:$SLAVES_BTRACE_DIR/.

    scp ${MASTER_BTRACE_DIR}/btrace-boot.jar$slave:$SLAVES_BTRACE_DIR/.

    scp ${MASTER_BTRACE_DIR}/TraceMR.class$slave:$SLAVES_BTRACE_DIR/.

 }

 done

2.2配置Hadoop文件

在所有子节点的$HADOOP_HOME安装目录下找到mapred-site.xml文件，进行如下设置：

代码：

 <property>

          <name>mapred.map.child.java.opts</name>

          <value>

      -Xmx1024m -javaagent:/home/wangpeng/zhiming/usr/btrace/build/btrace-agent.jar     =script=/home/wangpeng/zhiming/usr//TraceMR.class,stdout=true,noServer=true

          </value>

 </property>

2.3运行MR程序

1.准备一个写好的MR程序，如WordCount.java程序；

2.执行hadoop jar WordCount.jar WordCount /user/wzm/input /user/wzm/output。

2.4查看输出文件

在所有子节点的$HADOOP_HOME安装目录下找到logs目录中的stdout文件，执行命令：cat stdout，且有如下输出表示配置成功：

BTrace追踪Hadoop部署的更多相关文章

利用神器BTrace 追踪线上 Spring Boot应用运行时信息
概述生产环境中的服务可能会出现各种问题,但总不能让服务下线来专门排查错误,这时候最好有一些手段来获取程序运行时信息,比如接口方法参数/返回值.外部调用情况以及函数执行时间等信息以便定位问题.传 ...
hadoop部署小结的命令
hadoop部署总结的命令学习笔记,转自:hadoop部署总结的命令http://www.aboutyun.com/thread-5385-1-1.html(出处: about云开发)
Hadoop 部署文档
Hadoop 部署文档 1 先决条件 2 下载二进制文件 3 修改配置文件 3.1 core-site.xml 3.2 hdfs-site.xml 3.3 mapred-site.xml 3.4 ya ...
hadoop进阶----hadoop经验(一)-----生产环境hadoop部署在超大内存服务器的虚拟机集群上vs几个内存较小的物理机
生产环境 hadoop部署在超大内存服务器的虚拟机集群上好还是几个内存较小的物理机上好? 虚拟机集群优点虚拟化会带来一些其他方面的功能. 资源隔离.有些集群是专用的,比如给你三台设备只跑一个 ...
Hadoop部署方式-完全分布式(Fully-Distributed Mode)
Hadoop部署方式-完全分布式(Fully-Distributed Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本博客搭建的虚拟机是伪分布式环境(https://w ...
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode)
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载相应的jdk和Hadoop安装包 JDK:h ...
Hadoop部署方式-本地模式(Local (Standalone) Mode)
Hadoop部署方式-本地模式(Local (Standalone) Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. Hadoop总共有三种运行方式.本地模式(Local ...
hadoop部署中遇到ssh设置的问题
尽管hadoop和一些培训视频课程上讲分布式部署比较详细,但是在部署时仍遇到了一些小问题,在此mark一下: 1.linux的namenode主机上安装了ssh,也启动了ssh,并且执行了: /etc ...
hadoop部署工具与配置工具
https://github.com/xianglei/phpHiveAdmin 随着Hadoop的推出,大数据处理实现了技术上的落地.但是对于一般的公司和开发者而言,Hadoop依旧是一个陌生或者难 ...

随机推荐

rabbitMQ应用，laravel生产广播消息，springboot消费消息
最近做一个新需求,用户发布了动态,前台需要查询,为了用户读取信息响应速度更快(MySQL很难实现或者说实现起来很慢),所以在用户动态发布成功后,利用消息机制异步构建 redis缓存和 elastic ...
【pc杂谈】win7系统通过虚拟网卡共享wifi
用管理员权限进入dos命令行启用并设定虚拟WiFi网卡:netsh wlan set hostednetwork mode=allow ssid=paulnet key=paulwinflo(注意 ...
Mysql慢查询日志过程
原创地址 :http://itlab.idcquan.com/linux/MYSQL/922126.html mysql慢查询日志对于跟踪有问题的查询非常有用,可以分析出代码实现中耗费资源的sql语句 ...
C# 与 Oracle 中 BINARY_DOUBLE数据类型查询
Oracle 10g新增 BINARY_DOUBLE 数据类型,而.NET暂不支持这个类型,查询时需要转换为 NUMBER. eg: "SELECT RAWTOHEX(OID) AS OID ...
hadoop-2.7.1：Error: Cannot find configuration directory: /etc/hadoop
本文转载自:http://blog.csdn.net/huangshanchun/article/details/49533433 安装hadoop参考:http://blog.csdn.net/hi ...
(转)SQL SERVER 日志已满的处理方法
本文转载自:http://www.cnblogs.com/eycbest/archive/2012/01/04/2311567.html 事务日志文件Transaction Log File是用来记录 ...
符合RESTful规范的API
统一使用的utils,serializers: class BaseResponse: def __init__(self): self.code = 1000 self.data = None se ...
@JsonIgnore的源码说明
@JsonIgnore不仅仅是在getter上有影响,也对setter方法有影响: 所在包:com.fasterxml.jackson.annotation; 源码: import java.lang ...
react之echarts数据更新
react之echarts数据更新在使用setState更新数据时,如果要将图标更新,需要做一些简单的封装,代码如下: import React, { Component } from 'react ...
跟我学算法-图像识别之图像分类（上）(基础神经网络，卷积神经网络（CNN)， AlexNet，NIN, VGG）
1.基础神经网络: 输入向量x,权重向量w, 偏置标量b, 激活函数sigmoid(增加非线性度) 优化手段: 梯度下降优化, BP向后传播(链式规则) 梯度下降优化: 1. 使用得目标函数是交叉熵 ...

BTrace追踪Hadoop部署