Storm 重启排查

Storm实战常见问题及解决方案 https://www.cnblogs.com/catkins/p/5302634.html Storm 重启排查(续) https://www.iteye.com/blog/1358440610-qq-com-2391605…

storm新加节点,重启topology后,出现错误如果检查了CPU和内存不高后,还出现 java.lang.OutOfMemoryError: unable to create new native thread ,此时需要检查linux最大支持的线程数. ulimit -u 查询当前整个系统已用的线程或进程数pstree -p | wc -l vi /etc/security/limits.d/90-nproc.confcat /etc/security/limits.conf 修改可支…

服务器意外重启导致storm报错的问题处理

解决方法 cat /opt/storm-0.8.2/conf/storm.yaml中找到storm.local.dir设定的目录,备份supervisor和workers两个文件夹,#nohup supervise /service/storm/ &重启错误如下 2014-06-17 12:27:05,267 INFO [main] daemon.supervisor (NO_SOURCE_FILE:invoke(0)) - Starting supervisor with id xxx at…

Storm介绍(一)

作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 内容简介本文是Storm系列之一,介绍了Storm的起源,Storm作者的八卦,Storm的特点和Storm模型的基本原理,着重介绍了Storm中的基本概念(Spout, Bolt, Stream, Tuple等)和对应的编程接口,可以作为Storm的入门文档来阅读. 八卦之前的技术文章都写的有点一板一眼,太正经了.今天在文章正式开始前,跟大家八卦一下Storm的…

027 storm面试小题

1.大纲 Storm工作原理是什么? 流的模式是什么?默认是什么? 对于mapreduce如何理解? Storm的特点和特性是什么? Storm组件有哪些? 2.Storm工作原理是什么? 相对于hadoop而言,strom的优势在于对于应对大数据两的实时数据处理上,因为hadoop在处理大数据过程中高延时的特点使得其面对实时数据缺乏足够的应对策略,目前strom已经被广泛的应用在诸如金融系统,实时推送系统,预警系统,网站统计等多个场景中,他可伸缩性高,不存在数据丢失,高容错性,高健壮性等特点都…

（第8篇）实时可靠的开源分布式实时计算系统——Storm

摘要: 在Hadoop生态圈中,针对大数据进行批量计算时,通常需要一个或者多个MapReduce作业来完成,但这种批量计算方式是满足不了对实时性要求高的场景.那Storm是怎么做到的呢? 博主福利给大家赠送一套hadoop视频课程授课老师是百度 hadoop 核心架构师内容包括hadoop入门.hadoop生态架构以及大型hadoop商业实战案例. 讲的很细致, MapReduce 就讲了 15 个小时. 学完后可以胜任 hadoop 的开发工作,很多人学的这个课程找到的工作. (包括指导…

Storm集群安装Version1.0.1开启Kerberos

Storm集群安装,基于版本1.0.1, 同时开启Kerberos安全认证, 使用apache-storm-1.0.1.tar.gz安装包. 1.安装规划角色规划 IP/机器名安装软件运行进程 UI, nimbus zdh-237 storm core,nimbus supervisor zdh-238 storm supervisor,worker,LogWriter supervisor zdh-239 storm supervisor,worker,LogWriter Storm集群…

Storm集群安装Version1.0.1

Storm集群安装,基于版本1.0.1, 使用apache-storm-1.0.1.tar.gz安装包. 1.安装规划角色规划 IP/机器名安装软件运行进程 nimbus zdh-237 storm core,nimbus supervisor zdh-238 storm supervisor,worker,LogWriter supervisor zdh-239 storm supervisor,worker,LogWriter 2.安装用户 storm/zdh1234 useradd…

MySQL Backup--Xtrabackup备份异常(MySQL Server has gone away)

错误场景MySQL 版本:5.7.24XtraBackup 版本:2.4.8CentOS 版本:6.5 MySQL需要新增一个从库,为避免XtraBackup备份影响生产,选择在从库上进行备份,备份脚本为: innobackupex \ --socket=${mysql_socket} \ --user=${mysql_user} \ --password=${mysql_pwd} \ --defaults-file=${mysql_config_file} \ --slave-info \ $…

STORM在线业务实践-集群空闲CPU飙高问题排查

源:http://daiwa.ninja/index.php/2015/07/18/storm-cpu-overload/ 2015-07-18AUTHORDAIWA STORM在线业务实践-集群空闲CPU飙高问题排查有2条评论 STORM在线业务实践-集群空闲CPU飙高问题排查最近将公司的在线业务迁移到Storm集群上,上线后遇到低峰期CPU耗费严重的情况.在解决问题的过程中深入了解了storm的内部实现原理,并且解决了一个storm0.9-0.10版本一直存在的严重bug,目前代码已经合并…

TPS低，CPU高--记一次storm压测问题排查过程

一.业务背景+系统架构本次场景为kafka+storm+redis+hbase,通过kafka的数据,进入storm的spout组件接收,转由storm的Bolt节点进行业务逻辑处理,最后再推送进kafka. 表数据相关的逻辑为:查询Hbase表数据,首次查询会写入redis和storm cache,再次查询,会直接从redis或cache中取值. storm应用: 二.性能测试场景 1.数据:json类型的用户偏好数据700万 2.灌入方式:java脚本 3.hbase表:生产全量数据导入…

STORM在线业务实践-集群空闲CPU飙高问题排查（转）

最近将公司的在线业务迁移到Storm集群上,上线后遇到低峰期CPU耗费严重的情况.在解决问题的过程中深入了解了storm的内部实现原理,并且解决了一个storm0.9-0.10版本一直存在的严重bug,目前代码已经合并到了storm新版本中,在这篇文章里会介绍这个问题出现的场景.分析思路.解决的方式和一些个人的收获. 背景首先简单介绍一下Storm,熟悉的同学可以直接跳过这段. Storm是Twitter开源的一个大数据处理框架,专注于流式数据的处理.Storm通过创建拓扑结构(Topolog…

排查在 Azure 中创建、重启 Windows VM 或调整其大小时发生的分配失败

创建 VM.重新启动已停止(解除分配)的 VM 和重设 VM 大小时,Azure 会为订阅分配计算资源. 执行这些操作时,即使尚未达到 Azure 订阅限制,也可能偶尔收到错误. 本文说明一些常见分配故障的原因,并建议可能的补救方法. 计划服务的部署时,本信息可能也有用. 还可以排查在 Azure 中创建.重新启动 Linux VM 或调整其大小时发生的分配失败. 如果本文未解决你的 Azure 问题,请访问 MSDN 和 CSDN 上的 CSDN Azure 论坛. 你可以在这些论坛上发布你的…

排查在 Azure 中创建、重启 Linux VM 或调整其大小时发生的分配故障

创建 VM.重启已停止(解除分配)的 VM 和重设 VM 大小时,Azure 会为订阅分配计算资源. 执行这些操作时,即使尚未达到 Azure 订阅限制,也可能偶尔收到错误. 本文说明一些常见分配故障的原因,并建议可能的补救方法. 计划服务的部署时,本信息可能也有用. 还可以用于排查在 Azure 中创建.重启 Windows VM 或调整其大小时发生的分配故障. 如果本文未解决你的 Azure 问题,请访问 MSDN 和 CSDN 上的 CSDN Azure 论坛. 你可以在这些论坛上发布你的…

nginx重启后，反向代理失败之问题排查记录

问题与排查过程本地开发环境的服务器,部署了nginx,nginx上对静态的web前端页面进行了http 80端口代理:然后呢,因为一些原因,服务器重启了,重启服务器后,我去把nginx启动起来,但是nginx怎么也代理不了80端口,问题如下: 浏览器访问没响应,本地telnet服务器的80端口是通的,使用wireshark抓包,过程如下: 包3-包7,tcp 三次握手: 包8,本机给开发服务器发了http请求: 包9,本机重传: 包10,服务器返回ack,确认收到请求,但是依然没有请求返回.…

Oracle RAC服务器重启故障排查

Oracle Real Application Clusters(Oracle RAC),相对于Oracle单实例来说部署安装和维护都增加了难度,尤其在日常的维护和故障处理过程中,各种日志的查看更加重要,本文主要对Oracle 11g 集群下的目录结构和路径进行介绍和说明. 以下是集群目录下日志结构,以及对应目录的功能说明,对排查问题尤其重要. [grid@dbrac1 dbrac1]$ tree -d . ├── acfslog ├── acfsrepl ├── acfsreplroot ├─…

kali linux重启网卡失败：Job for networking.service failed because the control process exited with error code. See "systemctl status networking.service" and "journalctl -xe" for details. 问题排查

linux菜鸡的时候,总是为了配置网络而烦恼,重启网卡的原因有很多,我这次是因为配置了固定IP[使用第三方工具连接]所以需要重启网卡,出现 Job for networking.service failed because the control process exited with error code. See "systemctl status networking.service" and "journalctl -xe" for details,网上搜索…

kubenetes master重启以后，服务异常排查

k8s集群环境:三台机器,一台master,三个node(每台都安装node服务) 问题藐视:重启的时候,发现master的服务都能正常启动,但是就是不好使,看/var/log/message日志也没有报错,…

[troubleshoot][daily][redhat] 设备反复重启故障排查

一台服务器设备,反复重启,每天重启数次. 一: 原因分析及初步排异. 1. 硬件,内存主板,一一更换,甚至除了硬盘将整台机器都换掉了,依然重启. 2. 排除电源问题,换了电源线,换了插座,还是重启. 3. 那么接下来,还有三种可能: A.内核问题,内核crash.(redhat的稳定性还是十分让人信赖的,这种可能性不高) B.硬盘或文件系统故障.本质上,这样会导致内核crash. C.程序自主reboot.(我们自己的程序reboot,或进了黑客放了reboot脚本.好无聊的黑客....)…

Tomcat Docker容器自动重启问题排查

1. 问题前两天发现 APP 刷新数据偶尔出现等半天没有响应的情况,感觉不像 APP 的问题,就查了下服务端的日志. 服务端用的是 Java,部署采用的 Docker 官方的 tomcat 镜像,并进行了基本的裁剪,Dockerfile 文件内容如下: FROM tomcat:8.0.36-jre8 MAINTAINER blog.smoker.cc@gmail.com RUN rm -rf /usr/local/tomcat/webapps && mkdir /usr/local/to…

Mysql异常问题排查与处理——mysql的DNS反向解析和客户端网卡重启

中午刚想趴一会,不料锅从天降!!!Mysql连不上了....... 现象如下: 现象1:登录mysql所在服务器,连接MySQL 成功: 现象2:通过客户端远程连接MySQL,返回失败,如下: Enter password: ERROR 2003 (HY000): Can't connect to MySQL server on 'xxx' (111) 现象三:通过某些客户端可以连,就是响应极慢. 现象四:通过客户端可以ping通,但是telnet 数据库端口失败.且无论ping还是telnet…

记录一次MySQL进程崩溃，无法重启故障排查

最近程序在跑着没几天,突然访问不了,查看应用进程都还在.只有数据库的进程down掉了.于是找到日志文件看到如下错误 -- :: [Note] InnoDB: Initializing buffer pool, size = 512.0M InnoDB: mmap( bytes) failed; errno -- :: [ERROR] InnoDB: Cannot allocate memory for the buffer pool -- :: [ERROR] Plugin 'InnoDB' i…

Zookeeper+Kafka+Storm+HDFS实践

Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据. Hadoop一般用在离线的分析计算中,而storm区别于hadoop,用在实时的流式计算中,被广泛用来进行实时日志处理.实时统计.实时风控等场景,当然也可以用在对数据进行实时初步的加工,存储到分布式数据库中如HBase,便于后续的查询.面对的大批量的数据的实时计算,storm实现了一个可扩展的.低延迟.可靠性和容错的分布式计算平台.1.对象介绍tuple:表示流中一个基本的处理单元,可以包括多个fi…

基于Flume+Kafka+ Elasticsearch+Storm的海量日志实时分析平台（转）

0背景介绍随着机器个数的增加.各种服务.各种组件的扩容.开发人员的递增,日志的运维问题是日渐尖锐.通常,日志都是存储在服务运行的本地机器上,使用脚本来管理,一般非压缩日志保留最近三天,压缩保留最近1个月,其它直接删除或迁移到日志服务器上. 运维会将这些日志mount到远程的日志服务器上,然后开发人员使用运维分配的账号登陆堡垒机器跳转到日志服务器上查看不同项目不同机器的日志. 下图是日志服务器某一个项目的所有ip日志目录截图,相信大家传统的查看日志类似这样. 如果你要查阅不同的项目,项目机器数十…

Storm开发过程中的问题与建议

转自:http://blog.csdn.net/ouyang111222/article/details/50061305 (一) topology层级建议设不要设置过多 storm讲究是流式计算,spout发送数据,下游的bolt处理数据,数据的处理计算就像流水线作业一样,每一个节点完成特定的工序:但是这种流水作业的深度不易过长,比如节点A对数据进行split操作,节点B对split之后的数据进行filter过滤,这两个节点完全可以合并在一起.如果topology层级过多,消耗的资源多:节点多…

jvm file.encoding 属性引起的storm/hbase乱码

1. 问题今天为storm程序添加了一个计算bolt,上线后正常,结果发现之前的另一个bolt在将中文插入到hbase中后查询出来乱码.其中字符串是以UTF-8编码的url加密串,然后我使用的URLDecoder.decode(str, "UTF-8")解码,最后插入到hbase中. 2. 排查 (1)hbase中的数据传输都是使用的UTF-8,因此肯定不会出问题,故排除hbase端的问题: (2)既然在测试的时候没乱码,线上却乱码,想到肯定是线上机子jvm环境的问题: (3)确定了…

近期开发storm遇到一些问题的解决点

storm开发解决问题点1.kafka消费速度跟不上问题这个问题可以从加大topic partition进行解决,可以在topic正在运行时候运行命令 ./kafka-topics --alter --zookeeper rhel071:2181 --topic heartbeat --partitions 6进行扩容,并且只能往上扩容,不能减少partition.每个partition会对应一个storm的spout,所以能整体增加消费速度.当然如果kafka下面log挂了多个磁盘,那么多个…

Storm如何保证可靠的消息处理

作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 本文主要翻译自Storm官方文档Guaranteeing message processing,但我觉得官方文档写的有些随意,啰嗦,所以做了一些修改,里面的配图自己重新画了,能够更加贴切的表达意思. 内容简介 Storm可以保证从Spout发出的每个消息都能被完全处理.Storm的可靠性机制是完全分布式的(distributed),可伸缩的(scalable),容错的…

myrocks复制中断问题排查

背景 mysql可以支持多种不同的存储引擎,innodb由于其高效的读写性能,并且支持事务特性,使得它成为mysql存储引擎的代名词,使用非常广泛.随着SSD逐渐普及,硬件存储成本越来越高,面向写优化的rocksdb引擎逐渐流行起来,我们也是看中了rocksdb引擎在写放大和空间放大的优势,将其引入到mysql体系.两种引擎的结构B-Tree(innodb引擎)和LSM-Tree(rocksdb引擎)很好地形成互补,我们可以根据业务类型来选择合适的存储.一般mysql默认是mysql+innod…

理解Storm并发

作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 注:本文主要内容翻译自understanding-the-parallelism-of-a-storm-topology 本篇文章介绍了Storm拓扑的并发模型.介绍了Worker进程,Executor(线程)和Task(任务)之间的关系,如何按照需要配置他们.本文基于Storm 0.8.1版本,最新发布版本已经到了0.9.5了. 对于不了解Storm的朋友,可以先去…