说明:大数据时代,传统运维向大数据运维升级换代很常见,也是个不错的机会。如果想系统学习大数据运维,个人比较推荐通信巨头运维大咖的分享课:https://url.cn/5HIqOOr,主要是实战强、含金量高、专注度高,有6个专题+2个大型项目+腾讯云服务器,真枪实弹传授上千大数据集群运维经验。
 
课程介绍:
 
这是专门为IT运维人员设计的高端大数据课程,可能也是目前的 only  one!课程内容从100多份招聘要求中萃取知识点,再邀请几位年薪60W+的大数据运维专家共同商讨打磨而成。传统运维人员工作~忙~累~苦~而又工资低,多年运维老手的工资往往不如刚毕业一两年的码农。本课程意在借大数据红利之势,帮助大家抓住机遇拿下高薪,职业华丽升级转型!
 
课程以电信运营商实战项目为导向,结合企业大数据运维实际应用场景,一步步带着学员掌握大数据运维各个技术环节。通过《从0建设大数据平台》实战,让学员有能力帮助企业实现大数据平台从无到有;通过《大规模集群运维实战》实战,让学员有能力保障维护大型大数据集群的稳定、有效、安全。课程在考虑内容覆盖面同时,非常注重实用性,力求让学员所学即所用,切实解决企业工作中的实际问题,拒绝无用功和假把式。文档丰富详尽,大部分内容来自上千节点产线环境之实践,或许你能整理出一份大数据运维”九阴真经“。
 
课程亮点:
实战性强:以解决企业实际问题为导向。从0建设大数据平台项目,解决企业大数据平台从无到有的迫切问题。大规模集群运维实战,解决企业如何平稳运行和维护大数据平台。
含金量高:采用Cloudra Manager构建企业级大数据平台,传授上千节点大数据运维经验,解决千亿级别大数据集群产线问题。
专注度高:专注于大数据运维,课程涵盖大数据集群规划、集群部署、集群安全、集群监控、集群容器化、集群运维,培养大数据运维专业人才。
 
 
适合人群:
1.IT运维人员提升拿高薪
2.网管/技术支持蜕变转型涨薪
3.Leader/架构师 扩充技术栈
4.大专/本科学生轻松入行大数据
 
就业岗位:
1.大数据运维工程师
2.大数据平台架构师
3.大数据平台运维
 
 
 
课程大纲:
第一章 大数据运维通识
1.大数据概述及技术生态介绍
2.大数据运维及其他部门如何分工协作
3.大数据运维需要掌握哪些必备技能
4.如何成为高薪的大数据运维人才
 
第二章 大数据集群规划
1.网络规划
1.1机房区域划分
1.2机房三层网络结构
1.3网络带宽规划(千兆,万兆)
1.4主机网卡bond模式
 
2.集群规划
2.1集群业务规划
2.2集群节点规划
2.2.1HDFS集群节点规划
2.2.2HBase集群节点规划
2.2.3Kafka集群节点规划
2.2.4Zookeeper节点规划
2.2.5YARN节点规划
2.2.6ElasticSearch节点规划
2.3存储规划
2.3.1Raid规划
2.3.2多磁盘规划
 
第三章 大数据集群搭建
1.集群安装部署方式
1.1Ambari+hdp自动化部署
1.2CM+cdh自动化部署
1.3Hadoop手动安装部署
 
2.集群部署平台选择
2.1阿里云
2.2EC2
2.3物理服务器
 
3.大数据技术组件部署
3.1Zookeeper集群安装
3.2HDFS集群安装
3.3YARN集群安装
3.4Hive客户端安装
3.5HBase集群安装
3.6Kafka集群安装
3.7Spark集群安装
3.8Flink集群安装
3.9接口机/跳板机安装
 
4.核心技术组件体系结构
4.1HDFS体系结构
4.2YARN体系结构
4.3HBase体系结构
4.4Kafka体系结构
 
第四章 大数据集群安全
1.HDFS ACL存储权限控制
2.资源队列权限控制
3.HDFS Sentry权限控制
4.vpn权限控制
5.云桌面权限控制
 
第五章 大数据集群监控
1.集群级别监控
1.1集群cpu负载
1.2集群磁盘IO负载
1.3集群网络IO负载
1.4HDFS IO负载
1.5集群内存负载
 
2.YARN监控
2.1ResourceManager运行状况
2.2NodeManager运行状况
2.3JobHistory Server运行状况
2.4应用程序监控
2.5容器监控
2.6JVM监控
2.7RPC监控
2.8作业监控
2.9资源队列监控
 
3.HDFS监控
3.1容量监控
3.2DataNode读写监控
3.3事务监控
3.4编辑日志监控
3.5Rpc监控
3.6JVM堆栈监控
 
4.Kafka监控
4.1Broker监控
4.2topic 分区监控
4.3IO监控
 
5.Zookeeper监控
5.1进程IAAS层指标监控
5.2运行状况监控
5.3连接情况监控
5.4请求监控
5.5数据包监控
5.6JVM监控
 
6.HBase监控
6.1regionserver区域监控
6.2读写请求监控
6.3事件监控
6.4运行状态监控
6.5JVM监控
6.6关键节点主机指标监控
 
第六章 大数据容器化技术
1.Docker容器化技术
1.1Docker实现原理
1.2Docker安装部署
1.3Docker容器管理
1.4Docker镜像及仓库管理
1.5Spark ON Docker集群搭建
 
2.Kubernetes(k8s)容器化技术
2.1k8s快速入门
2.2k8s系统架构
2.3k8s基础组件说明
2.4k8s基础服务安装
2.5k8s分布式安装
2.6k8s Nginx部署
 
3.大数据容器化技术实践
3.1基于kubernetes(k8s)调度的Flink大数据流式计算
3.2Docker+k8s容器化技术在大数据应用服务的落地实践
3.3Docker+k8s部署、监控实践
 
 
 
项目一:从0建设大数据平台
 
1.大数据平台前期调研
1.1历史数据总量
1.2数据每天增长量
1.3数据TTL
 
2.集群硬件规划
2.1总体规划的考虑
2.1.1集群规模控制因素
1)依据数据量计算磁盘总量
2)依据数据块计算NameNode内存总量
3)依据任务量和性能计算集群数量
2.1.2集群构建考虑因素
1)构建HA高可用集群
2)物理机、云主机
3)部署方式选择:原生集群、CDH集群、hdp集群
2.2集群硬件选择    
2.2.1主节点配置
2.2.2从节点配置
2.2.3CPU配置
2.2.4Core与内存配置
2.2.5磁盘配置
 
3.集群节点规划
3.1集群业务规划
3.2集群节点规划
3.2.1HDFS节点规划
3.2.2HBase节点规划
3.2.3Kafka节点规划
3.2.4YARN节点规划
3.2.5Zookeeper节点规划
3.2.6ElasticSearch节点规划
3.3集群存储规划
 
4.大数据平台目录规划
4.1HDFS目录规划
4.2linux os目录规划
4.3linux主机名规划
4.4临时目录规划
 
5.网络规划
5.1机房选择
5.2网络带宽规划
5.3主机网卡规划
 
6.大数据平台构建
6.1选择集群部署平台
6.2选择集群部署方式
6.3大数据平台构建
6.4接口机部署
 
7.数据迁移至大数据平台
7.1文件数据迁移大数据平台
7.2数据库数据迁移大树将军平台
7.3数据一致性验证
 
8.大数据平台维护与管理
8.1集群启停
8.2集群各进程维护操作
8.3数据平衡操作
8.4集群日常运维
8.5大数据平台权限控制
 
项目二:大规模集群运维实践
1.大数据集群基础运维
1.1集群启停
1.2 集群各进程维护操作
1.3数据平衡操作
1.4集群日常运维
 
2.大数据集群扩缩容
2.1HDFS节点增加与删除
2.2YARN节点增加与删除
2.3HBase节点增加与删除
2.4Kafka节点增加与删除
 
3.大数据集群巡检
3.1HDFS巡检思路与技巧
3.2YARN巡检思路与技巧
3.3HBase巡检思路与技巧
3.4Zookeeper巡检思路与技巧
3.5Kafka巡检思路与技巧
 
4.大数据集群产线问题解决
4.1产线环境数据加工延迟定位
4.2作业执行缓慢根因定位
4.3作业数据倾斜问题排查
4.4hive入库延迟根因定位
4.5HBase数据丢失故障复盘
4.6HBase数据误删数据恢复
4.7Spark环境引起的资源申请不到问题定位
 
5.大规模集群数据迁移
5.1数据迁移方案
5.2数据迁移前集群准备
5.3大规模数据迁移流程
5.4数据验证
 
 
 

大数据运维尖刀班 | 集群_监控_CDH_Docker_K8S_两项目_腾讯云服务器的更多相关文章

  1. 漫谈ELK在大数据运维中的应用

    漫谈ELK在大数据运维中的应用 圈子里关于大数据.云计算相关文章和讨论是越来越多,愈演愈烈.行业内企业也争前恐后,群雄逐鹿.而在大数据时代的运维挑站问题也就日渐突出,任重而道远了.众所周知,大数据平台 ...

  2. 大数据平台搭建-hadoop/hbase集群的搭建

    版本要求 java 版本:1.8.*(1.8.0_60) 下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downl ...

  3. 《跟老男孩学Linux运维:Web集群实战》读书笔记

    Linux 介绍 Linux 安装 Linux 调优 Web 基础 Nginx 应用 LNMP 应用 PHP 缓存加速 Nginx 调优 MySQL 应用 NFS 网络文件共享 Nginx 反向代理与 ...

  4. 大数据学习路线:Zookeeper集群管理与选举

    大数据技术的学习,逐渐成为很多程序员的必修课,因为趋势也是因为自己的职业生涯.在各个技术社区分享交流成为很多人学习的方式,今天很荣幸给我们分享一些大数据基础知识,大家可以一起学习! 1.集群机器监控 ...

  5. Redis运维实战之集群中的脑裂

    1.对于分布式Redis主从集群来说,什么是脑裂? 所谓的脑裂,就是指在主从集群中,同时有两个主节点,它们都能接收写请求.而脑裂最直接的影响,就是客户端不知道应该往哪个主节点写入数据,结果就是不同的客 ...

  6. 运维利器-ClusterShell集群管理操作记录

    在运维实战中,如果有若干台数据库服务器,想对这些服务器进行同等动作,比如查看它们当前的即时负载情况,查看它们的主机名,分发文件等等,这个时候该怎么办?一个个登陆服务器去操作,太傻帽了!写个shell去 ...

  7. 谦先生-hadoop大数据运维纪实

    1.NN宕掉切不过去先看zkfc的log引起原因是dfs.ha.fencing.ssh.private-key-files的配置路径配错造成以致无法找到公钥 2.dfs.namenode.shared ...

  8. 运维利器-ClusterShell集群管理

    在运维实战中,如果有若干台数据库服务器,想对这些服务器进行同等动作,比如查看它们当前的即时负载情况,查看它们的主机名,分发文件等等,这个时候该怎么办?一个个登陆服务器去操作,太傻帽了!写个shell去 ...

  9. 大数据(2)---HDFS集群搭建

    一.准备工作 1.准备几台机器,我这里使用VMware准备了四台机器,一个name node,三个data node. VMware安装虚拟机:https://www.cnblogs.com/niju ...

随机推荐

  1. border-radius属性失效了Ծ‸Ծ

    .btn-circle { width: 30px; height: 30px; text-align: center; padding: 4px ; font-size: 16px; font-we ...

  2. cocoa pods最新安装说明和使用方法

    最新版 CocoaPods 的安装流程 1.移除现有Ruby默认源 $gem sources --remove https://rubygems.org/ 2.使用新的源 $gem sources - ...

  3. 9.Break和Continue

    Break直接跳出循环和Continue略过本次循环,循环继续执行: Break在任何循坏语句的主体部分,均可用break控制循环的流程.break用于强制退出循环,不执行循环体中的语句,后边语句继续 ...

  4. 网络通信-基本概念:网络、IP地址、端口、socket

    目录 网络通信 1 网络 1.1 网络定义 1.2 使用网络的目的 1.3 总结 2 IP地址 2.1 ip地址的作用 2.2 ip地址的分类 3 端口 3.1 什么是端口 3.2 端口号 3.3 端 ...

  5. 9、python判断语句与循环语句

    前言:本文主要介绍python判断语句与循环语句,包括if语句.while循环.for循环.range函数. 一.if语句  关键字:if.elif.else,写法如下: # if if 条件: # ...

  6. Data for the People: How to Make Our Post-Privacy Economy Work for You

    等翻译成 chinese在看吧

  7. MVC 记录

    ASP.NET MVC框架提供了一个帮助我们构造Html元素的类:TagBuilder ps url cnblogs.com/yibinboy/articles/5187682.html HttpRu ...

  8. 网络io模型总结

    操作系统基本概念 首先来来说下操作系统,嗯,操作系统是计算机硬件的管理软件,是对计算机硬件的抽象,操作系统将应用程序分为用户态和内核态,例如驱动程序就位于内核态,而我们写的一般程序都是用户态,包括we ...

  9. Java 8 Stream流编程学习

    本文是自己学习菜鸟教程中总结的笔记,用于快速找代码,完整的文档见菜鸟教程:Java 8 Stream Stream 使用一种类似用SQL语句从数据库查询数据的直观方式来提供一种对Java集合运算和表达 ...

  10. 基于BIO的实时Socket读写操作

    文章目录 前言 Socket类2.1 Socket的通信过程2.2 控制Socket连接2.3 设置Socket的选项 ServerSocket类3.1 构造ServerSocket3.2 Serve ...