【大数据系统架构师】0.2 Linux基础
1. Linux基本环境
1.1 大数据Hadoop前置大纲讲解
1)Linux系统,基本命令
2)Java语言,JavaSE相关知识
3)MySQL基本的DML和DDL
1.2 常见Linux系统、安装VMWare及虚拟机
1)重要的网站,大数据领域,hadoop发行版本,有公司Cloudera
http://archive.cloudera.com/cdh5
2)虚拟化工具VMWare
(1)安装VMWare
(2)创建虚拟机
(3)安装CentOS 6.5 操作系统
1.3 虚拟机网络配置(IP地址、主机名、防火墙)
1)网络连接
(1)使用NAT模式,虚拟机系统可以连接网络、有一个IP地址,宿主机系统能够远程连接。
这种方式下,虚拟机的网卡连接到宿主的 VMnet8 上。此时系统的 VMWare NAT Service 服务就充当了路由器的作用,负责将虚拟机发到 VMnet8 的包进行地址转换之后发到实际的网络上,再将实际网络上返回的包进行地址转换后通过 VMnet8 发送给虚拟机。VMWare DHCP Service 负责为虚拟机提供 DHCP 服务。
(2)ip地址的网段: 【192.168.68.128】
(3)自动获取的IP地址,有时会改变,需要设置固定的IP地址。
右击网络连接图标,编辑System eth0网卡IPv4 Settings,Manual。
配置IP地址:192.168.68.130(注意IP地址需要在vmnet8的本地DHCP服务分配的IP地址服务范围类,否则可能出现无法联网现象)
配置子网掩码:255.255.255.0
配置网关地址:192.168.68.2(网关IP与vmnet8的网关IP配置要一致,否则可能出现无法联网现象)
vi /etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
TYPE=Ethernet
UUID=f9f0898c-bf2c--857a-eab291cd904d
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=static #none,dhcp, static三个不同的配置可能会对网络连接有影响
IPADDR=192.168.106.130
NETMASK=255.255.255.0
BROADCAST=192.168.106.255
GATEWAY=192.168.106.2
DNS1=114.114.114.114
DNS2=8.8.8.8
DEFROUTE=yes
IPV4_FAILURE_FATAL=yes
IPV6INIT=no
NAME="System eth0"
HWADDR=:0C:::D2:
PEERDNS=yes
PEERROUTES=yes
LAST_CONNECT=
(4)重启网络配置
service network restart
或者 /etc/init.d/network restart
2)VMWare安装或卸载过程,导致windows重启后键盘或触摸板无法生效问题解决方案
1.4 远程连接工具、主机名与IP地址映射配置
1)远程连接工具
SecureCRT、
2)远程连接四要素
IP地址:
用户名:
密码:
协议:SSH
3)主机名与IP地址映射
192.168.68.130 od001
在Linux和windows中都配置
4)
2. Linux基础命令
2.1 用户和组
1)清理屏幕 clear
2)创建用户useradd od
设置密码 passwd od
创建用户默认会创建该用户的主目录,或者叫家目录
/home/od,也可用~代替
3)切换用户 su - od
4)显示当前目录 pwd
5)设置主机名
查看主机名 hostname
设置主机名(root用户) hostname od001
在Linux系统中,所有的信息都是来自于文件中。命令设置主机名重启后无法生效。
6)永久设置主机名
cat /etc/sysconfig/network
vi /etc/sysconfig/network
7)重启系统
关机 halt
重启
reboot
init6
2.2 文件和目录
2.3 编辑器VI和VIM
2.4 文件常用操作
3. Linux系统管理
3.1 磁盘基本管理命令(df、du、fdisk、mount)
1)系统信息
uname
uname -r
cat /proc/cpuinfo
cat /proc/meminfo
显示系统当前时间 date
date -R
显示日历表 cal 2017
设置系统时间
date -s 2017-10-08
date -s 19:33:00
查看磁盘信息 df -lh
查看目录磁盘大小 du -sh /opt/modules
查看磁盘挂载信息 fdisk -l
修复磁盘 fsck /dev/sda3
查看磁盘挂载信息 mount
挂载磁盘 mount /dev/sdb1 /data01
卸载磁盘 unmount /dev/sdb1
3.2 内存使用监控命令(top、free)
free
系统内存使用情况 free -m
top
M查看更详细
3.3 软件安装方式(rpm、tar、yum)
1)rpm命令
检查软件是否已安装
rpm -qa | grep java
卸载已安装的软件
rpm -e --nodeps xxx
安装软件
rpm -ivh xxx.rpm
使用rpm包安装mysql数据库
2)tar包源码编译安装,不推荐使用,太复杂
zip:
解压命令: unzip xxx.zip
压缩命令: zip yy.zip file
tar:
解压命令:
解压到当前目录 tar -zxvf xxx.tar.gz
解压到指定目录 tar -zxvf xxx.tar.gz -C dir
压缩命令:
tar -zcvf zzz.tar.gz dir/file
v代表显示目录
3)yum
需要配置源,解决软件包依赖关系以及各个软件安装顺序
4)安装jdk
(1)下载jdk-7u67-linux-x64.tar.gz
(2)解压至/opt/modules下
(3)使用root用户 vi /etc/profile,在文件尾配置
## JAVA_HOME
export JAVA_HOME=/opt/modules/jdk1..0_67
export PATH=$PATH:$JAVA_HOME/bin
(4)source /etc/profile,使配置生效
(5)java -verision
javac -version
3.4 设置普通用户sudo权限
1)vi /etc/sudoers
od ALL=(root)NOPASSWD:ALL
2)查看防火墙是否关闭
查看 sudo service iptables status
停止 sudo service iptables stop
启动 sudo service iptables start
重启 sudo service iptables restart
sudo service httpd status
sudo service httpd status
检查状态 sudo chkconfig httpd on
sudo chkconfig --list | grep httpd
永久性设置防火墙关闭
sudo chkconfig iptables off | on
selinux禁用
vi /etc/sysconfig/selinux
SELINUX=enforcing 改为
SELINUX=disabled 注意不要配置错误,否则系统无法重启
4. Shell基础编程
4.1 Shell介绍及基本案例
4.2 变量、控制、循环基本语法
4.3 Linux Crontab定时任务使用
【大数据系统架构师】0.2 Linux基础的更多相关文章
- 【大数据系统架构师】0.1 Java编程基础
1. 初识Java 2. Java语法 快速入门点我 2.1 数据类型和运算符 2.2 流程控制语句 2.3 数组 2.4 类和对象 2.5 OOP三大特性 2.6 集合框架与泛型 2.7 反射机制 ...
- 【大数据系统架构师】0.3 MySQL数据库
1. MySQL的基本操作 2. SQL语句 3. 高级查询 1)聚合函数.分组查询 2)联合查询.连接查询 3)子查询 4. 高级应用 1)视图与索引 2)数据可视化管理 5. 使用JDBC操作数据 ...
- 【大数据系统架构师】1.2 大数据基础Hadoop 2.X
1. hadoop环境搭建 1.1 伪分布式环境搭建 1.1.1 伪分布式环境搭建 1.1.2 伪分布式搭建结果 hdfs可视化界面: http://od001:50070/dfshealth.htm ...
- 大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术
大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选 ...
- 大数据架构师必读的NoSQL建模技术
大数据架构师必读的NoSQL建模技术 从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术. 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企 ...
- 【ZZ】大数据架构师基础:hadoop家族,Cloudera系列产品介绍
http://www.36dsj.com/archives/17192 大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为 ...
- 大数据架构师NoSQL建模技术
从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术. 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企业平台完全不同的新兴架构迅速地崛起.而 ...
- 转_【大话IT】你离大数据架构师有多远?
话题背景: 首先,先科普下“数据架构师”的相关职责:数据架构师要负责建立和维持公司数据储存的技术基准,策划硬体和软体的结构,确保数据储存系统可以支持未来的数据量和分析需求. 据了解,美国地区数据架构师 ...
- FunData — 电竞大数据系统架构演进
电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena ...
随机推荐
- storm集群配置以及java编写拓扑例子
storm集群配置 安装 修改配置文件 使用java编写拓扑 storm集群配置 storm配置相当简单 安装 tar -zxvf apache-storm-1.2.2.tar.gz rm apach ...
- 将Maven项目打包成可执行 jar文件(引用第三方jar)
使用maven assembly插件完成打包 修改pom: <build> <pluginManagement> <plugins> <!--设置jdk版本, ...
- Android 使用官方下拉刷新
网上关于下拉刷新的文章也不少,不过都太长了,看得挺难受的.恰好发现了官方的下拉刷新库,而且效果还是不错的,简洁美观,用得也挺方便. 下面是效果图: 我的好友原来是空的,刷新后多了两个. 使用还是挺方便 ...
- MAPREDUCE的原理和使用
简介: Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架: Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分 ...
- 判断修改的中的值,用前面的,否则容易获得空值;this.dataGridView1.Rows[i].Cells[0].EditedFormattedValue; VS bool b = (bool)this.dataGridView1.Rows[i].Cells[0].Value;
判断修改的中的值,用前面的,否则容易获得空值:this.dataGridView1.Rows[i].Cells[0].EditedFormattedValue; VS bool b = (b ...
- 系统环境变量PATH被删除后从注册表恢复
转自:https://wenku.baidu.com/view/75d0b6ec19e8b8f67c1cb958.html 首先需要了解path这个环境变量有什么用: 当你打开命令提示窗口时,即win ...
- CSS DIV 居中
左右居中 margin-left: auto; margin-right: auto; 上下居中
- mysql 存储过程动态执行sql语句
之前经常在程序中拼接sql语句,其实我们也可以在存储过程中拼接sql 语句,动态的执行~~ 代码如下: DROP PROCEDURE IF EXISTS SearchByDoctor;CREATE P ...
- 移植RT2870无线网卡驱动到s3c2416
公司项目要用到usb无线网卡,芯片是ralink的RT2870.以下是将其驱动移植到s3c2416的步骤. 1.下载驱动源码,雷凌官网的下载地址是: http://www.ralinktech.com ...
- LINQ GroupBy 查询数据赋给select
roles.GroupBy(a => new { a.SubjectID,a.SubjectName}).Select(p => new SelectListItem() { Value ...