1. Linux基本环境

1.1 大数据Hadoop前置大纲讲解

1)Linux系统,基本命令

2)Java语言,JavaSE相关知识

3)MySQL基本的DML和DDL

1.2 常见Linux系统、安装VMWare及虚拟机

1)重要的网站,大数据领域,hadoop发行版本,有公司Cloudera

http://archive.cloudera.com/cdh5

2)虚拟化工具VMWare

(1)安装VMWare

(2)创建虚拟机

(3)安装CentOS 6.5 操作系统

1.3 虚拟机网络配置(IP地址、主机名、防火墙)

1)网络连接

VMware虚拟机以NAT方式解决无法上网的问题

(1)使用NAT模式,虚拟机系统可以连接网络、有一个IP地址,宿主机系统能够远程连接。

这种方式下,虚拟机的网卡连接到宿主的 VMnet8 上。此时系统的 VMWare NAT Service 服务就充当了路由器的作用,负责将虚拟机发到 VMnet8 的包进行地址转换之后发到实际的网络上,再将实际网络上返回的包进行地址转换后通过 VMnet8 发送给虚拟机。VMWare DHCP Service 负责为虚拟机提供 DHCP 服务。

(2)ip地址的网段: 【192.168.68.128】

(3)自动获取的IP地址,有时会改变,需要设置固定的IP地址。

右击网络连接图标,编辑System eth0网卡IPv4 Settings,Manual。

配置IP地址:192.168.68.130(注意IP地址需要在vmnet8的本地DHCP服务分配的IP地址服务范围类,否则可能出现无法联网现象)

配置子网掩码:255.255.255.0

配置网关地址:192.168.68.2(网关IP与vmnet8的网关IP配置要一致,否则可能出现无法联网现象)

vi /etc/sysconfig/network-scripts/ifcfg-eth0

DEVICE=eth0
TYPE=Ethernet
UUID=f9f0898c-bf2c--857a-eab291cd904d
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=static #none,dhcp, static三个不同的配置可能会对网络连接有影响
IPADDR=192.168.106.130
NETMASK=255.255.255.0
BROADCAST=192.168.106.255
GATEWAY=192.168.106.2
DNS1=114.114.114.114
DNS2=8.8.8.8
DEFROUTE=yes
IPV4_FAILURE_FATAL=yes
IPV6INIT=no
NAME="System eth0"
HWADDR=:0C:::D2:
PEERDNS=yes
PEERROUTES=yes
LAST_CONNECT=

(4)重启网络配置

service network restart

或者 /etc/init.d/network restart

2)VMWare安装或卸载过程,导致windows重启后键盘或触摸板无法生效问题解决方案

VMware卸载后键盘失灵的解决方案

1.4 远程连接工具、主机名与IP地址映射配置

1)远程连接工具

SecureCRT、

2)远程连接四要素

IP地址:

用户名:

密码:

协议:SSH

3)主机名与IP地址映射

192.168.68.130 od001

在Linux和windows中都配置

4)

2. Linux基础命令

2.1 用户和组

1)清理屏幕 clear

2)创建用户useradd od

设置密码 passwd od

创建用户默认会创建该用户的主目录,或者叫家目录

/home/od,也可用~代替

3)切换用户 su - od

4)显示当前目录 pwd

5)设置主机名

查看主机名 hostname

设置主机名(root用户) hostname od001

在Linux系统中,所有的信息都是来自于文件中。命令设置主机名重启后无法生效。

6)永久设置主机名

cat /etc/sysconfig/network

vi /etc/sysconfig/network

7)重启系统

关机 halt

重启

reboot

init6

2.2 文件和目录

2.3 编辑器VI和VIM

2.4 文件常用操作

3. Linux系统管理

3.1 磁盘基本管理命令(df、du、fdisk、mount)

1)系统信息

uname

uname -r

cat /proc/cpuinfo

cat /proc/meminfo

显示系统当前时间 date

date -R

显示日历表 cal 2017

设置系统时间

date -s 2017-10-08

date -s 19:33:00

查看磁盘信息 df -lh

查看目录磁盘大小 du -sh /opt/modules

查看磁盘挂载信息 fdisk -l

修复磁盘 fsck /dev/sda3

查看磁盘挂载信息 mount

挂载磁盘 mount /dev/sdb1 /data01
卸载磁盘 unmount /dev/sdb1

3.2 内存使用监控命令(top、free)

free

系统内存使用情况 free -m

top

M查看更详细

3.3 软件安装方式(rpm、tar、yum)

1)rpm命令

检查软件是否已安装

rpm -qa | grep java

卸载已安装的软件

rpm -e --nodeps xxx

安装软件

rpm -ivh xxx.rpm

使用rpm包安装mysql数据库

2)tar包源码编译安装,不推荐使用,太复杂

zip:

解压命令: unzip xxx.zip

压缩命令: zip yy.zip file

tar:

解压命令:

解压到当前目录 tar -zxvf xxx.tar.gz

解压到指定目录 tar -zxvf xxx.tar.gz -C dir

压缩命令:

tar -zcvf zzz.tar.gz dir/file

v代表显示目录

3)yum

需要配置源,解决软件包依赖关系以及各个软件安装顺序

4)安装jdk

(1)下载jdk-7u67-linux-x64.tar.gz

(2)解压至/opt/modules下

(3)使用root用户 vi /etc/profile,在文件尾配置

## JAVA_HOME
export JAVA_HOME=/opt/modules/jdk1..0_67
export PATH=$PATH:$JAVA_HOME/bin

(4)source /etc/profile,使配置生效

(5)java -verision

javac -version

3.4 设置普通用户sudo权限

1)vi /etc/sudoers

od ALL=(root)NOPASSWD:ALL

2)查看防火墙是否关闭

查看 sudo service iptables status

停止 sudo service iptables stop

启动 sudo service iptables start

重启 sudo service iptables restart

sudo service httpd status

sudo service httpd status

检查状态 sudo chkconfig httpd on

sudo chkconfig --list | grep httpd

永久性设置防火墙关闭

sudo chkconfig iptables off | on

selinux禁用

vi /etc/sysconfig/selinux

SELINUX=enforcing  改为

SELINUX=disabled   注意不要配置错误,否则系统无法重启

4. Shell基础编程

4.1 Shell介绍及基本案例

4.2 变量、控制、循环基本语法

4.3 Linux Crontab定时任务使用

【大数据系统架构师】0.2 Linux基础的更多相关文章

  1. 【大数据系统架构师】0.1 Java编程基础

    1. 初识Java 2. Java语法 快速入门点我 2.1 数据类型和运算符 2.2 流程控制语句 2.3 数组 2.4 类和对象 2.5 OOP三大特性 2.6 集合框架与泛型 2.7 反射机制 ...

  2. 【大数据系统架构师】0.3 MySQL数据库

    1. MySQL的基本操作 2. SQL语句 3. 高级查询 1)聚合函数.分组查询 2)联合查询.连接查询 3)子查询 4. 高级应用 1)视图与索引 2)数据可视化管理 5. 使用JDBC操作数据 ...

  3. 【大数据系统架构师】1.2 大数据基础Hadoop 2.X

    1. hadoop环境搭建 1.1 伪分布式环境搭建 1.1.1 伪分布式环境搭建 1.1.2 伪分布式搭建结果 hdfs可视化界面: http://od001:50070/dfshealth.htm ...

  4. 大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术

    大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选 ...

  5. 大数据架构师必读的NoSQL建模技术

    大数据架构师必读的NoSQL建模技术 从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术. 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企 ...

  6. 【ZZ】大数据架构师基础:hadoop家族,Cloudera系列产品介绍

    http://www.36dsj.com/archives/17192 大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为 ...

  7. 大数据架构师NoSQL建模技术

    从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术. 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企业平台完全不同的新兴架构迅速地崛起.而 ...

  8. 转_【大话IT】你离大数据架构师有多远?

    话题背景: 首先,先科普下“数据架构师”的相关职责:数据架构师要负责建立和维持公司数据储存的技术基准,策划硬体和软体的结构,确保数据储存系统可以支持未来的数据量和分析需求. 据了解,美国地区数据架构师 ...

  9. FunData — 电竞大数据系统架构演进

    电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena ...

随机推荐

  1. Centos7.2:搭建Ceph管理系统Inscope

    0.引言 好几天没有更新博客了,这几天分配有任务:calamari与inscope管理系统调研.下面就管理系统的环境搭建做一个总结,总结一下搭建流程以及搭建过程中遇到的一些问题.calcamari的搭 ...

  2. js中的Generators函数

    js中的Generators函数 generator一般操作 generator函数的作用就是函数体分段执行,yield表示分隔点 function *test() { console.log(1); ...

  3. Dev TreeList基本用法

    public partial class treelist_shijian : DevExpress.XtraEditors.XtraForm      {          public treel ...

  4. Delphi IOS 上架

    http://docwiki.embarcadero.com/RADStudio/Seattle/en/IOS_Mobile_Application_Development http://docwik ...

  5. 【开发工具】最强Git使用总结

    目录 必读材料 常用小结 Git操作流程 Git常用操作命令 - 代码提交和同步代码 Git常用操作命令 - 代码撤销和撤销同步 Git常用操作命令 - 其它常用命令 Git是分布式代码托管的标杆,这 ...

  6. js处理小数加减时精度失真

    最近公司业务有用js处理数据加减,但有时候会出现很多位小数:后来发现是js处理小数时精度失真:为了后边不在犯类似错误,笔者觉得有必要记录下处理方法,当然处理方法有很多种,这里笔者找了一种较为简洁的方法 ...

  7. 一卡通大冒险(hdu 2512)

    因为长期钻研算法, 无暇顾及个人问题,BUAA ACM/ICPC 训练小组的帅哥们大部分都是单身.某天,他们在机房商量一个绝妙的计划"一卡通大冒险".这个计划是由wf最先提出来的, ...

  8. java中的 equals 与 ==

    Java中的"=="永远比较的是两个对象是否是同一个对象(引用指向同一块内存就是同一个对象) Java中equals() 在使用必须与类挂上钩,不能单独使用.有的人这样理解&quo ...

  9. linux 软链接 硬链接

    查看文件sun.txt   加上参数i 是显示节点 inode [root@bogon test]# ls -li sun.txt 10006225 -rw-r--r--. 1 root root 0 ...

  10. hook NtQueryDirectoryFile实现文件隐藏

    一.NtQueryDirectoryFile函数功能(NT系列函数) NtQueryDirectoryFile函数:在一个给定的文件句柄,该函数返回该文件句柄指定目录下的不同文件的各种信息. 根据传入 ...