大数据Hadoop入门教程 | (二)Linux
使用
finalShell可以提供文件目录图形化

完整Linux命令整理参考大佬博客:Linux常见文件管理命令 - Mr_Walker - 博客园
Linux文件系统基础知识
Linux文件系统概念
- 操作系统中负责管理和存储文件信息的软件机构称为文件管理系统,简称文件系统;
- 文件系统的结构通常叫做目录树结构,从斜杠/根目录开始;
- Linux号称“万物皆文件”,意味着针对Linux的操作,大多数时间是在针对Linux2文件系统操作。

文件系统通用特性
- 几乎主流的文件系统都是从/根目录开始的,Liux也不例外,而windows文件系统会以盘符来区分不同文件系统;
- 目录树中节点分为两个种类:目录(directory)、文件(file);
- 从根目录开始,路径具有唯一性;
- 只有在目录下才可以继续创建下一级目录,换句话说目录树到文件终止蔓延。
易混概念
- 当前路径:也叫当前工作目录,当下用户所属的位置;
- 相对路径:相对当前工作目录开始的路径,会随当前路径变化而变化;
- 绝对路径:不管工作目录在哪,绝对路径都是从/根目录开始,唯一不重复。

特殊符号
.:目录或者文件名字以.开始表示是隐藏的文件(夹),如果路径以.开始表示当前路径
..:当前目录的上一级目录
~:当前用户的home目录,比如root用户home目录是/root
/:根目录
#进入当丽月录下的a目录
cd ./a
#进入根目录下的a目录
cd /a
#进入当前日录上一级目录下的a目录
cd ./a
#进入当前操作用户home目录下的a目录
cd ~/a
#进入当前目录下的a文件夹 a是隐藏的
cd .a
Linux常用文件操作命令
概述
- 命令属于死东西,属于多用多会,不用就忘的知识,孰能生巧;
- Tab键可以实现自动补全和提示,要合理使用;
- history命令可以显示历史执行记录,或者使用方向键来切换前后执行过的命令;
显示目录内容
ls( list files)命令:用于显示指定工作目录下之内容(列出目前工作目录所含之文件及子目录)。
-a显示所有文件及目录(.开头的隐藏文件也会列出)
-l除文件名称外,亦将文件型态、权限、拥有者、文件大小等资讯详细列出注意ls -l=ll
ls path
ls -a path #查看所有文件包括隐藏文件
ls -l=ll #查看文件详细信息包括权限类型时间大小等
ll -h path #表示以人性化的显示内容
ll * #*通配符表示任意字符?表示有且只有一个字符
切换目录
cd(change directory)命令:用于切换当前工作目录。切换的路径可为绝对路径或相对路径。若路径省略,则变换至使用者的home目录。
~:也表示为home目录的意思
.:则是表示目前所在的目录
..:则表示目前目录位置的上一层目录
pwd #查看自己当前所在目录
cd path注意自己写的是相对还是绝对的还可以结合特殊符号使用
cd ./
cd /
cd ./
cd ~
创建、删除
mkdir(make directory)命令:用于创建目录。-p确保父目录名称存在,不存在的就建一个。
touch命令:创建一个空文件,无任何内容。rm(remove)命令:用于删除一个文件或者目录。-f强制直接删除,无需用户确认。-r将目录及以下所有递归逐一删除。
mkdir /a/b/c
mkdir -p /a/b/c
rm -rf /a/b/c
rm -rf /a
-f #强制删除 不给与提示
-r #递归删除 针对文件夹
-rf #杀伤力极大 问问自己在干什么
rm -rf /* #坐牢眼:
复制、移动
cp(copy file)命令:用于复制文件或目录。-r:若给出的源文件是一个目录文件,此时将复制该目录下所有的子目录和文件。
mv(move fi1e)命令:用来为文件或目录改名、或将文件或目录移入其它位置。
cp [options]source...directory
mv source_file(文件) dest_file(文件)#将源文件名source_file改为目标文件名dest file
mv source_fle(文件) dest_directory(目录)#将文件source_file移动到目标目录destdirectory中
mv source_directory(目录) dest_directory(目录)#目录名destdirectory已存在,将source_directory移动到目录名destdirectory中;目录名destdirectory不存在则source directory改名为目天名dest directony
mv source_directory(目录) dest_file文件)#出错
文件内容查看
cat(concatenate)命令:用于连接文件并打印到标准输出设备如console控制台上。适合小文件内容查看。more命令:类似cat,不过会以一页一页的形式显示,更方便使用者逐页阅读,翻页结束自动退出。适合大文件查看。按space键翻下一页,按b往回(back)上一页tail命令:用于查看文件的结尾部分的内容。-n用于显示行数,默认为10,即显示10行的内容。-f用于实时显示文件动态追加的内容。会把文件里的最尾部的内容显示在屏幕上,并且不断刷新,只要文件有更新,就可以看到最新的文件内容。
其他
echo命令:用于内容的输出,将内容输出到console控制台上。
echo string
|管道命令:将前一个命令执行的结果作为内容交给下一个命令处理。可以形成多级管道操作。
命令1|命令2 可以将命令1的结果通过命令2作进一步的处理
>输出重定向(覆盖)命令command>file执行command然后将输出的内容存入file,file内已经存在的内容将被新内容覆盖替代。
>>输出重定向(追加)命令command>)file执行command然后将输出的内容存入file,新内容追加在文件末尾。
echo 711>4.txt
cat 4.txt
#111
echo 222>4.txt
cat 4.txt
#222
echo 333>>4.txt
cat 4.txt
#222333
解压缩命令
(1/2)打包、解包
tar(tape archive)命令:常用于备份文件。是用来建立,还原备份文件的工具程序,它可以加入,解开备份文件内的文件。
-c或--create建立新的备份文件。
-x或--extract或--get从备份文件中还原文件。
-v或--verbose显示指令执行过程。
-f<备份文件>或--file=<备份文件>指定备份文件。
(2/2)打包压缩、解包解压缩
在打包备份或者解包的过程中,可以通过指定压缩算法,对打包的文件进行压缩,解压的时候也需要指定相应的算法。
-z或--gzip或--ungzip通过gzip指令处理备份文件。
最重要的搭配:tar -zxvf xxxxx.tar.gz
Linux常用系统命令
时间、日期查看
date命令:用来显示或设定系统的日期与时间,在显示方面,使用者可以设定欲显示的格式,格式设定为一个加号后接数个标记。cal(calendar)命令:用于用于显示当前或者指定日期的公历。
内存、磁盘使用率查看
free命令:用于显示内存状态。会显示内存的使用情况,包括实体内存,虚拟的交换文件内存,共享内存区段,以及系统核心使用的缓冲区等。df(英文全拼:disk free)命令:用于显示目前在Linux系统上的文件系统磁盘使用情况统计。-h人性化显示
进程查看
ps(英文全拼:process status)命令:用于显示当前进程的状态,类似于windows的任务管理器。jps命令:这是JDK自带的命令,专门用于查看本机运行的java进程情况。
Vim编辑器
vim编辑器简介
- vi是一款很多uix及其延
- 伸系统内置的文本编辑器,具有强大的文本编辑能力。
- vim是从vi发展出来的一个文本编辑器,可以理解为vi编辑器的增强版。vim中代码补完、编译及错误跳转等方便编程的功能特别丰富。
- vi/vim编辑器的核心设计思想:让程序员的手指始终保持在键盘的核心区域,就能完成所有的编辑操作。
- 学习使用vi/vim编辑器最大挑战:万物皆命令。

打开与新建文件
vim /path/file
- 如果打开的文件不存在,此时就是新建文件,编辑器左下角会提示new file
- 如果文件已经存在,此时就打开这个文件,进入命令模式
在使用vi编辑器的过程中,如果发现打开的文件内容不符合预期,可以检查一下,文件路径是否正确?
vim编辑器3种工作模式
- 命令模式(Command mode)
- 命令模式下,所敲的按键编辑器都理解为命令,以命令驱动执行不同的功能。
- 此模式下,不能自由进行文本编辑。
- 输入模式(Insert mode)
- 也就是所谓的编辑模式、插入模式。
- 此模式下,才可以对文件内容进行自由编辑。
- 底线命令模式(Last line mode)
- 以
:开始,通常用于文件的保存、退出。
- 以

vim基本操作命令
光标移动
- 方向键控制移动
- 翻页
pageuppagedown - 行首(
home或0)行尾(end或$) - 跳到文件的最后一行
G - 到文件的第一行
gg
复制粘贴
- 复制
yy复制光标当前所在行内容nyy复制当前行往下n行
- 粘贴
p当前行的下一行粘贴P当前行的上一行粘贴
- 注意:使用鼠标从window或者其他地方复制内容到vim编辑器粘贴,一定一定要在输入模式下进行,否则数据会有丢失的风险。
删除、撤销操作
- 删除命令
dd删除光标所在当前行内容ndd删除当前行往下n行
- 撤销、反撤销
u撤销上一步的操作(后悔药)ctrl+r反撤销
原创作者:孤飞-博客园
视频链接:https://www.bilibili.com/video/BV1CU4y1N7Sh?p=11&share_source=copy_pc
原文链接:https://www.cnblogs.com/ranxi169/p/16607803.html
大数据Hadoop入门教程 | (二)Linux的更多相关文章
- 大数据Hadoop入门教程 | (一)概论
数据是什么 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质.状态以及相互关系等进行记载的物理符号或这些物理符号的组合,它是可识别的.抽象的符号. 它不仅指狭义上的数字,还可以是具有一定 ...
- 大数据Hadoop入门视频教程:Hadoop的快如入门
最新在学习hadoop .storm大数据相关技术,发现网上hadoop .storm 相关学习视频少之又少,这里整理了传智播客段海涛老师的hadoop学习视频,出来给大家学习交流. 视频下载地址:h ...
- 大数据Hadoop平台安装及Linux操作系统环境配置
配置 Linux 系统基础环境 查看服务器的IP地址 设置服务器的主机名称 hostnamectl set-hostname hadoop hostname可查看 绑定主机名与IP 地址 vim /e ...
- 大数据hadoop入门学习之集群环境搭建集合
目录: 1.基本工作准备 1.虚拟机准备 2.java 虚拟机-jdk环境配置 3.ssh无密码登录 2.hadoop的安装与配置 3.hbase安装与配置(集成安装zookeeper) 4.zook ...
- [大数据从入门到放弃系列教程]第一个spark分析程序
[大数据从入门到放弃系列教程]第一个spark分析程序 原文链接:http://www.cnblogs.com/blog5277/p/8580007.html 原文作者:博客园--曲高终和寡 **** ...
- [大数据从入门到放弃系列教程]在IDEA的Java项目里,配置并加入Scala,写出并运行scala的hello world
[大数据从入门到放弃系列教程]在IDEA的Java项目里,配置并加入Scala,写出并运行scala的hello world 原文链接:http://www.cnblogs.com/blog5277/ ...
- 无废话ExtJs 入门教程二十[数据交互:AJAX]
无废话ExtJs 入门教程二十[数据交互:AJAX] extjs技术交流,欢迎加群(521711109) 1.代码如下: 1 <!DOCTYPE html PUBLIC "-//W3C ...
- 大数据-03-Spark入门
Spark 简介 行业广泛使用Hadoop来分析他们的数据集.原因是Hadoop框架基于一个简单的编程模型(MapReduce).这里,主要关注的是在处理大型数据集时在查询之间的等待时间和运行程序的等 ...
- 成都大数据Hadoop与Spark技术培训班
成都大数据Hadoop与Spark技术培训班 中国信息化培训中心特推出了大数据技术架构及应用实战课程培训班,通过专业的大数据Hadoop与Spark技术架构体系与业界真实案例来全面提升大数据工程师 ...
随机推荐
- 【实操干货】做好这 16 项优化,你的 Linux 操作系统焕然一新
大家好,这次跟大家谈谈又拍云的操作系统优化方案.往简单地说,我们使用的 Linux 操作系统主要都是基于 CentOS6/7 的精简和优化.往复杂地说,则是我们有两套系统,业务上使用的定制 Linux ...
- ExtJS 布局-Card 布局(Card layout)
更新记录: 2022年6月1日 开始. 2022年6月6日 发布. 1.说明 卡片布局类似牌堆,每次只有一个子组件可见,子组件几乎填满了整个容器.卡片布局常用于向导(Wizard)和选项卡(Tabs) ...
- 《Java基础——IO流》
Java基础--IO流 一.字节流: 1.输入流 (InputStream) 规则: 此处用于读取txt文件中的内容. 代码: import java.io.*; public c ...
- Spring Security认证器实现
目录 拦截请求 验证过程 返回完整的Authentication 收尾工作 结论 一些权限框架一般都包含认证器和决策器,前者处理登陆验证,后者处理访问资源的控制 Spring Security的登陆请 ...
- C++ 炼气期之数组探幽
1. 数组概念 变量是内存中的一个存储块,大小由声明时的数据类型决定. 数组可以认为是变量的集合,在内存中表现为一片连续的存储区域,其特点为: 同类型多个变量的集合. 每一个变量没有自己的名字. 数组 ...
- 分布式机器学习:模型平均MA与弹性平均EASGD(PySpark)
计算机科学一大定律:许多看似过时的东西可能过一段时间又会以新的形式再次回归. 1 模型平均方法(MA) 1.1 算法描述与实现 我们在博客<分布式机器学习:同步并行SGD算法的实现与复杂度分析( ...
- C#实现一个万物皆可排序的队列
需求 产品中需要向不同的客户推送数据,原来的实现是每条数据产生后就立即向客户推送数据,走的的是HTTP协议.因为每条数据都比较小,而数据生成的频次也比较高,这就会频繁的建立HTTP连接,而且每次HTT ...
- @RequestMapping注解的属性,将请求约束精细化
package com.atguigu.controller; import org.springframework.stereotype.Controller; import org.springf ...
- CADisplayLink、NSTimer循环引用解决方案
前言:CADisplayLink.NSTimer 循环引用问题 CADisplayLink.NSTimer会对Target产生强引用,如果target又对他们产生强引用,那么就会引发循环引用. @ ...
- Tomcat深入浅出——Session与Cookie(四)
一.Cookie 1.1 Cookie概念 Cookie:有时也用其复数形式 Cookies.类型为"小型文本文件",是某些网站为了辨别用户身份,进行Session跟踪而储存在用户 ...