Linux Bash脚本编程语言中的美学与哲学
我承认,我再一次地当了标题党。但是不可否认,这一定是一篇精华随笔。在这一篇中,我将探讨Bash脚本语言中的美学与哲学。 这不是一篇Bash脚本编程的教程,但是却能让人更加深入地了解Bash脚本编程,更加快速地学习Bash脚本编程。 阅读这篇随笔,不需要你有Bash编程的经验,但一定要和我一样热衷于探索各种编程语言的本质,感悟它们的魅力。
其实早就想写关于Bash的东西了。 我们平时喜欢对编程语言进行分类,比如面向过程的编程语言、面向对象的编程语言、函数式编程语言等等。在我心中,我认为Bash就是一个面向字符串的编程 语言。Bash脚本语言的本质:一切皆是字符串。 Bash脚本语言的一切哲学都围绕着字符串:它们从哪里来?到哪里去?使命是什么? Bash脚本语言的一切美学都源自字符串: 由键盘上几乎所有的符号 “ $ ~ ! # & ( ) [ ] { } | > < - . , ; * @ ' " ` \ ^” 排列组合而成的极富视觉冲击力的、功能极其复杂的字符串。
Linux Bash Shell入门教程 http://www.linuxidc.com/Linux/2013-08/8848.htm
一、一切皆是字符串
Bash是一个Shell,Shell出现的初衷是为了将系统中的各种工具粘合在一起,所以它最根本的功能是调用各种命令。 但是Bash又提供了丰富的编程功能。 我们经常对编程语言进行分类,比如面向过程的语言、面向对象的语言、面向函数的语言等等。 可以把Bash脚本语言看成是一个面向字符串的语言。 Bash语言的本质就是:一切都是字符串。 看看下图中的这些变量:
上图是我在交互式的Bash命令行中做的一些演示。在上图中,我对变量分别赋值,不管等号右边是一个没有引号的字符串,还是带有引号的字符串, 甚至数字,或者数学表达式,最终的结果,变量里面存储的都是字符串。我使用一个for循环显示所有的变量,可以看到数学表达式也只是以字符串的形式储存, 没有被求值。
二、引用和元字符
如果一切都是没有特殊功能的平凡的字符串,那就无法构成一门编程语言。在Bash中,有很多符号具有特殊含义,比如“ $ ”符号被用于字符串展开,“&”符号用于让命令在后台执行, “|”用作管道, “>” “<”用于输入输出重定向等等。所以在Bash中,虽然同样是字符串,但是被引号包围的字符串和不被引号包围的字符串使用起来是不一样的,被单引号 包围的字符串和被双引号包围起来的字符串也是不一样的。
究竟带引号的字符串和不带引号的字符串使用起来有什么不一样呢?下图是我构建的一些比较典型的例子:
在上图中,我展示了Bash中生成字符串的7种方法:大括号展开、波浪符展开、参数展开、命令替换、算术展开、单词分割和文件路径展开。还有两 种生成字符串的方式没有讲(Process substitution和历史命令展开)。在使用Bash脚本编程的时候,了解以上7种字符串生成的方式就够了。在交互式使用Bash命令行的时候,还 需要了解历史命令展开,熟练使用历史命令展开可以让人事半功倍。
在上面的图片中可以看到,有一些展开方式在被双引号包围的字符串中是不起作用的,比如大括号展开、波浪符展开、单词分割、文件路径展开,而只有参数展开、命令替换和算术展开是起作用的。从图片中还可以看出,字符串中的参数展开、命令替换和算术展开都是由“ $ ”符号引导,命令替换还可以由“`”引导。所以,可以进一步总结为,在双引号包围的字符串中,只有“ $ 、`、\”这三个字符具有特殊含义。
如果想让任何一个字符都不具有特殊含义,可以使用单引号将字符串包围。比如使用正则表达式的时候,还比如使用sed、awk等工具的时候,由于sed和 awk自己执行的命令中往往包含有很多特殊字符,所以它们的命令最好用单引号包围。 比如使用awk命令显示/etc/passwd文件中的每个用户的用户名和全名,可以使用这个命令 awk -e ' {print$ 1, $ 5} ' ,其中,传递给awk的命令用单引号包围,说明bash不执行其中的任何替换或展开。
另外一个特殊的字符是“\”,它也是引用的一种。它可以解除紧跟在它后面的一个特殊字符的特殊含义(引用)。之所以需要“\”的存在,是因 为在Bash中,有些字符称为元字符,这些字符一旦出现,就会将一个字符串分割为多个子串。如果需要在一个字符串中包含这些元字符本身,就必须对它们进行 引用。如下图:
最常见的元字符就是空格。 从上面几张图片可以看出,如果要将一个含有空格的字符串赋值给一个变量,要么把这个字符串用双引号包围,要么使用“\”对空格进行引用。 从上图中可以看出,Bash中只有9个元字符,它们分别是“| & ( ) ; < > space tab”,而在其它编程语言中经常出现的元字符“. { } [ ]”以及作为数学运算的加减乘除,在Bash中都不是元字符。
三、字符串从哪里来、到哪里去
介绍完字符串、介绍完引用和元字符,下一个目标就是来探讨这一个哲学问题:字符串从哪里来、到哪里去?通过该哲学问题的探讨,可以推导出 Bash脚本语言的整个语法。字符串从哪里来?很显然,其中一个很直接的来源就是我们从键盘上敲上去的。除此之外,就是我前面提到的七八九种字符串展开的 方法了。
字符串展开的流程如下:
1.先用元字符将一个字符串分割为多个子串;
2.如果字符串是用来给变量赋值,则不管它是否被双引号包围,都认为它被双引号包围;
3.如果字符串不被单引号和双引号包围,则进行大括号展开,即将{a,b}c展开为ab ac;
以上三个流程可以通过下图证明:
4.如果字符串不被单引号或双引号包围,则进行波浪符展开,即将~/展开为用户的主目录,将~+/展开为当前工作目录(PWD),将~-/展开为上一个工作目录(OLDPWD);
5.如果字符串不被单引号包围,则进行参数和变量展开;这一类的展开全都以“ $ ”开头,这是整个Bash字符串展开中最复杂的,其中包括用户定义的变量,包括所有的环境变量,以上两种展开方式都是“ $ ”后跟变量名,还包括位置变量“ $ 1、 $ 2、 ...、 $ 9、 ... ”,其它特殊变量:“ $ @、 $ *、 $ #、 $ -、 $ !、 $ 0、 $ ?、 $ _ ”,甚至还有数组:“ $ {var[i]}”, 还可以在展开的过程中对字符串进行各种复杂的操作,如:“ $ {parameter:-word}、 ${parameter:=word}、 $ {parameter:+word}、 ; $ {parameter:?word}、 $ {parameter:offset}、 ${parameter:offset:length}、 $ {!prefix*}、 $ {!prefix@}、 $ {name[@]}、 $ {!name[*]}、 $ {#parameter}、 ${parameter#word}、 $ {parameter##word}、 $ {parameter%word}、 $ {parameter%%word}、 ${parameter/pattern/string}、 $ {parameter^pattern}、 $ {parameter^^pattern}、 $ {parameter,pattern}、 ${parameter,,pattern}”;
6.如果字符串不被单引号包围,则进行命令替换;命令替换有两种格式,一种是 $ (...),一种是`...`;也就是将命令的输出作为字符串的内容;
7.如果字符串不被单引号包围,则进行算术展开;算术展开的格式为 $ ((...));
8.如果字符串不被单引号或双引号包围,则进行单词分割;
9.如果字符串不被单引号或双引号包围,则进行文件路径展开;
10.以上流程全部完成后,最后去掉字符串外面的引号(如果有的话)。以上流程只按以上顺序进行一遍。比如不会在变量展开后再进行大括号展开,更不会在第10步去除引用后执行前面的任何一步。如果需要将流程再走一遍,请使用eval。
探讨完了字符串从哪里来,下面来看看字符串到哪里去。也就是怎么使用这些字符串。使用字符串有以下几种方式:
1.把它当命令执行;这是Bash中的最根本的用法,毕竟Shell的存在就是为了粘合各种命令。如果一个字符串出现在本该命令出现的地方(比如一行的开头,或者关键字then、do等的后面),它将会被当成命令执行,如果它不是个合法的命令,就会报错;
2.把它当成表达式;Bash中本没有表达式,但是有了((...))和[[...]],就有了表达式;((...))可以把它里面的字符串当成算术表达式,而[[...]]会把它里面的字符串当逻辑表达式,仅此两个特例;
3.给变量赋值;这也是一个特例,有点破坏Bash编程语言语法哲学的完整性。为什么这么说呢?因为“=”即不是一个元字符,也不允许两边有空格,而且只有第1个等号会被当成赋值运算符。
下面图片为以上观点给出证据:
- 本文来自:Linux学习网
Linux Bash脚本编程语言中的美学与哲学的更多相关文章
- Linux 桌面玩家指南:06. 优雅地使用命令行及 Bash 脚本编程语言中的美学与哲学
特别说明:要在我的随笔后写评论的小伙伴们请注意了,我的博客开启了 MathJax 数学公式支持,MathJax 使用$标记数学公式的开始和结束.如果某条评论中出现了两个$,MathJax 会将两个$之 ...
- Linux应用环境实战10:Bash脚本编程语言中的美学与哲学(转)
阅读目录 一.一切皆是字符串 二.引用和元字符 三.字符串从哪里来.到哪里去 四.再加上一点点的定义,就可以推导出整个Bash脚本语言的语法了 五.输入输出重定向 六.Bash脚本语言的美学:大道至简 ...
- Bash 脚本编程语言中的美学与哲学
我承认,我再一次地当了标题党.但是不可否认,这一定是一篇精华随笔.在这一篇中,我将探讨 Bash 脚本语言中的美学与哲学. 这不是一篇 Bash 脚本编程的教程,但是却能让人更加深入地了解 Bash ...
- linux bash脚本把A和B文件中有相同ID的B文件的内容输出到文件C
bash脚本把A和B文件中有相同ID的B文件的内容输出到文件C. Aid文件:ID001.1ID032.1ID090.10 Bfilt文件:XX XX XXX ID001.1 XXX999999999 ...
- Linux bash脚本及常用命令--不断更新中
1.如何在向alias命令传递参数: 这种用法的话就需要使用函数来配合使用. 如要cd到指定目录,并且ls当前目录下的文件可以使用: alias cdls='cdls(){ cd $1; ls; } ...
- Linux Bash 脚本:自己定义延迟代码块(裸数据保存方案)
结合 alias 和 read 使用方法.能够保存一些将要延迟执行的脚本,或者裸数据(字符串不被扩展)到一个变量中.以备后用. $ alias BEGIN='read -d "" ...
- 用于监视Linux上的内存使用情况的Bash脚本
用于监视Linux上的内存使用情况的Bash脚本 2019-06-17 11:32:45作者:戴进稿源:云网牛站 在本文中,我们添加了两个shell脚本来监视Linux操作系统上的内存利用率,即用于监 ...
- 【操作系统作业—lab1】linux shell脚本 遍历目标文件夹和所有文件 | 包括特殊字符文件名的处理
要求:写一个linux bash脚本来查看目标文件夹下所有的file和directory,并且打印出他们的绝对路径. 运行command:./myDir.sh input_path output_ ...
- Bash脚本编程之算术运算
简介 Bash所支持的算术运算和C语言是一样的,这里指的是操作符(operator)以及它们的优先级(precedence).结合性(associativity)和值,详见Shell Arithmet ...
随机推荐
- Linux下定时执行任务(crontab命令)
1.循环执行的计划任务 linux下面有atd和crond两种计划任务,其中,atd服务使用的at命令只能执行一次,而crond服务使用的crontab定义的命令,是循环作用的,所以crond才符合我 ...
- 字符串全排列 java实现
经常会遇到字符串全排列的问题.例如:输入为{‘a’,’b’,’c’},则其全排列组合为abc,acb,bac,bca,cba,cab.对于输入长度为n的字符串数组,全排列组合为n!种. package ...
- PAT1055___排序神题
题目意思比较简单,按财富,年龄,姓名来排序 看似挺普通的,但被坑了20多次TLE 首先排序只要一次,就是按题目规定的进行排序 然后在查询的时候,不是从头扫到尾看是否符合年龄的限制,而是记录这个年龄组在 ...
- BOM的编制与管理
Bill of Material BOM英文全称 Bill of Material,即“物料清单”,也称产品结构表.在制造业管理信息系统中,经常会提到BOM.物料清单是指产品所需零部件明细表及其结构. ...
- C#String地址、拼接性能学习
String类型不可变.定义string变量时会在堆上分配存储空间,而对该变量进行值变更时会重新分配一个存储空间,且保留原存储空间. 测试思路:获取string类型变量值变更前后的存储空间地址,判断地 ...
- 基于INTEL FPGA硬浮点DSP实现卷积运算
概述 卷积是一种线性运算,其本质是滑动平均思想,广泛应用于图像滤波.而随着人工智能及深度学习的发展,卷积也在神经网络中发挥重要的作用,如卷积神经网络.本参考设计主要介绍如何基于INTEL 硬浮点的DS ...
- JavaScript快速切换繁体中文和简体中文的方法及网站支持简繁体切换的绝招
一般商业网站都有一个语言的需求,就是为了照顾使用正体中文的国人,会特地提供一个切换到正体中文的选项(或曰“繁体中文”).传统做法是在服务端完成的,即通过某些控件或者过滤器转换文本语言.这里笔者介绍一种 ...
- if、while中变量的作用域问题
我们知道,函数.类会改变当前变量的作用域.if,while等分支循环结构会继承外部作用域,即外部变量对分支循环结构内部可见. 但是C语言不支持if,while等分支循环结构内部作用域对外可见,而PHP ...
- c++ 搜索二叉树 插入,删除,遍历操作
搜索二叉树是一种具有良好排序和查找性能的二叉树数据结构,包括多种操作,本篇只介绍插入,排序(遍历),和删除操作,重点是删除操作比较复杂,用到的例子也是本人亲自画的 用到的测试图数据例子 第一.构建节点 ...
- 转载 cglib代理和java代理
Java动态代理之JDK实现和CGlib实现(简单易懂) 转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/6542259.html 一:代理模式(静态代理) ...