模式扩展
2023-1-19
| 2023-8-2
0  |  阅读时长 0 分钟
type
status
date
slug
summary
tags
category
icon
password
Property
 
Shell接收到输入的命令后,会根据空格将用户的输入,拆分成一个个词元(token)。然后,扩展词元里面的特殊字符,扩展完成后才会调用相应的命令。这种特殊字符的扩展,称为模式扩展(globbing)。其中有些用到通配符,又称为通配符扩展(wildcard expansion)
 
Bash是先进行扩展,再执行命令。因此,扩展的结果是由 Bash 负责的,与所要执行的命令无关。命令本身并不存在参数扩展,收到什么参数就原样执行。
模式扩展与正则表达式的关系是,模式扩展早于正则表达式出现,可以看作是原始的正则表达式。它的功能没有正则强大灵活,但优点是简单和方便。
Bash允许用户关闭扩展:
重新打开扩展:
 
 
Bash一共提供八种扩展:
波浪线扩展
波浪线~会自动扩展成当前用户的主目录
 
~/dir表示扩展成主目录的某个子目录,dir是主目录里面的一个子目录名。
 
~user表示扩展成用户user的主目录。
如果~useruser是不存在的用户名,则波浪号扩展不起作用
 
~+会扩展成当前所在的目录,等同于pwd命令:
? 字符扩展
?字符代表文件路径里面的任意单个字符,不包括空字符。比如,Data???匹配所有Data后面跟着三个字符的文件名。
? 字符扩展属于文件名扩展,只有文件确实存在的前提下,才会发生扩展。如果文件不存在,扩展就不会发生。
* 字符扩展
*字符代表文件路径里面的任意数量的任意字符,包括零个字符:
如果想输出当前目录的所有文件,直接用*即可:
注意,*不会匹配隐藏文件(以.开头的文件),如果要匹配隐藏文件,需要写成.*
如果要匹配隐藏文件,同时要排除...这两个特殊的隐藏文件,可以与方括号扩展结合使用,写成.[!.]*
 
*只匹配当前目录,不会匹配子目录。
上面的例子,文本文件在子目录,*.txt不会产生匹配,必须写成*/*.txt。有几层子目录,就必须写几层星号。
Bash 4.0 引入了一个参数globstar,当该参数打开时,允许**匹配零个或多个子目录。因此,**/*.txt可以匹配顶层的文本文件和任意深度子目录的文本文件。
 
注,*字符扩展属于文件名扩展,只有文件确实存在的前提下才会扩展。如果文件不存在,就会原样输出。
 
方括号扩展
方括号扩展的形式是[...],只有文件确实存在的前提下才会扩展。如果文件不存在,就会原样输出。括号之中的任意一个字符。比如,[aeiou]可以匹配五个元音字母中的任意一个。
 
方括号扩展属于文件名匹配,即扩展后的结果必须符合现有的文件路径。如果不存在匹配,就会保持原样,不进行扩展。
上面例子中,由于扩展后的文件不存在,[ab].txt就原样输出了,导致ls命名报错。
方括号扩展还有两种变体:[^...][!...]。它们表示匹配不在方括号里面的字符,这两种写法是等价的。比如,[^abc][!abc]表示匹配除了abc以外的字符。
上面命令中,[!a]表示文件名第二个字符不是a的文件名,所以返回了ababbb两个文件。
注意,如果需要匹配[字符,可以放在方括号内,比如[[aeiou]。如果需要匹配连字号-,只能放在方括号内部的开头或结尾,比如[-aeiou][aeiou-]
 
方括号扩展有一个简写形式[start-end],表示匹配一个连续的范围。比如,[a-c]等同于[abc][0-9]匹配[0123456789]
下面是一些常用简写的例子。
  • [a-z]:所有小写字母。
  • [a-zA-Z]:所有小写字母与大写字母。
  • [a-zA-Z0-9]:所有小写字母、大写字母与数字。
  • [abc]*:所有以abc字符之一开头的文件名。
  • program.[co]:文件program.c与文件program.o
  • BACKUP.[0-9][0-9][0-9]:所有以BACKUP.开头,后面是三个数字的文件名。
这种简写形式有一个否定形式[!start-end],表示匹配不属于这个范围的字符。比如,[!a-zA-Z]表示匹配非英文字母的字符。
[!1-3]表示排除1、2和3
 
大括号扩展
大括号扩展{...}表示分别扩展成大括号里面的所有值,各个值之间使用逗号分隔。比如,{1,2,3}扩展成1 2 3
 
大括号扩展不是文件名扩展。它会扩展成所有给定的值,而不管是否有对应的文件存在。
上面例子中,即使不存在对应的文件,{a,b,c}依然扩展成三个文件名,导致ls命令报了三个错误。
 
另一个需要注意的地方是,大括号内部的逗号前后不能有空格。否则,大括号扩展会失效。
逗号前后有空格,Bash 就会认为这不是大括号扩展,而是三个独立的参数。
 
逗号前面可以没有值,表示扩展的第一项为空。
 
大括号可以嵌套:
大括号也可以与其他模式联用,并且总是先于其他模式进行扩展。
 
大括号可以用于多字符的模式,方括号不行(只能匹配单字符)。
由于大括号扩展{...}不是文件名扩展,所以它总是会扩展的。这与方括号扩展[...]完全不同,如果匹配的文件不存在,方括号就不会扩展。
上面例子中,如果不存在a.txtb.txt,那么[ab].txt就会变成一个普通的文件名,而{a,b}.txt可以照样扩展。
 
大括号扩展有一个简写形式{start..end},表示扩展成一个连续序列。比如,{a..z}可以扩展成26个小写英文字母。
这种简写形式支持逆序:
注意,如果遇到无法理解的简写,大括号模式就会原样输出,不会扩展。
这种简写形式可以嵌套使用,形成复杂的扩展。
大括号扩展的常见用途为新建一系列目录。
这个写法的另一个常见用途,是直接用于for循环。
 
如果整数前面有前导0,扩展输出的每一项都有前导0
这种简写形式还可以使用第二个双点号(start..end..step),用来指定扩展的步长。
上面代码将0扩展到8,每次递增的长度为2,所以一共输出5个数字。
多个简写形式连用,会有循环处理的效果。
 
变量扩展
Bash 将美元符号$开头的词元视为变量,将其扩展成变量值
变量名除了放在美元符号后面,也可以放在${}里面。
${!string*}${!string@}返回所有匹配给定字符串string的变量名。
上面例子中,${!S*}扩展成所有以S开头的变量名。
子命令扩展
$(...)可以扩展成另一个命令的运行结果,该命令的所有输出都会作为返回值。
还有另一种较老的语法,子命令放在反引号之中,也可以扩展成命令的运行结果。
$(...)可以嵌套,比如$(ls $(pwd))
算术扩展
$((...))可以扩展成整数运算的结果
 
 
Bash 允许文件名使用通配符,即文件名包括特殊字符。这时引用文件名,需要把文件名放在单引号或双引号里面。
 

字符类

[[:class:]]表示一个字符类,扩展成某一类特定字符之中的一个,常用的字符类如下。
  • [[:alnum:]]:匹配任意英文字母与数字
  • [[:alpha:]]:匹配任意英文字母
  • [[:blank:]]:空格和 Tab 键。
  • [[:cntrl:]]:ASCII 码 0-31 的不可打印字符。
  • [[:digit:]]:匹配任意数字 0-9。
  • [[:graph:]]:A-Z、a-z、0-9 和标点符号。
  • [[:lower:]]:匹配任意小写字母 a-z。
  • [[:print:]]:ASCII 码 32-127 的可打印字符。
  • [[:punct:]]:标点符号(除了 A-Z、a-z、0-9 的可打印字符)。
  • [[:space:]]:空格、Tab、LF(10)、VT(11)、FF(12)、CR(13)。
  • [[:upper:]]:匹配任意大写字母 A-Z。
  • [[:xdigit:]]:16进制字符(A-F、a-f、0-9)。
字符类的第一个方括号后面,可以加上感叹号!,表示否定。比如,[![:digit:]]匹配所有非数字:
字符类也属于文件名扩展,如果没有匹配的文件名,字符类就会原样输出
 

量词语法

量词语法用来控制模式匹配的次数。它只有在 Bash 的extglob参数打开的情况下才能使用,一般是默认打开的。
 
量词语法:
  • ?(pattern-list):模式匹配零次或一次。
  • (pattern-list):模式匹配零次或多次。
  • +(pattern-list):模式匹配一次或多次。
  • @(pattern-list):只匹配一次模式。
  • !(pattern-list):匹配给定模式以外的任何内容。
量词语法也属于文件名扩展,如果不存在可匹配的文件,就会原样输出。
 

shopt 命令

shopt命令可以调整 Bash 的行为。它有好几个参数跟通配符扩展有关。
 
dotglob 参数:可以让扩展结果包括隐藏文件(即点开头的文件)。正常情况下,扩展结果不包括隐藏文件。
 
nullglob 参数:可以让通配符不匹配任何文件名时,返回空字符。默认情况下,通配符不匹配任何文件名时,会保持不变。
 
failglob 参数:使得通配符不匹配任何文件名时,Bash 会直接报错,而不是让各个命令去处理。
 
extglob 参数:使得 Bash 支持 ksh 的一些扩展语法。默认是打开的。
 
nocaseglob 参数:可以让通配符扩展不区分大小写。
 
globstar 参数:可以使得**匹配零个或多个子目录。该参数默认是关闭的。
假设有下面的文件结构。
上面的文件结构中,顶层目录、第一级子目录sub1、第二级子目录sub1\sub2里面各有一个文本文件。请问怎样才能使用通配符,将它们显示出来?
默认情况下,只能写成下面这样:
这是因为*只匹配当前目录,如果要匹配子目录,只能一层层写出来。
 
打开globstar参数以后,**匹配零个或多个子目录。因此,**/*.txt就可以得到想要的结果。
 
  • 计算机基础
  • Linux
  • Shell脚本
  • Vim编辑器Bash 变量
    目录