熟悉 Shell脚本:正则表达式
基本正则表达式
1.行首定位符“^”
2.行尾定位符“$”
3.单个字符匹配“.”
圆点“.”用来匹配任意单个字符,包括空格,但是不包括换行符“\n”。
可以连续使用圆点符号来匹配多个字符,例如“l..p”匹配含有1个字母“l”,然后是任意两个字符,再接着是一个字母“p”的字符串。
4.限定符“*”
星号“*”是正则表达式中的限定符之一。限定符本身不代表任何字符,它是用来指定其前面的一个字符必须重复出现多少次才能满足匹配。星号“*”表示匹配其前导字符的任意次数,包括0次。
5.字符集匹配“[]”
方括号“[]”的功能比较特殊,它是用来指定一个字符集合的。
其中a、b和c表示任意的单个字符。只要某个字符串在方括号所在的位置上出现了方括号中的任意一个字符,就都满足匹配规则。另外,对于连续的数字或者字母,可以使用连字符“”来表示一个范围,例如“[af]”表示匹配字母表中a到f中的任意一个字母,而“[09]”表示匹配任意单个数字。
6.字符集不匹配“[^]”
7.其他一些元字符
扩展正则表达式
1.限定符“+”
加号“+”的意义与限定符“*”基本相同,但是星号“*”限定前面的字符可以出现任意次,而加号“+”却限定前面的字符至少出现一次。
2.限定符“?”
问号“?”是另外一个限定符,它用来限定前面的字符最多只出现1次,即前面的字符可以重复0次或者1次。
3.竖线“|”和圆括号“()”
竖线“|”表示多个正则表达式之间“或”的关系,其语法为:
圆括号“()”用来表示一组可选值的集合。竖线和圆括号经常在一起使用,表示一组可选值。
Perl正则表达式
正则表达式是Perl语言的一大特色。Shell中的grep和egrep命令都支持Perl正则表达式。Perl正则表达式的元字符与扩展正则表达式的元字符大致相同,扩展正则表达式中的元字符在Perl正则表达式中都得到了支持。另外,Perl正则表达式还增加了一些元字符。下面对常用的增加的元字符进行介绍。
1.数字匹配\d
符号“\d”匹配0~9中的任意一个数字字符,等价于表达式“[09]”。
2.非数字匹配\D
符号“\D”和符号“\d”的作用恰好相反,后者是匹配一个0~9之间的单个数字字符,而前者则匹配一个非数字字符。“\D”等价于表达式“[^09]”。
3.空白字符匹配\s
符号“\s”匹配任何空白字符,包括空格、制表符以及换页符等,等价于表达式“[\f\n\r\t\v]”。
4.非空白字符匹配\S
符号“\S”匹配任何非空白字符,等价于表达式“[^\f\n\r\t\v]”。
正则表达式字符集
与其他普通字符一样,上表列出的字符类也需要放在方括号中。例如:
等价于以下表达式:
运算符优先级
正则表达式按照从左到右的顺序进行计算,并且遵循一定的优先级,这一点与算术表达式非常相似。所谓优先级,是指在正则表达式中,当多个运算符同时出现时,高优先级的运算符将被先处理,低优先级的运算符将被后处理。表83按照从高到低的顺序依次列出了运算符的优先级。