LinuX---Shell正则表达式

正则表达式

正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。在Linux中,grep,sed,awk等命令都支持通过正则表达式进行模式匹配。

常规匹配

一串不包含特殊字符的正则表达式匹配它自己,例如:

feng@ubuntu:~$ cat /etc/passwd |grep -E 'feng'

就会匹配所有包含feng的行。

常用特殊字符

1)特殊字符:^

^ 匹配一行的开头,例如:

feng@ubuntu:~$ cat /etc/passwd |grep -E '^a'

会匹配出所有以a开头的行

2)特殊字符:$

$ 匹配一行的结束,例如

feng@ubuntu:~$ cat /etc/passwd |grep -E 'n$'

会匹配出所有以n结尾的行

思考:^$ 匹配什么?

3)特殊字符:.

. 匹配一个任意的字符,例如

feng@ubuntu:~$ cat /etc/passwd |grep -E 'r..t'

会匹配包含rabt,rbbt,rxdt,root等的所有行

4)特殊字符:*

* 不单独使用,他和上一个字符连用,表示匹配上一个字符0次或多次,+例如

feng@ubuntu:~$ cat /etc/passwd |grep -E 'ro*t'

会匹配rt, rot, root, rooot, roooot等所有行。

思考:.* 匹配什么?

5)特殊字符:[ ]

[ ] 表示匹配某个范围内的一个字符,例如

[6,8]------匹配6或者8

[0-9]------匹配一个0-9的数字

[0-9]*------匹配任意长度的数字字符串

[a-z]------匹配一个a-z之间的字符

[a-z]* ------匹配任意长度的字母字符串

[a-c, e-f]-匹配a-c或者e-f之间的任意字符

feng@ubuntu:~$ cat /etc/passwd |grep -E 'r[u,k].*t'

会匹配rt,rat, rbt, rabt, rbact,rabccbaaacbt等等所有行。

6)特殊字符:\

\ 表示转义,并不会单独使用。由于所有特殊字符都有其特定匹配模式,当我们想匹配某一特殊字符本身时(例如,我想找出所有包含 '$' 的行),就会碰到困难。此时我们就要将转义字符和特殊字符连用,来表示特殊字符本身,例如。

feng@ubuntu:~$ cat /etc/passwd |grep -E 'a\$b'

就会匹配所有包含 a$b 的行。

其他特殊字符

见参考资料的正则表达式语法。

经典正则表达式

邮箱正则
^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$
手机号正则
简单:/^1[3-9]\d{9}$/
复杂:/^1((34[0-8])|(8\d{2})|(([35][0-35-9]|4[579]|66|7[35678]|9[1389])\d{1}))\d{7}$/

你可能感兴趣的:(Shell,linux,正则表达式)