扩展正则表达式及应用

2017-09-2206:49:00 发表评论

第1章 扩展正则表达式

1.1  + 前一个字符连续出现了1次或1次以上

egrep  "0+" clsn.txt  1次或1次以上 >=1

egrep  "0*" clsn.txt  0次或0次以上 >=0

1.1.1 找到文本中的0

[root@znix ~]# egrep  "0+" clsn.txt

my qq num is 49000448.

not 4900000448.

[root@znix ~]# egrep -o  "0+" clsn.txt

000

00000

 

1.1.2 取出文件中的大写字母

[root@znix ~]# grep -o "[A-Z]" clsn.txt

I

I

I

O

L

D

B

O

Y

1.1.3 取出连续出现的大写字母

[root@znix ~]# egrep -o "[A-Z]+" clsn.txt

I

I

I

clsn

1.1.4 显示所有的单词

[root@znix ~]# egrep -o "[A-Za-z]+" clsn.txt

I

am

clsn

teacher

1.2  | 或者

表示找其中的一个或者是另外一个。

[root@znix ~]# egrep "clsn|oldbey" clsn.txt  -o

clsn

clsn

oldbey

/etc/services 中的两个端口

[root@znix ~]# egrep "3306|1521" /etc/services

mysql           3306/tcp                        # MySQL

mysql           3306/udp                        # MySQL

ncube-lm        1521/tcp                # nCube License Manager

ncube-lm        1521/udp                # nCube License Manager

       找其中的A或者B或者C

[root@znix ~]# egrep "A|B|C" clsn.txt

my god ,i am not oldbey,but clsn!

       找到12或者56替换成空。

[root@znix ~]# echo 123456|sed -r 's#12|56##g'

34

1.3 () 小括号 反向引用

小括号里面的内容是一个整体,相当于是一个字符 

1.3.1 表示一个整体

[root@znix ~]# egrep "oldb(o|e)y" clsn.txt

I am clsn teacher!

my blog is http://clsn.blog.51cto.com

my god ,i am not oldbey,but clsn!

1.3.2 反向引用

       sed -r 使用扩展正则

[root@znix ~]# echo 123456|sed -r 's#..(..)..#\1#g'

34

       点表示任意一个字符,\2表示第二个括号。

[root@znix ~]# echo 123456|sed -r 's#(.).(..).(.)#\2#g'

34

1.4 {} 大括号(花括号)

0{n,m} 数字0连续出现了至少n,最多m

[root@znix ~]# egrep "[a-z]{3,6}" clsn.txt

I am clsn teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is http://clsn.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but clsn!

 

[root@znix ~]# egrep "[a-zA-Z]{3,6}" clsn.txt

I am clsn teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is http://clsn.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but clsn!
[root@znix ~]#

1.4.1 大括号的不同方法

 0{3,6}   >=3 <=6

 0{3}     ==3

 0{3,}    >=3

 0{,6}    >=0 <=6

1.5  

前一个字符连续出现了 0次或1

1.5.1 环境

[root@znix ~]# cat a.log

good

gd

god

goood

1.5.2 o连续出现0次或1

[root@znix ~]# egrep "gd|god" a.log

gd
god

[root@znix ~]# egrep "go?d" a.log

gd
god

1.6 正则表达式分类

1.6.1 基础正则

^       以……开头

$       以……结尾

^$     空行

.*      所有

[abc]   表示abc

[a-z]   表示az

[A-Z]   表示A-Z

[^abc]  表示排除abc

1.6.2 扩展正则表达式

+      连续出现 1次或1次以上

|       或者

()      小括号里面的内容是一个整体,相当于是一个字符

{}      0{n,m} 数字0连续出现了至少n,最多m

?       前一个字符连续出现了 0次或1

 

第2章 取出eth0网卡的ip地址

2.1 思路

1)先定位 取出第二行

2)取出ip地址

2.1.1 eth0的内容

[root@znix ~]# ifconfig eth0

eth0      Link encap:Ethernet  HWaddr 00:0C:29:A8:E4:14 

          inet addr:10.0.0.201  Bcast:10.0.0.255  Mask:255.255.255.0

          inet6 addr: fe80::20c:29ff:fea8:e414/64 Scope:Link

          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

          RX packets:86884 errors:0 dropped:0 overruns:0 frame:0

          TX packets:74978 errors:0 dropped:0 overruns:0 carrier:0

          collisions:0 txqueuelen:1000

          RX bytes:14324203 (13.6 MiB)  TX bytes:26220378 (25.0 MiB)

2.2 方法一 sed 去头去尾

sed命令,将其中不需要显示的,逐步替换。

[root@znix ~]#  ifconfig eth0|sed -n '2p'|sed 's#^.*dr:##g'|sed 's# .*$##g'

10.0.0.201

2.3 方法二sed 反向引用 

反向替换,使用()把ip地址保护起来,\1方向选择,显示出来ip

[root@znix ~]# ifconfig eth0|sed -nr '2s#^.*dr:(.*)  Bc.*$#\1#gp'

10.0.0.201

       简写?

[root@znix ~]# ifconfig eth0|sed -n '2p'|sed -r 's#^.*dr:(.*)Bc.*$#\1#g'

10.0.0.201 

2.4 方法三

使用把[^0-9.]之外的替换成空格,使用awk取出第一列。

[root@znix ~]# ifconfig eth0|sed -n '2s#[^0-9.]# #gp'|awk '{print $1}'

10.0.0.201

2.5 方法四

awk 指定分隔符,将空格和分号都定为分隔符,然后取列。

[root@znix ~]# ifconfig eth0|sed -n '2p'|awk -F "[ :]+" '{print $4}'

10.0.0.201

第3章 第三关练习题

3.1 如何取得/etiantian文件的权限对应的数字内容,如-rw-r--r--644,要求使用命令取得644 这样的数字。

 

3.1.1 方法一 反向引用

使用反向引用,保护要取出的内容。

[root@znix ~]# stat /etc/services |sed -nr '4s#^.*\(0(.*)/-.*$#\1#gp'

644

3.1.2 方法二 掐头去尾

两个sed 将不需要的东西替换为空。

[root@znix ~]# stat /etc/hosts |sed -n '4s#^.*(0##gp'|sed 's#/.*$##g'

644

3.1.3 方法三 排除

[^0-7] 除了07以外的替换成空格

[root@znix ~]#  stat /etc/hosts |sed -n '4s#[^0-7]##gp'

064400

[root@znix ~]# stat /etc/hosts|sed -nr '4s#[^0-7]+# #gp'

 0644 0 0

 

第4章 特殊符号通配符

4.1 特殊符号

&&   并且 前面的执行对了执行后面

||   或者 前面命令执行失败了再执行后面的

>>   追加输出重定向

>   标准输出重定向

/     路径的分隔符

$    取变量的内容

.    当前目录

..   当前目录的上一级目录

~    家目录

|    管道

!    取反 find awk

#    注释

4.2 通配符

* {}    找出文件

4.3 正则表达式(三剑客grep sed awk使用)

^

$

^$

.*

[abc]   一个整体 abc

        正则表达式认为只要是在中括号里面的就是一样的.

[^abc]  abc之外

weinxin
惨绿少年Linux
这是我的微信公众号扫一扫
惨绿少年

发表评论

您必须登录才能发表评论!