shell模糊匹配与正则详解

前言:

正则可以实现一些简单的功能,并用在脚本中,如检测ip地址是否符合规范,检测文件名是否符合规范等等。

正则表达式

正则表达式主要是用来描述一个句法规则的模式。其实说的通俗一点,就是利用字符和元字符的组合,对一些符合既定句法的模式进行模糊匹配。它的主要功能是文本查询和字符串操作。

正则表达式的基本元素包括普通字符和元字符,在Linux shell里面,常用的正则表达式元字符集为:S={*  .  ^  $  []  \  \<\>  \{\}  \{n,\}  \{n,m\} },每一个元字符都有自己在正则表达式中的含义,下面来介绍一下:

“ * ”符号:表示匹配前面一个普通字符0次或多次。注意这里是一个普通字符,即如果是JO*B的话,那么*就匹配字符“O”任意次,而不是匹配“JO”串。

“ . ”符号:表示匹配任意一个字符。字符“ . "就表示一个字符,这个字符可以是任意字符。例如字符串 ...73 就表示前面3个字符为任意字符(包括空格),第4个和第5个字符分别是7和3。

“ ^ ”符号:表示匹配行首。例如:^cloud就表示匹配以cloud字符串开头的所有行。与上面匹配一个字符不一样,这里匹配的是后面跟着的整个字符串。

” $ "符号:表示匹配行尾。例如:cloud$ 就表示匹配以cloud字符串结尾的所有行。结合上面的匹配行首,^$表示匹配空行。

“ [] "符号:表示匹配方括号里面的字符集中的一个。例如:数字0-9中的任意一个数字都满足[0-9]这个表达式。值得注意的是,当^放在[]里面的时候,^就不再表示行首,而是表示取反。如:[^7-9]则表示非7-9中的任意一个数字才满足这个表达式。

” \ “符号:是转义字符。如果你写的正则表达式里面包括元字符,而你又想将它当做普通字符用的话,就要在前面加上转义符号" \ "了。例如:\$就表示一个普通字符”$"。

“\<\>"符号:表示精确匹配<>内的字符,” \ “是用来转义<>这两个字符的。例如:\<the\>表示匹配包含”the“的行,由于精确匹配,所以,”them“,”theory“这些单词所在的行并不会被匹配到。

”\{\}"符号:与" * "类似,表示匹配前面的一个字符任意多次。但是“\{\}”可以指定重复的次数,如\{3\}则表示重复前面的字符3次;\{3,\}表示重复前面的字符至少3次;\{3,5\}表示重复3到5次。例如:JO\{3\}B则表示重复字符O三次,即JOOOB;JO\{3,\}B则表示至少重复O三次,即JOOOB,JOOOOB等都符合;\{3,5\}则匹配JOOOB,JOOOOB,JOOOOOB这几个字符串。

通配符

初学的时候对于正则表达式和通配符的理解很模糊,两个都是可以进行模糊匹配的,到底什么时候用才是正则表达式,什么时候用是通配符呢?其实,我们登录系统之后,系统的bash shell并不支持正则表达式的,也就是说,我们如果使用bash shell的某些命令时使用正则表达式,shell可能会认不出来,只有当我们使用类似grep,sed,awk等工具的时候才有效。所以,我们在使用bash shell的时候也想达到模糊匹配的目的的话,就要使用通配符了。

通配符是使用正则表达式的一些元字符来的,常用的元字符集:E={?  *  []  {}  ^ }。不过,这个通配符的元字符意义跟正则表达式里面的不太一样。例如:

“ * "字符不再表示匹配前面一个字符任意多次,而是表示任意位置的任意字符。例如:phi*ip,则可以匹配philip,phillip,philsaip等开始三个是phi和结尾两位是ip的任意字符。例如ls -l *.awk表示匹配以.awk结尾的所有文件,*表示任意长度任意字符组合。

" ? ”字符才表示任意一个字符。同正则表达式元字符的" . "

" {} “字符不需要转义。在{}表示的是表达式集合。如:ls -l {[a-h]*.awk,0?.pem}则表示列出所有以a-h字符开头的.awk文件的和以0开头,后面接一个任意字符的.pem文件

" ^ "字符也不是表示行首,而是代表取反。

正则表达式和通配的应用环境上有些不一样,但是都能够达到模糊匹配的效果。在后面介绍到的使用grep,sed和awk等工具对于文件的查找以及各种操作中,正则表达式的匹配作用更加明显。

范例:

检测文件名是否符合规范:

#!/bin/bash

RED='\033[31m'
GREEN='\033[32m'

awk '{printf("%s",$0)}' $1 | egrep "^#[[:digit:]]*-(docs|unittest|pseudocode|msg-[^ ].*)$" > /dev/null 2>&1

if [ $? -ne 0 ];then
 echo -e "message check ${RED}fail${NORMAL}"
 exit 1
fi
 echo -e "message check ${GREEN}success${NORMAL}"
exit 0

当然,也可以使用if,如:

if [[ $1 =~ ^[0-9]+$ ]]; then
  echo "Is Number."
else
  echo "No Number."
fi

检测ip地址是否符合规范:

构造测试文件 ip.txt

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255
999.0.0.1
1.0.0.500
a.0.0.0
0.b.0.0
1.1.1
2.2
1
0.0.0.0

基本思路就是要每个点之间的元素为整数,最多为3位整数[0-9]\{1,3\},然后用 . 拼接起来,加上^和$更精确的限制匹配对象

cat ip.txt |grep '^[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}$'

结果为

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255
999.0.0.1
1.0.0.500
0.0.0.0

这里精度不够,需要严格限制整数为1-255(第一个元素不能为0,后面的可以为0),即0-9 10-99 100-199 200-249 250-255

\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)    注意|和()转义,另外|分割的元素要用()括住,若带-E参数指定为扩展正则的形式则不需用\转义

然后后面3个元素只要稍改下范围到0-255,简单的拼接起来

代码如下:

cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)$'

结果如下

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255

当然更简洁的写法,记得.后面的元要()括起来

代码如下:

cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\(\.\([0-9]\|([1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\)\{3\}$'

到此这篇关于shell模糊匹配与正则详解的文章就介绍到这了,更多相关shell模糊匹配与正则内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • shell脚本正则匹配文件中的Email并写入到文件中代码分享

    代码如下: 复制代码 代码如下: #! /bin/bashfunction read_file(){    for line in `cat $1`    do        if [ `echo $line |grep "^[a-zA-Z0-9_-]*@[A-Za-z_-]*\.[a-zA-Z_-]*$"` ];then            echo $line >> result.txt        else            echo "---&qu

  • shell通过正则匹配ip地址实例代码

    前言 在运维场景下,我们经常需要在服务器上用正则表达式来匹配IP地址. shell和其它编程语言一样,也可以使用正则分组捕获,不过不能使用 $1或\1这样的形式来捕获分组,可以通过数组${BASH_REMATCH}来获得,如${BASH_REMATCH[1]},${BASH_REMATCH[N]} IP分成5大类: A类地址 ⑴ 第1字节为网络地址,其它3个字节为主机地址. ⑵ 范围:1.0.0.1-126.155.255.254 ⑶ 私有地址和保留地址: ① 10.X.X.X是私有地址(只能在

  • Shell脚本中通过正则表达式匹配IP地址

    在运维场景下,我们经常需要在服务器上用正则表达式来匹配IP地址. shell和其它编程语言一样,也可以使用正则分组捕获,不过不能使用 $1或\1这样的形式来捕获分组,可以通过数组${BASH_REMATCH}来获得,如${BASH_REMATCH[1]},${BASH_REMATCH[N]} 下面以ip="121.0.2.2"为例,shell脚本代码如下(当然,你要做成更通用交互式的脚本,可以通过expect来实现): 复制代码 代码如下: #!/bin/bash ip="1

  • shell模糊匹配与正则详解

    前言: 正则可以实现一些简单的功能,并用在脚本中,如检测ip地址是否符合规范,检测文件名是否符合规范等等. 正则表达式 正则表达式主要是用来描述一个句法规则的模式.其实说的通俗一点,就是利用字符和元字符的组合,对一些符合既定句法的模式进行模糊匹配.它的主要功能是文本查询和字符串操作. 正则表达式的基本元素包括普通字符和元字符,在Linux shell里面,常用的正则表达式元字符集为:S={*  .  ^  $  []  \  \<\>  \{\}  \{n,\}  \{n,m\} },每一个元

  • Python+FuzzyWuzzy实现模糊匹配的示例详解

    目录 1. 前言 2. FuzzyWuzzy库介绍 2.1 fuzz模块 2.2 process模块 3. 实战应用 3.1 公司名称字段模糊匹配 3.2 省份字段模糊匹配 4. 全部函数代码 在日常开发工作中,经常会遇到这样的一个问题:要对数据中的某个字段进行匹配,但这个字段有可能会有微小的差异.比如同样是招聘岗位的数据,里面省份一栏有的写“广西”,有的写“广西壮族自治区”,甚至还有写“广西省”……为此不得不增加许多代码来处理这些情况. 今天跟大家分享FuzzyWuzzy一个简单易用的模糊字符

  • re模块的正则匹配的表达式详解

    一.校验数字的表达式 1.数字 ^[0-9]\*$ 2.n位的数字 ^\d{n}$ 3.至少n位的数字 ^\d{n,}$ 4.m-n位的数字 ^\d{m,n}$ 5.零和非零开头的数字 ^(0|[1-9][0-9]\*)$ 6.非零开头的最多带两位小数的数字 ^([1-9][0-9]\*)+(\.[0-9]{1,2})?$ 7.带1-2位小数的正数或负数 ^(\-)?\d+(\.\d{1,2})$ 8.正数.负数.和小数 ^(\-|\+)?\d+(\.\d+)?$ 9.有两位小数的正实数 ^[0

  • shell脚本--sed的用法详解

    sed在处理文本时是逐行读取文件内容,读到匹配的行就根据指令做操作,不匹配就跳过. sed是Linux下一款功能强大的非交互流式文本编辑器,可以对文本文件进行增.删.改.查等操作,支持按行.按字段.按正则匹配文本内容,灵活方便,特别适合于大文件的编辑.本文主要介绍sed的一些基本用法,并通过shell脚本演示sed的使用实例. 1.sed的使用方法,调用sed 命令的语法有两种: 一.在命令行指定sed指令对文本进行处理:sed +选项  '指令' 文件 二.先将sed指令保存到文件中,将该文件

  • MongoDB模糊查询操作案例详解(类关系型数据库的 like 和 not like)

    1.作用与语法描述 作用: 正则表达式是使用指定字符串来描述.匹配一系列符合某个句法规则的字符串.许多程序设计语言都支持利用正则表达式进行字符串操作.MongoDB 使用 $regex 操作符来设置匹配字符串的正则表达式. 语法一 { <field>: { $regex: /pattern/, $options: '<options>' } } { <field>: { $regex: 'pattern', $options: '<options>' } }

  • 正则表达式教程之匹配一组字符详解

    本文实例讲述了正则表达式教程之匹配一组字符的方法.分享给大家供大家参考,具体如下: 注:在所有例子中正则表达式匹配结果包含在源文本中的[和]之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明.所有java例子都在JDK1.6.0_13下测试通过. 一.匹配多个字符中的某一个 在上一篇<正则表达式教程之匹配单个字符详解>中的一个匹配以na或sa开头的文本文件例子中,使用的正则表达式是.a.\.txt.如果还有一个文件是cal.txt,那么也将会被匹配到.如

  • Angular指令之restict匹配模式的详解

    Angular指令之restict匹配模式的详解 <body data-ng-app="myapp"> <runn2></runn2> <div data-runn2></div> <div class="runn2"></div> <!-- directive: runn2 --> <script> var app=angular.module("

  • Linux shell数组循环的实例详解

    shell数组循环 测试shell数组,循环的例子: arr=("a" "b" "c") echo "所有的内容如下:"${arr[@]} echo "数组的长度:"${#arr[*]} for var in ${arr[@]} do echo "打印的内容:"$var done 输出的内容如下: 以上就是Linux shell数组循环的实例详解,如有疑问请留言或者到本站社区交流讨论,感

  • 基于shell的if和else详解

    基本语法 shell的if语法和C语言等高级语言非常相似,唯一需要注意的地方就是shell的if语句对空格方面的要求比较严格(其实shell对所有语法的空格使用都比较严格),如果在需要空格的地方没有打上空格,都会报错.如if [ $1x == "ip"x ];then echo "abc";fi中少一个空格都会报错.另外shell的if语句必须以fi作为结尾,不然同样会报错. 有else和elif时也一样,需要注意空格的问题,下面这个例子可以作为参考 if [ $1

  • shell脚本 自动创建用户详解及实例代码

    shell脚本 自动创建用户详解 需求:判断用户zhangsan是否存在,不存在就创建并设置密码为123456 1.vi createuser.sh 2.写入: USER_COUNT=`cat /etc/passwd | grep '^zhangsan:' -c` USER_NAME='zhangsan' if [ $USER_COUNT -ne 1 ] then useradd $USER_NAME echo "123456" | passwd $USER_NAME --stdin

随机推荐