Shell正则表达式学习笔记

正规表示法(或称为常规表示法)是透过一些特殊字符的排列,用以搜寻/取代/删除一列或多列文字字符串, 简单的说,正规表示法就是用在字符串的处理上面的一项『表示式』。正规表示法并不是一个工具程序, 而是一个字符串处理的标准依据,如果您想要以正规表示法的方式处理字符串,就得要使用支持正规表示法的工具程序才行, 这类的工具程序很多,例如 vi, sed, awk 等等。

一、正则表达式是什么?

正则表达式是用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。

二、正则表达式与通配符

1. 正则表达式

用来在文件中匹配符合条件的字符串,正则表达式是“包含匹配”。grep、awk、sed等命令可以支持正则表达式。

2. 正则表达式元字符

正则表达式是通过元字符来进行字符串匹配的,具体请参考:http://www.cnblogs.com/refine1017/p/5011522.html

3. 通配符

用来匹配符合条件的文件名,通配符是“完全匹配”。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。

4. 通配符包括

* 匹配任意字符

? 匹配任意一个字符

[] 匹配中括号中的任意一个字符

三、cut命令

cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。

1. 常用参数

-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。
-n :取消分割多字节字符。仅和 -b 标志一起使用。

2. 示例1:打印出用制表符分割的文件的某一行

[root@localhost shell]# cat student.txt
ID   Name  Gender Mark
1    ming  F    85
2    zhang  F    70
3    wang  M    75
4    li   M    90
[root@localhost shell]# cut -f 4 student.txt
Mark
85
70
75
90 

3. 示例2:打印csv文件的某一行

[root@localhost shell]# cat student.csv
ID,Name,Gender,Mark
1,ming,F,85
2,zhang,F,70
3,wang,M,75
4,li,M,90
[root@localhost shell]# cut -d "," -f 4 student.csv
Mark
85
70
75
90 

4. 示例3:打印一个字符串的第几个字符

[root@localhost shell]# echo "abcdef" | cut -c 3
c 

5. 示例4:截取中文字符的某一个文字

[root@localhost shell]# echo "Shell编程" | cut -nb 1
S
[root@localhost shell]# echo "Shell编程" | cut -nb 2
h
[root@localhost shell]# echo "Shell编程" | cut -nb 3
e
[root@localhost shell]# echo "Shell编程" | cut -nb 4
l
[root@localhost shell]# echo "Shell编程" | cut -nb 5
l
[root@localhost shell]# echo "Shell编程" | cut -nb 8
编
[root@localhost shell]# echo "Shell编程" | cut -nb 11
程 

四、printf命令

1. 命令格式

printf   '输出类型输出格式'   输出内容

2. 输出类型

%ns:输出字符串。n代表输出几个字符,n省略则代表全部字符

%ni:输出整数。n是指输出几个数字,n省略代表所有数字

%m.nf:输出浮点数。m和n是数字,指代输出的整数位数和小数位数。如%8.2f则代表共输出8位数,其中2位是小树,6位是整数。

3. 输出格式

\a:输出警告声音

\b:输出退格键(Backspace)

\f:清除屏幕

\n:换行

\r:回车(Enter)

\t:水平输出退格键

\v:垂直输出退格键

4. 示例

[root@localhost ~]# printf '%i %s %i %s %i\n' 1 "+" 2 "=" 3
1 + 2 = 3
[root@localhost ~]# printf '%i-%i-%i %i:%i:%i\n' 2015 12 3 21 56 30
2015-12-3 21:56:30 

五、awk命令

1. 命令格式

awk '条件1{动作1}条件2{动作2}...' 文件名

条件:一般使用关系表达式作为条件,如x > 10

动作:格式化输出、流程控制语句

2. 示例1:提取制表符分割的文件的某一行

[root@localhost shell]# cat student.txt
ID   Name  Gender Mark
1    ming  F    85
2    zhang  F    70
3    wang  M    75
4    li   M    90
[root@localhost shell]# awk '{print $1 "\t" $4}' student.txt
ID   Mark
1    85
2    70
3    75
4    90 

3. 示例2:获取磁盘利用率

[root@localhost shell]# df -h
Filesystem      Size Used Avail Use% Mounted on
/dev/sda2       18G 2.4G  14G 15% /
/dev/sda1       289M  16M 258M  6% /boot
tmpfs         411M   0 411M  0% /dev/shm
[root@localhost shell]# df -h | grep "sda1" | awk '{print $5}'
6% 

六、sed命令

sed是一种几乎包括在所有UNIX平台(包括Linux)的轻量级流编辑器。sed主要是用来将数据进行选取、替换、删除、新增的命令。

1. 命令格式

sed [选项] '[动作]' 文件名

2. 选项

-n:一般sed命令会把所有数据都输出到屏幕,如果加入此选择,则只会把经过sed命令处理的行输出到屏幕。

-e:允许对输入数据应用多条sed命令编辑。

-i:用sed的修改结果直接修改读取数据的文件,而不是由屏幕输出。

3. 动作

a:追加,在当前行后添加一行或多行

c:行替换,用c后面的字符串替换原数据行

i:插入,在当前行前插入一行或多行。

d:删除,删除指定的行

p:打印,输出指定的行

s:字符串替换,用一个字符串替换另一个字符串。格式为“行范围/s/旧字符串/新字符串/g”(和vim中的替换格式类似)

4. 示例

[root@localhost shell]# cat student.txt
ID   Name  Gender Mark
1    ming  F    85
2    zhang  F    70
3    wang  M    75
4    li   M    90#测试-n参数
[root@localhost shell]# sed -n '2p' student.txt
1    ming  F    85#测试单行删除
[root@localhost shell]# sed '2d' student.txt
ID   Name  Gender Mark
2    zhang  F    70
3    wang  M    75
4    li   M    90#测试多行删除
[root@localhost shell]# sed '2,4d' student.txt
ID   Name  Gender Mark
4    li   M    90#测试追加
[root@localhost shell]# sed '2a test append' student.txt
ID   Name  Gender Mark
1    ming  F    85
test append
2    zhang  F    70
3    wang  M    75
4    li   M    90#测试插入
[root@localhost shell]# sed '2i test insert' student.txt
ID   Name  Gender Mark
test insert
1    ming  F    85
2    zhang  F    70
3    wang  M    75
4    li   M    90#测试行替换
[root@localhost shell]# sed '2c test replace' student.txt
ID   Name  Gender Mark
test replace
2    zhang  F    70
3    wang  M    75
4    li   M    90#测试内容替换
[root@localhost shell]# sed '2s/ming/replace/g' student.txt
ID   Name  Gender Mark
1    replace F    85
2    zhang  F    70
3    wang  M    75
4    li   M    90

下面看看简单的正则表达式的匹配范例,通过这些范例,相信可以比较熟练的掌握基本的正则表达式的使用:

HelloWorld   匹配任意一行任何位置上的10个字母:HelloWorld
^HelloWorld  匹配出现在行首的10个字母:HelloWorld
HelloWorld$  匹配出现在行尾的10个字母:HelloWorld
^HelloWorld$  匹配只包括这10个字母:HelloWorld的一行
[Hh]elloWorld  匹配HelloWorld或者helloworld
Hello.World   匹配含有Hello这5个字母,再加上任何一个字符,再加上world
Hello*World  匹配含有Hello这5个字母,再加上任意个字母,再加上world

在上面的例子中利用“.”或者“*”,可以匹配0个或者多个字符,但是如果要匹配的字符是一个范围,这时候就要用到“{}”,因为shell中的 "{"和"}"有特殊含义,所以需要使用转移字符“\”,例如:
[kouyang@kouyang  kouyang] #  grep -n 'o\{2\}'  hello.txt
在hello.txt文件中找出出现两个连续的"o"的那一行

[kouyang@kouyang kouyang]# grep  -n 'go\{2, 5\}g' hello.txt
在hello.txt文件中找到go后面出现2~5个"o"后面再紧接着一个"g"的单词的那一行

(0)

相关推荐

  • linux shell 路径截取正则表达式

    最近写脚本,需要对脚本中函数传递的路径参数进行截取,发现了以下比较好用的方法,记录下: file=/dir1/dir2/dir3/my.file.txt 我们可以用${ }分别替换获得不同的值: ${file#*/}:拿掉第一条/及其左边的字串:dir1/dir2/dir3/my.file.txt ${file##*/}:拿掉最后一条/及其左边的字串:my.file.txt ${file#*.}:拿掉第一个.及其左边的字串:file.txt ${file##*.}:拿掉最后一个.及其左边的字串:

  • Shell正则表达式验证IP地址

    本机多个IP 复制代码 代码如下: ifconfig | awk '/inet/{print $2}' | awk -F: '{print $2}' 首先,先用这个来着 复制代码 代码如下: CheckIPAddress()        {         echo $1 > /tmp/tmpserverip         echo $1 |grep "^[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}$" >

  • Shell脚本中通过正则表达式匹配IP地址

    在运维场景下,我们经常需要在服务器上用正则表达式来匹配IP地址. shell和其它编程语言一样,也可以使用正则分组捕获,不过不能使用 $1或\1这样的形式来捕获分组,可以通过数组${BASH_REMATCH}来获得,如${BASH_REMATCH[1]},${BASH_REMATCH[N]} 下面以ip="121.0.2.2"为例,shell脚本代码如下(当然,你要做成更通用交互式的脚本,可以通过expect来实现): 复制代码 代码如下: #!/bin/bash ip="1

  • shell 正则表达式详细整理

    正则表达式的分类 1.基本的正则表达式(Basic Regular Expression 又叫Basic RegEx 简称BREs) 2.扩展的正则表达式(Extended Regular Expression 又叫Extended RegEx 简称EREs) 3.Perl的正则表达式(Perl Regular Expression 又叫Perl RegEx 简称PREs) 具体的可以参考这篇文章:http://www.jb51.net/tools/shell_regex.html shell常

  • Linux Shell脚本的编程之正则表达式

    一 正则表达式与通配符 1 正则表达式是用在文件中匹配符合条件的字符串,正则是包含匹配,grep,awk,sed等命令可以支持正则表达式 2 通配符是用来匹配符合条件的文件名,通配符是完全匹配,ls,find,cp这些命令不支持正则表达式,所以只能用Shell自己的通配符来进行匹配了. 二 基础正则表达式 这里引用兄弟连的测试文本 1 * 前一个字符匹配0次或任意多次 grep "a*" test_rule.txt 匹配所有内容,包括空白行(由于*可以匹配0次) grep "

  • Shell正则表达式之grep、sed、awk实操笔记

    最近一直在研究shell脚本这块,刚好闲下来整了下自己手头上比较好的资料中的一些范例,以下是我整理的鸟哥私房菜里面正则表达式里面比较基础的一些语法详解,适合新手查阅. 首先先复制一段范例: 复制代码 代码如下: # vi regular_express.txt ------------------------------- "Open Source" is a good mechanism to develop programs. apple is my favorite food.

  • 详解Linux--shell脚本之正则表达式

    一.正则表达式的概念及特点: 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑.规定一些特殊语法表示字符类.数量限定符和位置关系,然后用这些特殊语法和普通字符一起表示一个模式,这就是正则表达式(Regular Expression). 给定一个正则表达式和另一个字符串,我们可以达到如下的目的: 1. 给定的字符串是否符合正则表达式的过滤逻辑(称作&q

  • Shell if中的正则表达式使用详解

    由于工作需要对用户提交的数据进行验证,这是一个简单的日期正则验证实例,有需要了解的同学可参考. shell中的if语句需要做一个正则判断,查了一下语法记录之. DATEPATTERN="^[0-9]{4}-[0-9]{1,2}-[0-9]{1,2}$" if [[ "$STARTDATE" =~ $DATEPATTERN ]] && [[ $ENDDATE =~ $DATEPATTERN ]]; then : else echo "date

  • Shell正则表达式学习笔记

    正规表示法(或称为常规表示法)是透过一些特殊字符的排列,用以搜寻/取代/删除一列或多列文字字符串, 简单的说,正规表示法就是用在字符串的处理上面的一项『表示式』.正规表示法并不是一个工具程序, 而是一个字符串处理的标准依据,如果您想要以正规表示法的方式处理字符串,就得要使用支持正规表示法的工具程序才行, 这类的工具程序很多,例如 vi, sed, awk 等等. 一.正则表达式是什么? 正则表达式是用于描述字符排列和匹配模式的一种语法规则.它主要用于字符串的模式分割.匹配.查找及替换操作. 二.

  • 正则表达式学习笔记

    正则表达式学习笔记 正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含  有某种子串.将匹配的子串做替换或者从某个串中取出符合某个条件的子串等. 列目录时, dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*  的含义是不同的. 为便于理解和记忆,先从一些概念入手,所有特殊字符或字符组合有一个总表在后面,最后一  些例子供理解相应的概念. 正则表达式 是由普通字符(例如字符 a 到 z)以及特殊字符(

  • js正则表达式学习笔记

    正则表达式:对字符串中的信息实现查找.替换和提取操作.(不支持注释和空白,必须写在一行内) 正则表达式的创建:包含在一对斜杠之间的字符(直接量语法) 例如: var pattern = /s$/; // 创建一个正则来匹配所有以字母s结尾的字符串,并赋值给pattern 一 .字符类 将直接量字符单独放进方括号内就组成了字符类. 一个字符类可以匹配它所包含的任意字符. 正则表达式的字符类: [...]      方括号内的任意字符 [^...]    不在方括号内的任意字符 .         

  • php正则表达式学习笔记

    php正则表达式学习笔记分享: 1.创建正则表达式 $regex = '/\d/i'; 与JavaScript中的第一个方式有点像,只是这里的话是个字符串.  2.正则表达式中的特殊字符 特殊字符有:   . \ + * ? [ ^ ] $ ( ) { } = ! < > | : - 3.正则表达式中的函数 有8个方法,preg_match与preg_match_all,preg_replace与preg_replace_callback,preg_grep.preg_split.preg_l

  • Java中@Pattern注解常用的校验正则表达式学习笔记

    目录 1. 前端传参要求 2.其他常用正则表达式 2.1 数字校验 2.2 字符串校验 2.3 月份时间校验 2.4 Email校验 2.5 汉字校验 2.5 联系电话校验 2.5 密码校验 总结 1. 前端传参要求 项目开发中经常会遇到对用户输入内容的限制,本篇对常用限制做一总结.如下图所示,标识字段有严格命名限制,用户输入校验这部分工作前端可以做,当然后端也可以通过在实体类中添加注解的方式实现参数校验.其底层原理还是拦截器拦截请求,对带有相关注解的属性字段进行处理(非空.大小.长度.内容等判

  • java正则表达式学习笔记之命名捕获

    很多正则引擎都支持命名分组,java是在java7中才引入这个特性,语法与.Net类似(.Net允许同一表达式出现名字相同的分组,java不允许). 命名分组很好理解,就是给分组进行命名.下面简单演示一下java中如何使用以及注意事项. 1.正则中定义名为NAME的分组 (?<NAME>X) 这里X为我们要匹配的内容,注意,在这个命名不能重复,名字也不能以数字开头! 2.反向引用NAME组所匹配到的内容 \k<NAME> 注意,反向引用是针对组所匹配到的内容,而非组的表达式. 3.

  • 又一篇正则表达式学习笔记

    1. \b:表示单词的开头或者结尾,可能是空格.标点符号或者换行,但是\b不匹配其中的任何一个,这是指代这些元素中的任一个位置. 示例:\bhi\b:查找文本中所有的"hi"单词,但是不包括him.history等字样 1.1 ^:匹配字符串的开始,特指一个段落的起始. 1.2 $:匹配字符串的结束.特指一个段落的结尾,这两个都是\b的子集. 重复: 2. *:表示*前面的内容重复出现任意多次,".*"连在一起就表示任意数量的不包含换行符的字符. 示例:\bhi\b

  • 比较实用的正则表达式学习笔记

    //匹配文本,这个偶尔比较好用,但是要小心字符中包含\E $str = '[a-z]'; $str = preg_replace('/\G[a-z]\E/', '', $str); echo $str; //打印空,全被替换掉了,相关大概就是preg_quote功能 //给匹配结果命名,这样在匹配结果中就可以用这个名称来获取值 $str = 'abc123abc'; preg_match('/(?P<num>\d+)/', $str, $arr); echo $arr['num']; //相当

  • js 正则表达式学习笔记之匹配字符串

    今天看了第5章几个例子,有点收获,记录下来当作回顾也当作分享. 关于匹配字符串问题,有很多种类型,今天讨论 js 代码里的字符串匹配.(因为我想学完之后写个语法高亮练手,所以用js代码当作例子) 复制代码 代码如下: var str1 = "我是字符串1哦,快把我取走", str2 = "我是字符串2哦,快把我取走"; 比如这样一个字符串,匹配起来很简单 /"[^"]*"/g 即可.   PS: 白色截图是 chrome 34 控制台中

  • php 正则表达式学习笔记

    复制代码 代码如下: //匹配文本,这个偶尔比较好用,但是要小心字符中包含\E  $str = '[a-z]';  $str = preg_replace('/\G[a-z]\E/', '', $str);  echo $str; //打印空,全被替换掉了,相关大概就是preg_quote功能  复制内容到剪贴板代码:  //给匹配结果命名,这样在匹配结果中就可以用这个名称来获取值  $str = 'abc123abc';  preg_match('/(?P<num>\d+)/', $str,

随机推荐