shell脚本之正则表达式、grep、sed、awk

2025-02-24 21:24:18

--正则--

基础正则

^word     ##搜索以word开头的 vi/vim中 ^ 一行的开头
word$     ##搜索以word结尾的 vi/vim中 $ 一行的结尾
^$        ##表示空行
.         ##代表且只能代表任意一个字符
\         ##例：\. 只代表点本身，转义符号，让有特殊身份意义的字符，脱掉马甲，还原
\n        ##换行符
\r        ##匹配回车
\w         ##匹配任意一个字符和数字
*         ##重复0次或多次前面的一个字符
.*        ##匹配所有字符。例：^.* 以任意多个字符开头，.*$以任意多个字符结尾
[abc]     ##匹配字符集内的任意一个字符
[^abc]    ##匹配不包含 ^ 后的任意字符的内容。中括号里的 ^ 为取反
[1-9]     ##表示匹配括号内的范围内的任意字符
a\{n,m\} ##重复n到m次前一个重复的字符。若用egrep、sed -r可以去掉斜线
\{n,\}    ##重复至少n 次前一个重复的字符。若用egrep、sed -r可以去掉斜线
\{n\}     ##重复n 次前一个重复的字符。若用egrep、sed -r可以去掉斜线
\{,m}\    ##重复少于m次

注：egrep，grep –E或sed –r 过滤一般特殊字符可以不转义

扩展正则（egrep或grep -E）

+          ##重复一次或一次以上前面的一个字符
?          ##重复0次或一次前面的一个字符
|          ##或者的意思，用或的方式查找多个符合的字符串
()         ##找出括号内的字符串

^linux     ##以linux开始
linux$     ##以linux结束
linuxfan.   ##匹配linuxfans等
coo[kl]    ##匹配cool或cook
9[^5689]    ##匹配91,92等，但不匹配95,96,98,99
[0-9]     ##匹配任意一个所有的数字
[a-z]|[A-Z]  ##匹配任意一个所有大小写字母,|属于扩展正则grep -E支持
colou?r    ##匹配color或colour，但是不能匹配colouur
rollno-9+   ##匹配rollno-9、rollno-99，rollno-999，但不匹配rollno-
co*l      ##匹配cl，col，cool，coool等
ma(tri)x    ##匹配matrix
[0-9]{3}    ##匹配任意一个三位数，等于[0-9][0-9][0-9]
[0-9]{2,}   ##匹配任意一个两位数或更多位的数字
[0-9]{2,5}   ##匹配从两位数到五位数之间的任意一个数字
Oct (1st|2nd) ##匹配Oct 1st或Oct 2nd
a\.b      ##匹配a.b，但不能匹配ajb
[a-z0-9_]+\@[a-z0-9_]+\.[a-z]{2,4}       ##匹配一个邮箱地址
[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3} ##匹配IP地址

--grep--

语法：grep [选项] [条件表达式] 目标文件

cat /proc/meminfo |grep -e Mem -e Cache -e Swap     ##查看系统内存、缓存、交换分区-e的作用是匹配多个表达式
grep -R -o -n -E  '[a-z0-9_]+\@[a-z0-9_]+\.[a-z]{2,4}' /etc/     ##查找/etc目录下的所有文件中的邮件地址；-R递归，-n表示匹配的行号，-o只输出匹配内容，-E支持扩展正则表达式，
grep -R -c 'HOSTNAME' /etc/ |grep -v "0$"     ##查找/etc/目录下文件中包含“HOSTNAME”的次数，-c统计匹配次数，-v取反
grep -R -l 'HOSTNAME' /etc/           ##查找包含“HOSTNAME”的文件名，-l显示匹配的文件名，-L显示不匹配的文件名
dmesg | grep -n --color=auto 'eth'       ##查找内核日志中eth的行，显示颜色及行号
dmesg | grep -n -A3 -B2 --color=auto 'eth'     ##用 dmesg 列出核心信息，再以 grep 找出内含 eth 那行,在关键字所在行的前两行与后三行也一起找出出来显示
cat /etc/passwd |grep -c bash$         ##统计系统中能登录的用户的个数
touch /tmp/{123,123123,456,1234567}.txt   ##创建测试文件，以下三条命令是一样的效果，匹配文件名123，可以包含1个到多个
ls |grep -E '(123)+'
ls |grep '\(123\)\+'
ls |egrep '(123)+'
ps -ef |grep -c httpd             ##统计httpd进程数量
grep -C 4 'games' --color /etc/passwd       ##显示games匹配的“-C”前后4行
grep ^adm /etc/group             ##查看adm组的信息
ip a |grep -E '^[0-9]' |awk -F : '{print $2}'     ##获取网卡名称
ifconfig eth0 |grep -E -o 'inet addr:[^ ]*' |grep -o '[0-9.]*'   ##截取ip地址，[^ ]*表示以非空字符作为结束符，[0-9.]*表示数字和点的组合
ip a |grep inet |grep eth0 |grep -o "inet[^/]*" |grep -o "[0-9.]*"  ##截取ip地址
ifconfig eth0 |grep -i hwaddr |awk '{print $5}'   ##截取MAC地址
ip a |grep -A 3 "eth0" |grep link/ether |grep -o "ether[^r]*" |grep -o -E "[0-9a-f:]+"|grep -E "[0-9a-f:]{2}$"      ##截取MAC地址

grep "^m" oldboy.log       ##过滤输出以m开头的行
grep "m$" oldboy.log
grep -vn "^$" oldboy.log       ##过滤空行
grep -o "0*" oldboy.log
grep -o "oldb.y" oldboy.log
grep "\.$" oldboy.log       ##以.结尾的行
grep "0\{3\}" oldboy.log       ##重复三次

--sed--

语法：sed [options] 'command' file(s)

选项：

-n 抑制自动打印pattern space，sed默认输出全部，-n用于取消默认输出
-i 编辑文件
-r 支持扩展正则表达式

1.改：

语法：sed '/正则匹配条件/s/old/new/g' 文件
sed 's/dhcp/static/g' /etc/sysconfig/network-scripts/ifcfg-eth1 ##只是显示，不修改
sed -i 's/dhcp/static/g' /etc/sysconfig/network-scripts/ifcfg-eth1 ##只修改，不显示
sed -i 's/dhcp/static/g' ip ##将所有的dhcp替换为static
sed -i '/^IP1/s/static/dhcp/g' ip ##将IP1开头的行替换
sed -i '2s/static/dhcp/g' ip ##指定特定行号2行替换
cat -n /etc/selinux/config ##查看并显示行号
sed -i '7s/disabled/enforcing/g' /etc/selinux/config ##开启selinux

2.删：

语法：sed '/表达式/d' 文件
vim ip ##添加空行
sed '/^$/d' ip ##删除空行并显示在屏幕上
sed -i '/IP1/d' ip ##删除包含IP1的行
sed -i '/^IP2/d' ip ##删除以IP2开头的行
sed -i '2d' ip ##删除第二行

3.增：

语法：sed ' /表达式/a "需要添加的文字"' 文件
sed 'a IP3=static' ip ##每一行后都加上IP3=static
sed '3a IP3=static' ip ##只在第3行后加上IP3=static，并显示不修改
sed '3i IP3=static' ip ##只在第3行前加上IP3=static，显示不修改
sed -i '3a IP3=static' ip ##修改，不显示
sed -i '/^IP3/a "test add"' ip ##在以IP3开头的行后添加

4.查：

语法：sed -n '/表达式/p' 文件
sed -n '2p' /etc/hosts ##查看第二行
sed -n '/www/p' /var/named/chroot/var/named/linuxfan.cn.zone ##查看包含www的解析记录
sed -n '/.100$/p' /var/named/chroot/var/named/linuxfan.cn.zone ##查看以.100结尾的行
sed -n '2~2p' ip ##从第二行，每隔两行显示

ifconfig eth0|sed -n '2p'|sed 's#.*dr:##g'|sed 's# Bc.*##g'    ##注：当sed命令处理的内容为多行内容，则以/作为表达式的分隔，若sed命令处理的内容为单行内容，作为截取的作用，以#号作为分隔符；
10.0.0.9
ifconfig eth0|sed -n '2p'|sed -r 's#(.*dr:)(.*)(Bc.*$)#\2#g'    ##-r支持扩展正则，\2将2转义，打印出第二个范围(.*)
10.0.0.9
ifconfig eth0|sed -n '2p'|sed -r 's#.*dr:(.*) Bc.*$#\1#g'
10.0.0.9
ifconfig eth0|sed -nr '2s#^.*dr:(.*) Bc.*$#\1#gp'
10.0.0.9
ifconfig eth0|sed -nr '1s#^.*dr (.*)#\1#gp'
00:0C:29:33:C8:75
ifconfig eth0|sed -n '1p'|sed -r 's#(^.*dr )(.*)#\2#g'
00:0C:29:33:C8:75
ifconfig eth0|sed -n '1p'|sed 's#^.*dr ##g'
00:0C:29:33:C8:75
ifconfig eth0|sed -nr '1s#^.*t (.*) 00.*$#\1#gp'
HWaddr
stat /etc/hosts|sed -n '4p'
Access: (0644/-rw-r--r--) Uid: (  0/  root)  Gid: (  0/  root)
stat /etc/hosts|sed -n '4p'|sed 's#^.*ss: (##g'|sed 's#/-.*$##g'
0644
stat /etc/hosts|sed -n '4p'|sed -r 's#^.*s: \((.*)/-.*$#\1#g'
0644
stat /etc/hosts|sed -nr '4s#^.*s: \((.*)/-.*$#\1#gp'
0644
stat /etc/hosts|sed -nr '4s#(^.*s: \()(.*)(/-.*$)#\2#gp'
0644

--awk--

语法：
awk [选项] '模式{动作（action）}' 文件1 文件2 ...
选项： -F 指定输入分隔符，可以是字符串或正则表达式
常用动作： print、printf

chkconfig --list |grep 3:启用 |awk '{print $1}'
tail -1 /etc/passwd |awk -F ':' 'BEGIN{OFS="---"}{print $1,$6,$7}'  ##OFS指定输出分隔符
ifconfig eth1 |awk -F '[ :]+' 'NR==2 {print $4}'
ifconfig eth1 |awk -F '[ :]+' 'NR==2 {print "eth1_ip="$4}' ##可以加入显示内容
awk 'BEGIN {print "line one \nline two\nline three"}'

匹配范围（ranges）：指定的匹配范围，格式为part1,part2

awk -F : '$3==3,$3==10{print $1,$3,$7}' /etc/passwd
awk -F : '$1=="root",$1=="adm"{print $1,$3,$7}' /etc/passwd
awk -F : '/^r/,/^a/{print $1,$3,$7}' /etc/passwd

awk区块原理：

区域构成：

BEGIN { 动作 } ##开始处理第一行文本之前的操作
{ 动作 } ##针对每一行文本的处理操作
END { 动作 } ##处理完最后一行文本之后的操作
执行流程：
首先执行 BEGIN { } 区块中的初始化操作；
然后从指定的数据文件中循环读取一个数据行（自动更新 NF、 NR、 $0、 $1…… 等内建变量的值），并执行'模式或条件{ 动作 }'；
最后执行 END { } 区块中的后续处理操作。

案例：

awk -F : 'BEGIN{printf "%-10s%-10s%-20s\n","UserName","ID","Shell"}{printf "%-10s%-10s%-20s\n",$1,$3,$7}' /etc/passwd ##在awk处理之前打印头部BEGIN{}

ifconfig eth0 |awk -F':' 'NR==2{print $2,$4}'|awk 'BEGIN{OFS=" / "}{print "IP="$1,"MASK="$3}'

awk的变量：
awk变量：
FS：列分隔符，默认位空白
RS：行分隔符，默认位换行符
OFS：输出列分隔符
ORS ：输出行分隔符
awk内置变量：
NR：处理中行数
FNR：单个文件的行数
NF：列的个数

案例：

ifconfig eth1 |awk '{print NR}'
ifconfig eth1 |awk '{print NF}'

自定义变量案例：

awk 'BEGIN{test="www.linuxfan.cn";print test}'
awk -v test="linuxfan.cn" 'BEGIN{print test}'

printf的使用：

格式：printf "格式",列表1,列表2 ...

特征：

a.必须指定format(格式)，用于指定后面item（列表）的输出格式

b.printf语句不会自动打印换行符：\n

c.format格式以%加一个字符，如下：

%c:显示字符的ASCII码
%d，%i:十进制整数
%f:显示浮点数（小数）
%s:显示字符串
%u:无符号整数
%%:显示%

d.修饰符：N:显示宽度，-：左对齐，+：显示数值符号，如%-c(左对齐)

案例：

chkconfig --list |grep 3:启用 |awk '{printf "%-10s",$1}' ##在统一行显示
awk -F : '{printf "%-15s %-10d %-10s\n",$1,$3,$7}' /etc/passwd

awk的操作符：

算数操作符： x^y、x/y、x+y、x-y、x%y
比较操作符：>、<、>=、<=、==、!=
逻辑操作符：&&、||、！

awk常见的模式类型

正则表达式（regexp）：awk -F : '/^u/{print $1}' /etc/passwd

表达式（expression）：值位非0或位非空是满足条件，如$1 ~ /foo/或 $1 == "root"

案例：

awk -F : '$3>=500{print $1,$3,$7}' /etc/passwd ##打印普通用户
awk -F : '$3+1<=100&&$3+1>=10{print $1,$3,$7}' /etc/passwd ##UID在10-100之间的用户
awk -F : '$2=="!!"{print $1,$2}' /etc/shadow ##检查未初始化密码的用户
passwd -d u01
awk -F : '$2==""{print $1}' /etc/shadow ##打印密码为空的用户
awk -F : '$7~"bash$"{print $1,$3,$7}' /etc/passwd ##匹配$7为bash结束行
awk -F : '$7!~"bash$"{print $1,$3,$7}' /etc/passwd

总结

以上所述是小编给大家介绍的shell脚本之正则表达式、grep、sed、awk ，希望对大家有所帮助，如果大家有任何疑问欢迎给我留言，小编会及时回复大家的！

Shell正则表达式学习笔记

正规表示法(或称为常规表示法)是透过一些特殊字符的排列,用以搜寻/取代/删除一列或多列文字字符串, 简单的说,正规表示法就是用在字符串的处理上面的一项『表示式』.正规表示法并不是一个工具程序, 而是一个字符串处理的标准依据,如果您想要以正规表示法的方式处理字符串,就得要使用支持正规表示法的工具程序才行, 这类的工具程序很多,例如 vi, sed, awk 等等. 一.正则表达式是什么? 正则表达式是用于描述字符排列和匹配模式的一种语法规则.它主要用于字符串的模式分割.匹配.查找及替换操作. 二.
shell 正则表达式详细整理

正则表达式的分类 1.基本的正则表达式(Basic Regular Expression 又叫Basic RegEx 简称BREs) 2.扩展的正则表达式(Extended Regular Expression 又叫Extended RegEx 简称EREs) 3.Perl的正则表达式(Perl Regular Expression 又叫Perl RegEx 简称PREs) 具体的可以参考这篇文章:http://www.jb51.net/tools/shell_regex.html shell常
PowerShell中使用正则表达式匹配字符串实例

本文介绍PowerShell中使用match操作符,配合正则表达式从字符串提取指定的内容. 使用正则表达式,除了可以确定字符串是否匹配某一个正则表达式规则之外,另一个很重要的应用就是从字符串中提取出指定的内容.什么意思呢,举个例子,一个字符串中有出现连续的三个数字,我们想很方便的把这三个数字提取出来,那么就可以用正则表达式. 复制代码代码如下: PS C:\Users\Hong> $str="abc123abc" PS C:\Users\Hong> $pattern=&q
Shell if中的正则表达式使用详解

由于工作需要对用户提交的数据进行验证,这是一个简单的日期正则验证实例,有需要了解的同学可参考. shell中的if语句需要做一个正则判断,查了一下语法记录之. DATEPATTERN="^[0-9]{4}-[0-9]{1,2}-[0-9]{1,2}$" if [[ "$STARTDATE" =~ $DATEPATTERN ]] && [[ $ENDDATE =~ $DATEPATTERN ]]; then : else echo "date
PowerShell常用正则表达式和语法参考

本文介绍PowerShell中的正则表达式,各种不同的字符代表不同的含义,包括占位符PlaceHolder.量词Quantifier和边界字符. 下面列举PowerShell的正则表达式中可能出现的字符,以及它们表示的含义. 字符串的匹配符(占位符PlaceHolder) . 这是一个点儿,表示换行符之外的任意一个字符(Any character except newline (Equivalent: [^\n])) [^abc] 指定的字符(abc)之外的任意一个字符,可以把abc换成其它字符
Shell正则表达式之grep、sed、awk实操笔记

最近一直在研究shell脚本这块,刚好闲下来整了下自己手头上比较好的资料中的一些范例,以下是我整理的鸟哥私房菜里面正则表达式里面比较基础的一些语法详解,适合新手查阅. 首先先复制一段范例: 复制代码代码如下: # vi regular_express.txt ------------------------------- "Open Source" is a good mechanism to develop programs. apple is my favorite food.
PowerShell中正则表达式使用例子

本文介绍PowerShell中正则表达式的使用,PowerShell的正则表达式与微软其它语言的正则表达式是一样的,使用非常方便. 正则表达式本身是怎么回事,本文不做讨论,反正PowerShell还是用的微软的那一套正则表达式规则,学VB.ASP.C#等语言时都应该学过.我们只谈谈在PowerShell中,怎么去用正则表达式. 先给出一个任务,使用PowerShell在d:\1.txt文件中,找到夹在数字串中的字母串.1.txt的内容如下: 复制代码代码如下: 1 12 12aaa3 123b
shell脚本之正则表达式、grep、sed、awk

--正则-- 基础正则 ^word ##搜索以word开头的 vi/vim中 ^ 一行的开头 word$ ##搜索以word结尾的 vi/vim中 $ 一行的结尾 ^$ ##表示空行 . ##代表且只能代表任意一个字符 \ ##例:\. 只代表点本身,转义符号,让有特殊身份意义的字符,脱掉马甲,还原 \n ##换行符 \r ##匹配回车 \w ##匹配任意一个字符和数字 *
学习shell脚本之前的基础知识[图文]

日常的linux系统管理工作中必不可少的就是shell脚本,如果不会写shell脚本,那么你就不算一个合格的管理员.目前很多单位在招聘linux系统管理员时,shell脚本的编写是必考的项目.有的单位甚至用shell脚本的编写能力来衡量这个linux系统管理员的经验是否丰富.笔者讲这些的目的只有一个,那就是让你认真对待shell脚本,从一开始就要把基础知识掌握牢固,然后要不断的练习,只要你shell脚本写的好,相信你的linux求职路就会轻松的多.笔者在这一章中并不会多么详细的介绍shell脚本
Shell中正则表达式及sed和awk常见问题

目录 1 正则表达式中的+.?.*分别表示什么含义? 2 如何编写正则表达式匹配11位的手机号? 3 简述sed定址符的作用及表示方式. 4 如何使用sed提取文本中的偶数行? 5 如何使用sed删除文本中每行的第4个字符? 6 提取/etc/passwd文件的第6-10行,另存为pass5.txt文件. 7 简述awk工具的基本语法格式. 8 简述awk工具常用的内置变量.各自的作用. 9 awk处理文本时,读文件前.读取文件内容中.读文件后后这三个环节是如何表示的? 10 提取当前eth0网
shell脚本中的正则表达式详解

正则表达式的概念及特点: 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个"规则字符串", 这个"规则字符串"用来表达对字符串的一种过滤逻辑.规定一些特殊语法表示字符类.数量限定符和位置关系,然后用这些特殊语法和普通字符一起表示一个模式,这就是正则表达式(Regular Expression). 给定一个正则表达式和另一个字符串,我们可以达到如下的目的: 1. 给定的字符串是否符合正则表达式的过滤逻辑(称作&q
Linux Shell脚本的编程之正则表达式

一正则表达式与通配符 1 正则表达式是用在文件中匹配符合条件的字符串,正则是包含匹配,grep,awk,sed等命令可以支持正则表达式 2 通配符是用来匹配符合条件的文件名,通配符是完全匹配,ls,find,cp这些命令不支持正则表达式,所以只能用Shell自己的通配符来进行匹配了. 二基础正则表达式这里引用兄弟连的测试文本 1 * 前一个字符匹配0次或任意多次 grep "a*" test_rule.txt 匹配所有内容,包括空白行(由于*可以匹配0次) grep "
shell脚本之sed详细用法详解

目录 sed的作用 sed使用方法介绍命令行格式举例说明对文件进行增.删.改.查操作增加文件内容对文件进行搜索替换操作其他命令其他选项 sed结合正则使用补充扩展总结总结 sed的作用 sed是Stream Editor(流编辑器)的缩写,简称流编辑器:用来处理文件的 sed是一行一行读取文件内容并按照要求进行处理,把处理后的结果输出到屏幕首先sed读取文件中的一行内容,把其保存在一个临时缓存区中(也称为模式空间) 然后根据需求处理临时缓冲区中的行,完成后把该行发送到屏幕上
shell脚本--sed的用法详解

sed在处理文本时是逐行读取文件内容,读到匹配的行就根据指令做操作,不匹配就跳过. sed是Linux下一款功能强大的非交互流式文本编辑器,可以对文本文件进行增.删.改.查等操作,支持按行.按字段.按正则匹配文本内容,灵活方便,特别适合于大文件的编辑.本文主要介绍sed的一些基本用法,并通过shell脚本演示sed的使用实例. 1.sed的使用方法,调用sed 命令的语法有两种: 一.在命令行指定sed指令对文本进行处理:sed +选项 '指令' 文件二.先将sed指令保存到文件中,将该文件
Shell脚本中通过正则表达式匹配IP地址

在运维场景下,我们经常需要在服务器上用正则表达式来匹配IP地址. shell和其它编程语言一样,也可以使用正则分组捕获,不过不能使用 $1或\1这样的形式来捕获分组,可以通过数组${BASH_REMATCH}来获得,如${BASH_REMATCH[1]},${BASH_REMATCH[N]} 下面以ip="121.0.2.2"为例,shell脚本代码如下(当然,你要做成更通用交互式的脚本,可以通过expect来实现): 复制代码代码如下: #!/bin/bash ip="1
linux Shell脚本里面把一个数组传递到awk内部进行处理

前段时间和几位同事讨论过一个问题:Shell脚本里面怎样把一个数组传递到awk内部进行处理? 当时没有找到方法.前两天在QQ群里讨论awk的时候,无意间又聊起这个话题.机缘巧合之下找到一个思路,特此分享. 测试环境: [root]# head -1 /etc/redhat-release Red Hat Enterprise Linux Server release 6.5 (Santiago) [root]# awk --version | head -1 GNU Awk 3.1.7 众所周知
一个不错的shell 脚本教程入门级

建立一个脚本 Linux中有好多中不同的shell,但是通常我们使用bash (bourne again shell) 进行shell编程,因为bash是免费的并且很容易使用.所以在本文中笔者所提供的脚本都是使用bash(但是在大多数情况下,这些脚本同样可以在 bash的大姐,bourne shell中运行). 如同其他语言一样,通过我们使用任意一种文字编辑器,比如nedit.kedit.emacs.vi 等来编写我们的shell程序. 程序必须以下面的行开始(必须方在文件的第一行): #!/b

shell脚本之正则表达式、grep、sed、awk

相关推荐

随机推荐