浅谈Linux grep与正则表达式

2025-04-13 04:59:05

grep简介

　　grep 是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。通常grep有三种版本grep、egrep（等同于grep -E）和fgrep。egrep为扩展的grep，fgrep则为快速grep（固定的字符串来对文本进行搜索，不支持正则表达式的引用但是查询极为快速）。grep是Linux文本处理三剑客之一。

grep使用方式

　　使用方式：

grep [OPTIONS] PATTERN [FILE...]

grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

　　常用选项：

　　--color=auto：对匹配到的文本着色后进行高亮显示；

　　 -i：忽略字符的大小写

　　-o：仅显示匹配到的字符串

　　-v：显示不能被模式匹配到的行

　　-E：支持使用扩展的正则表达式

　　-q：静默模式，即不输出任何信息

　　-A #：显示被模式匹配的行及其后#行

　　-B #：显示被模式匹配的行及其前#行

　　-C #：显示被模式匹配的行及其前后各#行

　　注：使用grep匹配时需使用双引号引起来（单引号为强引用），防止被系统误认为参数或者特殊命令而报错。

扩展grep使用方式

　　使用方式：

egrep [OPTIONS] PATTERN [FILE...]
grep -E [OPTIONS] PATTERN [FILE...]

　　-i：忽略字符的大小写
　　-o：仅显示匹配到的字符串本身
　　-v：显示不被模式匹配到的行
　　-q：静默模式，即不输出任何信息
　　-A #：显示被模式匹配的行及其后#行
　　-B #：显示被模式匹配的行及其前#行
　　-C #：显示被模式匹配的行及其前后各#行
　　-G:支持基本正则表达式

grep正则表达式元字符

　　‘^‘：锚定行首

　　‘$'：锚定行尾

　　‘.‘：匹配任一一个字符

　　‘*'：匹配零个或多个先前字符

　　‘\?‘：匹配其前面的字符0次或者1次；

　　‘\+'：匹配其前面的字符1次或者多次；

　　‘\{m\}‘：匹配其前面的字符m次（\为转义字符）

　　‘\{m,n\}'：匹配其前面的字符至少m次，至多n次

　　‘[]‘：匹配一个指定范围内的字符 | ‘[^]'匹配指定范围外的任意单个字符

　　‘\<‘或‘\b'：锚定词首，‘\>'或‘\b'：锚定词尾（可用\<PATTERN\>：匹配完整单词）

　　‘'：将多个字符当做一个整体进行处理

　　后向引用：引用前面的分组括号中的模式所匹配到的字符

　　分组括号中的模式匹配到的内容或被正则表达式引擎自动记录于内部的变量中：

　　\1：模式从左侧起，第一个左括号及与之匹配的右括号之间模式匹配到的内容

　　\2：模式从左侧起，第二个左括号及与之匹配的右括号之间模式匹配到的内容...

　　扩展正则表达式与正则表达式略有不同：

　　'[]'：依旧匹配指定范围内的任意单个字符；但是有很多特殊匹配方式。

　　　　[:digit:] 匹配任意单个数字

　　　　[:lower:] 匹配任意单个小写字母

　　　　[:upper:] 匹配任意单个大写字母

　　　　[:alpha:] 匹配任意单个字母

　　　　[:alnum:] 匹配任意单个字母或数字

　　　　[:punct:] 匹配任意单个符号

　　　　[:space:] 匹配单个空格

　　一些地方取消了转义字符的使用：

　　‘?‘：匹配其前面的字符0次或者1次；

　　‘+'：匹配其前面的字符1次或者多次；

　　‘{m}‘：匹配其前面的字符m次（\为转义字符）

　　‘{m,n}'：匹配其前面的字符至少m次，至多n次

　　()：将一个或多个字符捆绑在一起，当做一个整体进行处理，反向引用照常使用。

　　‘|'：或（注：‘C|cat'为C与cat，‘（C|c）at才是Cat与cat'）

练习题：

　　1、列出当前系统上所有已经登录的用户的用户名，注意：同一个用户登录多次，则只显示一次

[root@localhost ~]# who | cut -d' ' -f1|uniq
root

　　2、取出最后登录到当前系统的用户的相关信息

[root@localhost ~]# id `last | head -1 | cut -d' ' -f1`
uid=0(root) gid=0(root) groups=0(root)

　　3.取出当前系统上被用户当做其默认shell最多的那个shell

[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7
/sbin/nologin

　　4.将/etc/passd中的第三个字段设置最大的后10个用户的信息全部改为大写保存至/tmp/maxuser.txt文件中

[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt
[root@localhost ~]# cat /tmp/maxusers.txt
NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGIN
SYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGIN
NGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGIN
CHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGIN
POLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGIN
SYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGIN
DINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASH
JEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASH
EGON:X:1002:1002::/HOME/EGON:/BIN/BASH
NFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN

　　5.取出当前主机的IP地址

[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10
192.168.0.133

　　6.列出/etc目录下所有已.conf结尾的文件的文件名，并将其名字转换为大写后保存至/tmp/etc.conf文件中

[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(\.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf
[root@localhost ~]# cat /tmp/etc.conf
RESOLV.CONF
CA-LEGACY.CONF
FASTESTMIRROR.CONF
LANGPACKS.CONF
SYSTEMD.CONF
VERSION-GROUPS.CONF
LVM.CONF
LVMLOCAL.CONF
ASOUND.CONF
LDAP.CONF
MLX4.CONF
RDMA.CONF
SMTPD.CONF

　　7.显示/var目录下一级子目录或文件的总数

[root@localhost ~]# ls /var | wc -l

　　8.取出/etc/group第三个字段数值最小的10个组的名字

[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1
root
bin
daemon
sys
adm
tty
disk
lp
mem
kmem

　　9.将/etc/fstab和/etc/issue文件的内容合并为同一个内容后保存至/tmp/etc.test文件中

[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test
[root@localhost ~]# cat /tmp/etc.test
#
# /etc/fstab
# Created by anaconda on Sat May 13 10:12:58 2017
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
/dev/mapper/cl-root   /            xfs   defaults    0 0
UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot          xfs   defaults    0 0
/dev/mapper/cl-swap   swap          swap  defaults    0 0
\S
Kernel \r on an \m

总结

以上所述是小编给大家介绍的Linux grep与正则表达式，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对我们网站的支持！

grep用法详解 grep与正则表达式

正则表达式只是一种表示法,只要工具支持这种表示法, 那么该工具就可以处理正则表达式的字符串.vim.grep.awk .sed 都支持正则表达式,也正是因为由于它们支持正则,才显得它们强大:在以前上班的公司里,由于公司是基于web的服务型网站(nginx),对正则的需求比较大,所以也花了点时间研究正则,特与大家分享下: 1基础正则表达式 grep 工具,以前介绍过. grep -[acinv] '搜索内容串' filename -a 以文本文件方式搜索 -c 计算找到的符合行的次数 -i 忽略
Shell正则表达式之grep、sed、awk实操笔记

最近一直在研究shell脚本这块,刚好闲下来整了下自己手头上比较好的资料中的一些范例,以下是我整理的鸟哥私房菜里面正则表达式里面比较基础的一些语法详解,适合新手查阅. 首先先复制一段范例: 复制代码代码如下: # vi regular_express.txt ------------------------------- "Open Source" is a good mechanism to develop programs. apple is my favorite food.
linux grep正则表达式与grep用法详解

需要大家牢记:正则表达式与通配符不一样,它们表示的含义并不相同正则表达式只是字符串的一种描述,只有和支持正则表达式的工具相结合才能进行字符串处理.本文以grep为例来讲解正则表达式. grep命令功能:输入文件的每一行中查找字符串. 基本用法: grep [-acinv] [--color=auto] [-A n] [-B n] '搜寻字符串' 文件名参数说明: -a:将二进制文档以文本方式处理 -c:显示匹配次数 -i:忽略大小写差异 -n:在行首显示行号 -A:After的意思,显示匹
bash 中用于grep的正则表达式

正则表达式是一类用于匹配文本的表达方式,常用于grep命令中表达检索条件.其实就是相当于你在用百度搜索时规定一些高级要求,例如你想找百度一个叫做詹姆斯的人的照片,你会发现出来一大堆骑士队的詹姆斯,这时候你就需要高级要求:搜索除了勒布朗之外的詹姆斯.而正则表达式就是用在这里的. 学习正则表达式简直就是非人的工作,因为它根本就不是按照正常人的思维工作的,所以要有心理准备. 我在刚开始学习时看了很多正则表达式的用法,后来发现,原来在不同的环境中正则表达式是不同的,这其中就体现在某些词需不需要转义符\以
浅谈Linux grep与正则表达式

grep简介 grep 是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.通常grep有三种版本grep.egrep(等同于grep -E)和fgrep.egrep为扩展的grep,fgrep则为快速grep(固定的字符串来对文本进行搜索,不支持正则表达式的引用但是查询极为快速).grep是Linux文本处理三剑客之一. grep使用方式使用方式: grep [OPTIONS] PATTERN [FILE...] grep [OPTIONS] [-e PATTERN
浅谈linux中sed命令和awk命令的使用

本文主要研究的是linux中sed命令和awk命令的使用的相关内容,具体如下. 1.sed命令:没有重定向不会真正修改源文件中的内容查询语句 ①sed -n '/sbin/p' passwd 表示查询出passwd文件中存在sbin字符的所有行并打印出来,其中两个/表示的是其中的是正则表达式,-n和/p是该命令的参数,需要联合使用 ②sed -n 'xp' passwd x是数字,表示打印出passwd文件中第x行的数据新增语句 ①sed '1a 这是第一行后面添加的内容' passwd 其
浅谈Linux C语言动态库及静态库

假设在math目录下已编辑好add.c sub.c div.c mul.c func_point.c文件,func_point.c为包含main()的源文件! 动态库的制作: 方法一: gcc -c -fPIC add.c sub.c div.c mul.c //-c表示生成.o目标文件,-f后加一些编译选项,PIC表示与位置无关 gcc -shared -o libmymath.so add.o sub.o mul.o div.o//创建共享库mymath,添加add.o,sub.o,mul.
浅谈Linux的库文件

最近在Linux下使用第三方库Protobuf时,遇到一个问题:可执行程序在运行时报错:"error while loading shared libraries: libprotobuf.so.7: cannot open shared object file: No such file or directory".于是花时间弄清楚原因,找到解决方案,跟大家共享一下. 1. 什么是库在windows平台和linux平台下都存在着大量的库. 本质上来说库是一种可执行代码的二进制形式,
浅谈Linux环境下gcc优化级别

代码优化可以说是一个非常复杂而又非常重要的问题,以笔者多年的linux c开发经验来说优化通常分为两个方面,一是人为优化,也就是基于编程经验采用更简易的数据结构函数等来降低编译器负担,二是采用系统自带的优化模式,也就是gcc - o系列,下面我将简述一下各级优化的过程以及实现. gcc - o1 首先o1上面还有一个o0,那个是不提供任何优化,项目中几乎不会使用,而o1使用就非常广泛了,o1是最基本的优化,主要对代码的分支,表达式,常量来进行优化,编译器会在较短的时间下将代码变得更加短小,这样体
浅谈Linux中的chattr与lsattr命令

PS:有时候你发现用root权限都不能修改某个文件,大部分原因是曾经用chattr命令锁定该文件了.chattr命令的作用很大,其中一些功能是由Linux内核版本来支持的,不过现在生产绝大部分跑的linux系统都是2.6以上内核了.通过chattr命令修改属性能够提高系统的安全性,但是它并不适合所有的目录.chattr命令不能保护/./dev./tmp./var目录.lsattr命令是显示chattr命令设置的文件属性. 这两个命令是用来查看和改变文件.目录属性的,与chmod这个命令相比,ch
浅谈Linux配置定时,使用crontab -e与直接编辑/etc/crontab的区别

Linux配置定时任务,大家都知道使用crontab这个系统功能,但有时候我们需要区分用户执行,下面就直接说一下2种方法的区别: 方法1: 使用命令 crontab -e 然后直接编辑定时脚本. 这样执行以后,属于用户自定义的,会被写到 /var/spool/cron 目录下,生成一个和用户名一致的文件,文件内容就是我们编辑的定时脚本. 如: [root@localhost cron.d]# cd /var/spool/cron [root@localhost cron]# ll 总用量 4 -
浅谈Linux磁盘修复e2fsck命令

周末竟然去加班,原因是客户那里有一台服务器不能提供服务,经过排查是突然断电后可能产生了磁盘坏道导致,所以使用e2fsck命令进行了磁盘修复. linux下磁盘检查修复命令e2fsck -a: 检查 partition,如发现问题会自动修复. -b: 设定 superblock 位置. -B size: 指定 size 作为区块大小. -c: 检查 partition 是否有坏轨. -C file: 将检查结果储存到 file. -d: 输出 e2fsck debug 结果. -f: e2fsck
浅谈Linux 二进制包安装MySQL的一些问题

第一步:安装相关的依赖yum install perl-Data-Dumper 第二步:初始化mysql数据库的内部信息./scripts/mysql_install_db --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data ---------------------------------------------- 二进制包是否可以成功的运行,与先前是否先解决rpm包的依赖无关. 也就是说,就算rpm包安装不上,二进制包还是可以
浅谈Linux下通过find命令进行rm文件删除的小技巧

我们经常会通过find命令进行批量操作,如:批量删除旧文件.批量修改.基于时间的文件统计.基于文件大小的文件统计等,在这些操作当中,由于rm删除操作会导致目录结构变化,如果要通过find结合rm的操作写成脚本,就会遇到一些麻烦,本文通过一个例子为大家进行介绍. 系统环境: SUSE Linux Enterprise Server 11 或 Red Hat Enterprise Linux 问题症状: 客户现场有一个自动化的脚本,有以下的find语句,每天运行以删除某个目录下7天以前的文件或目录,

浅谈Linux grep与正则表达式

相关推荐

随机推荐