教你一招实现Linux中的文本比对

2025-02-07 10:59:38

前言

我们在写代码的过程中，免不了会对代码进行一些修修改改。但经常会出现改着改着，就不知道改完后与源文件的差异是怎样的。这里，我们就需要一个文本比对工具来进行文本比对。

有经验的程序员都知道，Windows下有个很好用的文本比对工具——BeyondCompare。但它是收费软件，很多正规的公司是不允许使用破解软件的。而且，它也只能在Windows下使用，没有Linux版本。

本文所介绍的文本比对方法，无需任何软件，只需一个Linux命令。学会这个命令，妈妈就再也不怕你不会文本比对了。

这个Linux命令就是diff命令。

diff是Unix系统的一个很重要的工具程序。它用来比较两个文本文件的差异，是代码版本管理的基石之一。

首先我们来看它的基本命令格式。

diff [OPTION]... FILES

很简单吧。不过它的选项相当多，多到你怀疑人生。我们暂且不管那么多，先学一些最常用的，毕竟时间要花在刀刃上。

-b —— 忽略一行中的空字符的区别（例如“Hello World!” 与 “Hello World!!”认为是一样的）

-B —— 忽略空白行

-i —— 忽略大小写的不同

-r —— 如果diff后面接的目录时，会递归比较子目录中的文件不同

我们再来具体看看如何进行文本比较。

diff命令的输出格式有三种：

（1）正常格式（normal diff）

（2）上下文格式（context diff）

（3）合并格式（unified diff）

我们通过实例详细介绍这三种输出格式。比如我们现在有个文件a.c，它的内容如下：

现在我们复制一份，命名为b.c，并将第3行小写的"hello"改为大写“HELLO"，如下：

（1）正常格式

正常格式下我们无需加任何选项，直接如下比对就好：

执行完的结果如下：

我们一行一行来解释上图的含义。

行一行：3c3

第一个3表示文件a.c中第3行有变化，后面的3表示a.c通过变化成为b.c中的第3行。中间的c就是具体的变化了。c表示改变（change），其它类型还有d删除（delete），a增加（addition）。

第二行：< hello world!

表示a.c文件中去除第3行的内容，其中小于号表示去除。

第三行：------

分隔线

第四行：> HELLO world!

表示b.c文件中增加第3行的内容，其中大于号表示增加。

（2）上下文格式

由于在正常格式下，提示信息比较少，我们无法快速定位所修改的地方，经常需要打开文件才知道修改细节。所以，为了给出更多的信息，引入了上下文格式。它的使用命令如下：

diff -c a.c b.c

其中，c表示context，即上下文的意思。

上图的输出结果的具体含义如下：

第1行和第2行表示修改前及修改后的文件及更新时间。下面的*** 1,4 ****表示a.c文件显示的从第1行开始到第4行为止的内容。hello world前的叹号（!）表示该行有改动，如果该行被删除，则为减号（-），如果该行被增加，则为加号（+）。后面几行的含义类似。

（3）合并格式

这种格式是正常格式与上下文格式的综合版，同时这种格式也是git diff所采用的格式。使用这种格式的命令是：

diff -u a.c b.c

上图的输出结果详细含义如下：

第1行和第2行表示修改前及修改后的文件及更新时间。后面的-hello world!表示原文件a.c里的内容，+HELLO world!表示b.c里的内容。

除了以上三种格式外，还有另外一直更直观的方式——并排格式。这种显示格式的命令格式如下：

这种格式就是以并列的格式进行显示，也很直观明了。第3行里，有个“|”符号，表示这行有更改。另外，如果前面是“<”，表示后面文件比前面文件少了1行内容；如果是">"，表示后面文件比前面文件多了1行内容。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对我们的支持。

一天一个shell命令 linux文本内容操作系列-grep命令详解

从这篇开始,是文本内容操作,区别于文本操作. Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户. shell,perl,python,一直都是文本操作的专家语言,而我们今后学习的的将是shell的噱头--文本操作.下面提到最常见的一个: grep 这算是文本内容的一个重量级选手,能根据某些规格在上千行的文本文件中查找
一天一个shell命令 linux文本操作系列-head,tail命令详解

head命令中文介绍: 用法:head [选项]... [文件]... 将每个指定文件的头10 行显示到标准输出. 如果指定了多于一个文件,在每一段输出前会给出文件名作为文件头. 如果不指定文件,或者文件为"-",则从标准输入读取数据. 长选项必须使用的参数对于短选项时也是必需使用的. -c, --bytes=[-]K 显示每个文件的前K 字节内容: 如果附加"-"参数,则除了每个文件的最后K字节数据外显示剩余全部内容 -n, --lines=[-]K 显示每个文
一天一个shell命令 linux文本操作系列-touch命令用法

之前我们学过dd创建测试文件,如果不需要考虑文件大小,创建一个空白文件的话,不妨试试 touch: 将每个文件的访问时间和修改时间改为当前时间. 不存在的文件将会被创建为空文件,除非使用-c 或-h 选项. 入门例子: 1. 如果想生成100个空文件 for name in {1..100}.txt do touch $name done 2. 改进一下 touch test{1..20}.c 查看 --help 用法:touch [选项]... 文件... 将每个文件的访问时间和修改时间改为当
一天一个shell命令 linux文本内容操作系列-awk命令详解

简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理. awk有3个不同版本: awk.nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本. awk其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母.实际上 AWK
一天一个shell命令 linux文本操作系列-diff命令详解

这又是一个文件比较命令,熟练掌握会节省你很多工作.还记得comm命令吗?diff比他更加复杂,好用,不仅能比较文件,还能比较目录. 当一个文件有多个版本时候,或者更多复杂的文件,目录比较时,你会期望有一个比comm更有用的命令,diff正是为此而生. 全称:different file 实例: 文件1: v1.txt 复制代码代码如下: hello world v1_echo v1_diff v1_comm shell is easy! 文件2: v2.txt 复制代码代码如下
一天一个shell命令 linux文本内容操作系列-cut命令详解

说明: cut 按列切分文件,你可以指定分隔每列的定界符.在cut的术语中,每列都是一个字段,就是有时候说第一列,可能表述称第一个字段. 实战: 假设有文件data.txt,格式如下 NO Name Mark Percent 1 Sarath 45 90 2 Alex 49 98 3 Anu 45 90 分隔符(定界符)为Tab 制表符如果我要取得第二列,所有人的名称,有什么好的办法吗?此时cut该大显身手了. 1.
一天一个shell命令 linux文本操作系列-wc命令详解

全称 wc是一个用于统计的工具,全拼为:Word Count(单词统计) 实例: 1. 统计行数 $wc –l file 2. 统计单词数 $wc –w file 3. 统计字符数 $wc –c file 4. 统计流中的字符数 $echo –n 1234 | wc –c 输出:4 解读--help 用法:wc [选项]... [文件]... 或:wc [选项]... --files0-from=F 打印每行的换行符,单词,字节的数量,如果多于一个文件,则打印每个总行数.如果没有文件,或者文件位
使用Linux正则表达式灵活搜索文件中的文本

正则表达式是一种符号表示法,用于识别文本模式.Linux处理正则表达式的主要程序是grep.grep搜索与正则表达式匹配的行,并将结果输送至标准输出. 1. grep匹配模式 grep按下述方式接受选项和参数(其中,regex表示正则表达式) 复制代码代码如下: grep [options] regex [files] 其中options主要为下表: 选项含义功能描述 -i ignore case 忽略大小写 -v invert match 不匹配匹配的 -l file-with-matc
详解Linux文本文件与WIN文本文件换行格式转换命令

详解Linux文本文件与WIN文本文件换行格式转换命令前言: 有时在WIN下编辑好的脚本文件上传到LINUX服务器中不能正常执行,开始误认为是LINUX配置问题,后来发现,是WIN与LINUX存储文件时的换行符标志不同造成的.在DOS使用的换行符为 ^M$,我们称为CR与LF两个符号.而在Linux中,则仅有LF ($) 这个换行符. 可以用如下命令完成格式转换:$dos2unix,$unix2dos.但这两个命令在UBUNTU发行版本中不存在,可通过: $sudo apt-get ins
一天一个shell命令文本操作系列-linux dd使用教程

今天第一天写,先说下写shell脚本的基本知识 1. shell脚本以.sh 为扩展名,通常运行 ./${filename}.sh 或者 sh ${filename}.sh 2. shell 脚本开头以 #!/bin/bash #!读作 "shebang" 3. 开启调试 #!/bin/bash –xv 4. /dev/null 任何东西丢进去都会消失,linux黑洞. /dev/zero 用于初始化,会产生0 今天先介绍 dd 命令由来(全称):本来应根据其功能描述"C

教你一招实现Linux中的文本比对

相关推荐

随机推荐