[Perl]文字/代码批量替换工具

Perl脚本batchReplace.pl可以用来批量替换文件中的文字/代码。可在指定目录中查找指定类型的文件,并递归检查子目录;在输出文件时复制输入文件的目录结构。

[附件]Win32应用程序batchReplace.exe是由Perl脚本编译产生的可执行程序,不需安装Perl运行环境即可执行。

在命令行中使用

batchReplace.exe[ -i 输入文件路径(或包含文件的目录)][ -o 输出文件位置(文件或目录)][ -c 批量输入文件的扩展名,以“.”开始,多个扩展名之间以“|”隔开][ -m 匹配模式][ -I(忽略匹配内容的字母大小写)][ -G(全局查找要匹配的内容)][ -e 例外的字符串,是对匹配模式的补充,如果在匹配结果中发现有这样的字符串,做不匹配处理][ -r 替换的内容]

上述参数没有顺序限制。当 -o 参数所涉及的文件路径不存在时,会自动创建。当输出文件已经存在时,文件原有的内容将被覆盖。(安全起见,请不要输出到输入文件的原始位置,以免造成不可恢复的损失。)

例如:
batchReplace.exe -i d:\gaoshu1 -o d:\do\123\456 -e http://www.blueidea.com/

通过配置文件 batchReplace.set 设置参数

配置文件中可包含以下设置项目(格式范例,注意大小写):

Input=E:\fna\                 指定输入路径,相当于命令行参数 -i 的默认值。
-i=E:\fna\                    同上。
Output=E:\dnaWalks\           指定输出路径,相当于命令行参数 -o 的默认值。
-o=E:\dnaWalks\               同上。
Match=<iframe[^>]*>[\s\S]*?<\/iframe>  匹配模式,相当于命令行参数 -m 的默认值。
-m=<iframe[^>]*>[\s\S]*?<\/iframe>  同上。
Insensitive                   忽略匹配内容的字母大小写,相当于命令行参数 -I。
-I                            同上。
Global                        全局查找要匹配的内容,相当于命令行参数 -G。
-G                            同上。
Replacement=<h1>bound0</h1>   替换的内容,相当于命令行参数 -r 的默认值。
-r=<h1>bound0</h1>            同上。
Except=http://www.blueidea.com/ 例外的字符串,如在匹配结果中发现有这样的字符串,做不匹配处理,相当于命令行参数 -e 的默认值。
-e=http://www.blueidea.com/   同上。
CheckType=.htm|.html          当输入参数设为目录时,处理目录中包含的具有这些扩展名的文本文件(递归检查子目录)。相当于命令行参数 -c 的默认值。
-c                            同上。

每行放置一个项目。除内容之间不要有多余的空格或引号。 
除必要的输入输出外,所有的设置项目都是可选的。命令行参数会覆盖相应的默认值。如果在配置文件中不包含Match或CheckType,会启用内置的默认值(同上面示例中给出的值)。Replacement默认为空字符,将匹配内容替换为空字符,也就是将匹配内容清除。

欲在batchReplace.set中保留历史配置时,可在参数前放置任意非空白字符以取消其作用。
例如:
2007/04/06 Insensitive
(此处的 Insensitive 将作为历史配置保留,不再生效。)

2007/04/06 Replacement=<h1>bound0</h1>
(此处的 Replacement=<h1>bound0</h1> 将作为历史配置保留,不再生效。)

如果在配置文件的多行中出现同样的项目,以最后出现的设置为准,例如:
CheckType=.htm|.html
CheckType=.jsp
-c=.asp|.php
将设置CheckType的值为.asp|.php,也可以利用这个特性保留历史配置,方便调试。

这个脚本写得比较仓促(是挤出吃晚饭的时间写的),以后有时间我还会改进。(因此转载请注明出处,并注意更新。)

[免责声明]作者不承担用户因使用此工具而造成的任何意外损失。
perl源码


代码如下:

#file:batchReplace.pl
#author:Bound0
#created:2007-04-06
#first published: http://bbs.blueidea.com/viewthread.php?tid=2734388

my $match;
my $replacement='';
my $insensitive=0;
my $global=0;
my $gi;
my $go;
my $Checktype=".htm|.html";
my $except;

if(open(setfile,"<batchReplace.set"))
{
    while(<setfile>)
    {
        if(/^\s*-I/){$insensitive=1}
        if(/^\s*-G/){$global=1}
        if(/^\s*-m=(.+)/){$match=$1}
        if(/^\s*-r=(.+)/){$replacement=$1}
        if(/^\s*-e=(.+)/){$except=$1}
        if(/^\s*-i=(.+)/){$gi=$1}
        if(/^\s*-o=(.+)/){$go=$1}
        if(/^\s*-c=(.+)/){$Checktype=$1}
        if(/^\s*Insensitive/){$insensitive=1}
        if(/^\s*Global/){$global=1}
        if(/^\s*Match=(.+)/){$match=$1}
        if(/^\s*Replacement=(.+)/){$replacement=$1}
        if(/^\s*Except=(.+)/){$except=$1}
        if(/^\s*Input=(.+)/){$gi=$1}
        if(/^\s*Output=(.+)/){$go=$1}
        if(/^\s*CheckType=(.+)/){$Checktype=$1}
    }
}

my $para=' '.join(' ',@ARGV);
if($para=~/ -I */){$insensitive=1}
if($para=~/ -G */){$global=1}
my @ti=split(/ -i */,$para);
if($ti[1]){($gi)=split(/ -(o|i|c|e|m|r|I|G)/,$ti[1])}
unless($gi){print "No \"Input path\" parameter!";exit}
my @to=split(/ -o */,$para);
if($to[1]){($go)=split(/ -(o|i|c|e|m|r|I|G)/,$to[1])}
unless($go){print "No \"Output path\" parameter!";exit}
my @tc=split(/ -c */,$para);
if($tc[1]){($Checktype)=split(/ -(o|i|c|e|m|r|I|G)/,$tc[1])}
my @te=split(/ -e */,$para);
if($te[1]){($except)=split(/ -(o|i|c|e|m|r|I|G)/,$te[1])}
my @tr=split(/ -r */,$para);
if($tr[1]){($replacement)=split(/ -(o|i|c|e|m|r|I|G)/,$tr[1])}

unless($match){$match="<iframe[^>]*>[\\s\\S]*?<\\/iframe>";
$insensitive=1;
$global=1}

my @tm=split(/ -m */,$para);
if($tm[1]){($match)=split(/ -(o|i|c|e|m|r|I|G)/,$tm[1])}
unless($match){print "No \"Match Pattern\" parameter!";exit}

my $checktyp='(';
$Checktype=~s/\./\\\./g;
$Checktype=~s/\|/\)\|\(/g;
$checktyp.=$Checktype.')$';

my $excep;
if($except){
$excep=$except;
$excep=~s/\//\\\//g;
$excep=~s/\./\\\./g;
$excep=~s/\|/\\\|/g;
$excep=~s/\[/\\\[/g;
$excep=~s/\]/\\\]/g;
$excep=~s/\(/\\\(/g;
$excep=~s/\)/\\\)/g;
$excep=~s/\$/\\\$/g;
$excep=~s/\?/\\\?/g;
}

my $replacemen;
if($replacement){
$replacemen=$replacement;
$replacemen=~s/\//\\\//g;
$replacemen=~s/\./\\\./g;
$replacemen=~s/\|/\\\|/g;
$replacemen=~s/\[/\\\[/g;
$replacemen=~s/\]/\\\]/g;
$replacemen=~s/\(/\\\(/g;
$replacemen=~s/\)/\\\)/g;
$replacemen=~s/\$/\\\$/g;
$replacemen=~s/\?/\\\?/g;
}

sub cFile
{
    my $fi;
    ($fi)=@_;
    if(opendir(DIR, $fi))
    {
        my @dir=readdir(DIR);
        closedir DIR;
        if("\\" eq substr $fi,(length $fi)-1){$fi=substr($fi,0,(length $fi)-1)}
        my @subdirs= grep { /^(?!\.)/ && -d "$fi\\$_" } @dir;
        foreach my $subdir (@subdirs)
        {
            cFile("$fi\\$subdir")
        }
        @files = grep { /$checktyp/i  && -T "$fi\\$_" } @dir;
        foreach my $fil (@files)
        {
            my $bp='';
            $bp=(substr $fi,(length $gi))."\\";
            my $bi="$fi\\$fil";
            my $bo=$go.$bp.$fil;
            remove($bi,$bo)
        }
    }
}
unless("\\" eq substr $go,(length $go)-1){$go.="\\"}
if(-d $gi)
{
    unless("\\" eq substr $gi,(length $gi)-1){$gi.="\\"}
    cFile($gi);
}
else
{
    my $bu=substr $gi,(rindex $gi,'\\');
    my $bo=$go.$bu;
    remove($gi,$bo)
}

print "\nProcess Finished!";
print "\n-i:$gi";
print "\n-o:$go";
print "\n-m:$match";
if($except){print "\n-e:$except"}
if($replacement){print "\n-r:$replacement"}
sub remove
{
    my $bi;
    my $bo;
    ($bi,$bo)=@_;

print "\nprocessing $bi ...\n";
    unless(open(INPUT,"<$bi")){print "\n[Warn] Can not open the file <$bi>: $!";return}
    my @conts = <INPUT>;
    close INPUT;
    my $cont=join '',@conts;
    my $c;
    if($insensitive)
    {
        if($global)
        {
            unless($cont=~s/($match)/${$c=Cexcept($1)}$c/gi){die "$!"}
        }
        else
        {
            unless($cont=~s/($match)/${$c=Cexcept($1)}$c/i){die "$!"}
        }
    }
    else
    {
        if($global)
        {
            unless($cont=~s/($match)/${$c=Cexcept($1)}$c/g){die "$!"}
        }
        else
        {
            unless($cont=~s/($match)/${$c=Cexcept($1)}$c/){die "$!"}
        }
    }
    unless(open(OUT, ">$bo"))
    {
        if($!==2)
        {
            my $dbo=substr $bo,0,(rindex $bo,'\\');
            if(opendir(OUTDIR,$dbo)){closedir OUTDIR;print "\n[Warn] Can not open the output file <$bo>: $!";exit}
            else
            {
                if($!==2)
                {
                    unless(pmkpath($dbo)){print "\n[Warn] Can not creat the output directory <$dbo>: $!";exit}
                    unless(open(OUT,">>$bo")){print "\n[Warn] Can not open the output file <$bo>: $!";exit}
                }
                else{print "\n[Warn] Can not open the output directory <$dbo>: $!";exit}
            }
        }
        else{print "\n[Warn] Can not open the output file <$bo>: $!";exit}
    }

print OUT "$cont";
    close OUT;
}
sub pmkpath
{
    my @p=split(/\\/,shift);
    my $pa=$p[0];
    my $m=$#p+1;
    my $t;
    for($t=1; -e $pa;$t++){$pa.='\\'.$p[$t]}
    unless(mkdir $pa){return 0}
    for(;$t<$m;$t++)
    {
        $pa.='\\'.$p[$t];
        unless(mkdir $pa){return 0}
    }
    return 1
}
sub Cexcept
{
    unless($except){return $replacemen}
    my $con;
    ($con)=@_;
    if($con=~/$excep/){return $con}else{return $replacemen}    
}

打包的exe文件下载

(0)

相关推荐

  • [Perl]文字/代码批量替换工具

    Perl脚本batchReplace.pl可以用来批量替换文件中的文字/代码.可在指定目录中查找指定类型的文件,并递归检查子目录:在输出文件时复制输入文件的目录结构. [附件]Win32应用程序batchReplace.exe是由Perl脚本编译产生的可执行程序,不需安装Perl运行环境即可执行. 在命令行中使用 batchReplace.exe[ -i 输入文件路径(或包含文件的目录)][ -o 输出文件位置(文件或目录)][ -c 批量输入文件的扩展名,以"."开始,多个扩展名之间

  • 用asp实现的iframe批量替换工具

    说明: 1.此工具可以批量替换网站上asp,.txt,php,aspx...等等文本型的字符 2.将replace.asp上传至网站根目录后,运行http://网站域名/replace.asp 3.为了安全,使用本程序后请删除或更名 复制代码 代码如下: <%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%> <%option explicit Response.Buffer=true Response.CharSet=&q

  • dos批量替换当前目录后缀名的实现代码

    有时候有些后缀名不满足条件,就需要进行批量的替换,如果人为的去替换,那么如果量少的话还好说,量多的话一个个去替换就太傻了,今天从网络上面查找了一些批量替换的dos命令,用起来还挺好用的,就直接把代码贴在这边. 比如有时候照相出来的后缀名都是jpeg,但是有些网站为了安全,直接限制只能上传jpg的后缀名,这个时候就可以用这个批量替换工具了. 复制代码 代码如下: @echo off set /p filename=请输入要替换的后缀名: echo. set /p filename2=请输入替换后的

  • 批量替换sqlserver数据库挂马字段并防范sql注入攻击的代码

    首先备份数据库,以防不必要的损失.而后对所有被挂马的小于8000字符的varchar字段执行 复制代码 代码如下: update 表名 set 字段名=replace(字段名,'<Script Src=http://c.n%75clear3.com/css/c.js></Script>','') 其中<Script Src=http://c.n%75clear3.com/css/c.js></Script>为挂马字段.执行后挂马字段被清除.但是有部分字段,比

  • MSSQL批量替换语句 在SQL SERVER中批量替换字符串的方法

    方法一:(这种是最常用的,因为很多大段的内容都使用text ntext等数据类型,而我们通常也是替换里面的内容) varchar和nvarchar类型是支持replace,所以如果你的text不超过8000可以先转换成前面两种类型再使用replace 替换 text ntext 数据类型字段的语句 复制代码 代码如下: update 表名 set 字段名=replace(cast(与前面一样的字段名 as varchar(8000)) ,'原本内容','想要替换成什么') 方法二:(替换其他数据

  • php 批量替换程序的具体实现代码

    代码如下: 复制代码 代码如下: <?php/***************************************************************************batch-replace, v1.1***************************************************************************file: batch-replace_utf8.phpfunctionality: 本程序可以扫描指定目录的所有文

  • VBS脚本实现遍历批量替换多目录多文件内容的代码

    有时候我们需要将一个目录与子目录中的多个htm网页文件实现批量替换,这里就为大家分享一下 将以下代码复制到一个文本文档中,并将文本文档的后缀修改为.vbs,直接运行即可 Set WshShell = CreateObject("Wscript.Shell") WshShell.Run "cmd /c dir /s/b *.htm > list.htm",vbHide Wscript.Sleep 1000 sFile = "list.htm"

  • JS批量替换内容中关键词为超链接

    懂点seo的人都知道要给内容中关键词加上链接,形成站内锚文本链接,这对seo有很大的帮助. 思路就是在数据库中录入若干个关键词和关键词对应的链接,当然链接可以根据关键词的id自动生成,或者直接用关键词作为链接参数,如?tag=1.?kw=关键词. 这个问题不是简单的一个批量replace那么简单,要考虑到已经存在的超链接,不能将里面的文字再次替换为超链接,还有就是图片的alt属性,或者其他标签的title属性,里面的文字也不该被替换. 见下面的HTML代码: [<a href="http:

  • php+mysqli实现批量替换数据库表前缀的方法

    本文实例讲述了php+mysqli实现批量替换数据库表前缀的方法.分享给大家供大家参考.具体分析如下: 在php中有时我们要替换数据库中表前缀但是又不苦于一个个表去修改前缀,这里我自己写了一个mysqli批量替换数据库表前缀的php程序,感兴趣的朋友可以参考一下,代码如下: <?php header ( 'http-equiv="Content-Type" content="text/html; charset=utf-8"' ); $DB_host = &q

  • PHP基于正则批量替换Img中src内容实现获取缩略图的功能示例

    本文实例讲述了PHP基于正则批量替换Img中src内容实现获取缩略图的功能.分享给大家供大家参考,具体如下: 这里PHP用正则批量替换Img中src内容,实现获取图片路径缩略图的功能 网上很多正则表达式只能获取或者替换一个img的src内容,或者只能替换固定的字符串,要动态替换多个图片内容的试了几个小时才解决. /** * 图片地址替换成压缩URL * @param string $content 内容 * @param string $suffix 后缀 */ function get_img

随机推荐