Perl遍历目录和使用Linux命令分析日志的代码实例分享

实例代码:


代码如下:

#! /usr/bin/perl -w
$path = '/root/Documents';  # 当前工作目录
$dir = "$path/images"; # 要遍历的目录
$log_file = "$path/access_201209.log"; # nginx日志0903~0907,  filesize: 5.4G
$result_file = 'result.f';  # 放置结果的文件

if(!open $output, ">>$result_file") { # 以追加的形式打开文件
         die " Open file failed: $!";
}
&find_dir($dir);

sub find_dir() {
        my $base_dir = $_[0]; # $_[0]表示子例程(函数)的第一个参数
        if( !opendir(DIR,"$base_dir") ) {
                warn "open dir failed: $! \n";
        }
        my @father_dir = readdir(DIR); # 资源转储
        closedir(DIR);

$base_dir =~ s/\/$//; # 删除目录最后面的 /
        foreach $sub_dir (@father_dir) {
                if($sub_dir =~ /^\./)  { # 过滤掉 . 和 .. 以及 隐藏文件
                        next;
                }

if(-d "$base_dir/$sub_dir") { # 如果是目录则回调
                     &find_dir("$base_dir/$sub_dir"); # 引用递归函数,避免在内存中开辟多个副本

}elsif (-f "$base_dir/$sub_dir") { # 如果是文件则....

# 文件前面保留一个空格,这样才能保证不会搜索到 theme_skin/blue/images 这样的目录
                 my $this_file = " $base_dir/$sub_dir";
                 $this_file =~ s/$path//;           # 删除掉字符串 /root/Documents

# 使用Linux命令,在 [$log_file文件] 中查找 [$this_file字符串] 并统计字符串出现的次数
                 my $result = `grep -c  "$this_file"  $log_file`;  # $this_file要用双引号括起来,防止图片名称中有空格造成程序错误
                 chomp  $result ;  # 删除Linux执行命令后,返回值所带有的换行符
                 print $output "$this_file :         $result \n";  # 将处理结果写入$output指定的文件

# 已经记录过的文件删除掉,这样每次终止脚本的时候,都能继续之前的内容进行查找
                 unlink "$base_dir/$sub_dir";
                }
        }
}

print "\n Finished \n";

# 现在打开 result.f 文件,把 /images/ 替换成 images/   这样才能在当前工作目录中删除文件
# Linux命令查找5天内被访问0次的记录,并删除
# 数字0 左右两边要有空格,防止找到文件名中含有0的记录

# 方法 1 :
# gawk -F ':' '$2 ~ / 0 / {print $1}' result.f | xargs rm -rf

# 方法 2 :  (完全等同 方法1)
# grep ' 0 ' result.f | gawk -F ':' '{print $1}' | xargs rm -rf

(0)

相关推荐

  • Perl遍历目录和使用Linux命令分析日志的代码实例分享

    实例代码: 复制代码 代码如下: #! /usr/bin/perl -w$path = '/root/Documents';  # 当前工作目录$dir = "$path/images"; # 要遍历的目录$log_file = "$path/access_201209.log"; # nginx日志0903~0907,  filesize: 5.4G$result_file = 'result.f';  # 放置结果的文件 if(!open $output, &q

  • PHP执行linux命令6个函数代码实例

    一般情况下,很少会用php去执行linux命令,不过特殊情况下,你也许会用到这些函数.以前我知道有二个函数可以执行linux命令,一个是exec,一个是shell_exec.其实有很多的,结合手册内容,介绍以下6个函数. 1,exec函数 <?php $test = "ls /tmp/test"; //ls是linux下的查目录,文件的命令 exec($test,$array); //执行命令 print_r($array); ?> 返回结果如下: [root@krlcgc

  • php并发加锁问题分析与设计代码实例讲解

    在工作项目中,会遇到一些php并发访问去修改一个数据问题,如果这个数据不加锁,就会造成数据的错误.下面我将分析一个财务支付锁的问题.希望对大家有所帮助. 1 没有应用锁机制 1.1 财务支付简化版本代码 <!--?php /** * pay.php * * 支付没有应用锁 * * Copy right (c) 2016 * * modification history: * -------------------- * 2018/9/10, by CleverCode, Create * */

  • 深入linux下遍历目录树的方法总结分析

    前几天需要实现对整个目录树的遍历,查阅了相关的一些资料.开始找到的原始的方法是使用readdir()与lstat()函数实现递归遍历,后来发现linux对于目录遍历这种最常用的操作已经提供了很完善的接口:ftw()与nftw().下面就这两种方法具体说明一下.1.手动实现递归1.1 stat()函数族stat函数族包括:stat,fstat以及lstat函数,都是向用户返回文件的属性信息(元数据). 复制代码 代码如下: view plaincopy to clipboardprint?#inc

  • Shell+Linux命令实现日志分析

    一.列出当天访问次数最多的IP 命令: 复制代码 代码如下: cut -d- -f 1 /usr/local/apache2/logs/access_log |uniq -c | sort -rn | head -20 原理: 复制代码 代码如下: cut        -d, --delimiter=DELIM               use DELIM instead of TAB for field delimiter               表示用-分割,然后-f 1      

  • Python 遍历子文件和所有子文件夹的代码实例

    最近看ECShop到网上找资料,发现好多说明ECShop的文件结构不全面,于是想自己弄个出来.但这是个无聊耗时的工作,自己就写了个Python脚本,可以递归遍历目录下的所有文件和所有子目录,并将结果记录到一个.xml文件中(因为想使用Notepad++的代码折叠功能,所以使用.xml文件). 下面就是Python代码: # -*- coding: cp936 -*- ############################################# # Written By Qian_F

  • Python彩色化Linux的命令行终端界面的代码实例分享

    先看看效果: 在linux的终端中,ANSI转义序列来控制颜色 基本规则: 前面加上\033[,结尾用\033[0m重置为原来的颜色 可以在终端中输入下面这句,就可以看到输出绿色的hello. >>echo -e '\033[0;32mhello\033[0m' 其中0;32m控制颜色. 最简单的,只要把0;32m中的2改成0-7,就对应不同颜色了. 利用这点,在python中,可以这样来. #coding=utf-8 fmt = '\033[0;3{}m{}\033[0m'.format c

  • Linux sar命令使用方法及代码实例解析

    1. CPU利用率 sar -p (查看全天) sar -u 1 10 (1:每隔一秒,10:写入10次) 1.1. CPU输出项说明 输出项 详细说明 CPU all 表示统计信息为所有 CPU 的平均值. %user 显示在用户级别(application)运行使用 CPU 总时间的百分比. %nice 显示在用户级别,用于nice操作,所占用 CPU 总时间的百分比. %system 在核心级别(kernel)运行所使用 CPU 总时间的百分比. %iowait 显示用于等待I/O操作占用

  • java程序员必须要学会的linux命令总结(推荐)

    1.查找文件 find / -name filename.txt 根据名称查找/目录下的filename.txt文件. find . -name "*.xml" 递归查找所有的xml文件 2.查看一个程序是否运行 ps –ef|grep tomcat 查看所有有关tomcat的进程 3.终止线程 kill -9 19979 终止线程号位19979的进程 pkill -9 java 批量终止java进程 4.查看文件,包含隐藏文件 ls -al 5.当前工作目录 pwd 6.复制文件 c

  • Python遍历目录并批量更换文件名和目录名的方法

    本文实例讲述了Python遍历目录并批量更换文件名和目录名的方法.分享给大家供大家参考,具体如下: #encoding=utf-8 #author: walker #date: 2014-03-07 #summary: 深度遍历指定目录,并将子目录和文件名改为小写 #注意,此程序只针对windows,windows下文件(夹)名不区分大小写 import os import os.path import shutil #读入指定目录并转换为绝对路径 rootdir = raw_input('ro

随机推荐