Perl中著名的Schwartzian转换问题解决实现

2025-02-03 03:43:44

Perl中著名的Schwartzian转换，其产生背景主要涉及到排序问题:
比如说，根据文件名以字母顺序排序，代码如下:

代码如下:

use strict;
use warnings;

my @files = glob "*.xml";          #perl中文件操作符glob提供相当于shell中的通配符的功能
my @sorted_files = sort @files;    #sort()，排序，默认是字母顺序排序

比如说，根据文件名长度排序，其代码如下:

代码如下:

use strict;
use warnings;

#length求长度。太空船操作符<=>，默认变量是$a,$b，返回值为-1,0,1分别表示大于，==，小于。 sort进行排序
my $files = ".xml";
my @sorted_length = sort { length($a) <=> length($b) } @files;

上面的两种情况，对很多文件操作来说，速度还不算慢，如果是下面这种情况。
比如说:要批量比较文件大小，其代码如下:

代码如下:

use strict;
use warnings;

my @files = glob "*.xml";
my @sort_size = sort { -s $a <=> -s $b } @files; #比较大小

上面的代码设计到三重(次)操作:
1. 从硬盘上获取文件大小(-s $b)
2. 比较文件大小(太空船操作)
3. 对其进行排序(sort操作)
考虑到要比较$a,$b大小时，要从硬盘中获取两次，所以次数是6次！也就是说，如果有1万个文件，总共是6万次。
其算法复杂度是: n*long(n),考虑到后两项(比较文件大小，进行排序)必然要进行的操作，但第一项却可以降低！
即一次性从硬盘中读取所有文件大小，将其放置到Perl中的默认的变量，并存储到内存中！于是又下面算法实现:

代码如下:

use strict;
use warnings;

my @files = glob "*.xml";

my @unsorted_pairs = map { [$_, -s $_] } @files;
my @sorted_pairs = sort { $a->[1] <=> $b->[1] } @unsorted_pairs;
my @sorted_files = map { $_->[0] } @sorted_pairs;

看上去比较复杂，分三个步骤解释下:
第一步:遍历文件列表，对每个文件创建一个数组引用。数组引用包含两个元素：
第一个是文件名($_)，第二个是文件大小(-s $_)。这样，处理每个文件只访问一次磁盘。
第二步:对二维数组排序。因比较文件大小，所以需取元素[1]，比较它们的值。得到另一个二维数组。
第三步:丢掉文件大小元素，创建一个只含文件名的列表。完成目标!
上面的代码使用了两个临时数组，但这并不是必须的。我们可以一个语句就能完成所有的工作。为了达到目的，需要按照“数据从右流向左”的原理反转句子顺序，不如果将每个句子放在单独一行，并且留出足够的空间，我们依然可以写出可读性高的代码。

代码如下:

my @quickly_sorted_files =
    map { $_->[0] }
    sort { $a->[1] <=> $b->[1] }
    map { [$_, -s $_] }
    @files;

这就是以Randal L. Schwartz命名的Schwartzian转换，对数据量特多的情况下，其速度要比前者快数倍！
下面写了小程序，包括在生成1万个xml文件，在两种情况下，完整代码如下:

代码如下:

#!/usr/bin/perl -w
use strict;
use warnings;
use autodie;
use v5.10;

######################################
### 创建要比较的10,000个.xml文件 ###
######################################
my $profix = ".xml";

foreach my $num (1..10000) {
    open(my $fh, '>', $num . $profix) || die "Can not create the file: $!\n";
    print $fh "This is file size testing!";
}

print "All the 10_1000 files created! \n";

######################################
### 常规转换:      遍历20次       ###
######################################
my $t1 = time();

foreach (1..20){
    my @files     = glob "*.xml";
    my @sorted    = sort { -s $a <=> -s $b } @files;
}

say "常规算法需要时间: => ", time()- $t1;

######################################
### Schwartzian转换: 遍历20次     ###
######################################
my $t2 = time();

foreach (1..20){
    my @files = glob "*.xml";
        my @sorted =
            map {$_->[0]}
            sort {$a->[1] <=> $b->[1]}
            map {[$_, -s $_]}
       @files;
}

say "Schwartzian算法需要时间: => ", time()- $t2;

输出结果:
All the 10_1000 files created!
常规算法需要时间: => 185
Schwartzian算法需要时间: => 115

Perl中著名的Schwartzian转换问题解决实现

Perl中著名的Schwartzian转换,其产生背景主要涉及到排序问题: 比如说,根据文件名以字母顺序排序,代码如下: 复制代码代码如下: use strict; use warnings; my @files = glob "*.xml"; #perl中文件操作符glob提供相当于shell中的通配符的功能 my @sorted_files = sort @files; #sort(),排序,默认是字母顺序排序比如说,根据文件名长度排序,其代
讲Perl中的本地时间与UNIX时间戳间相互转换的方法

当你的Perl脚本需要解决时间信息,这里有两种方法来表示和处理日期和时间.一种方法是易读的时间表示(例,"Sat Mar 14 10:14:05 EDT 2015"),另外一种是使用UNIX时间戳(也叫"新纪元时间"),这是从1970年1月1日到今所经过的时间秒数.每一种方法都有它自己的优劣势,取决于你的需要,也许也就需要转换一种格式到另一种. Perl中转换本地时间到UNIX时间戳为了从日期字符串中获得UNIX时间,可以使用Date::Parse模块中str2t
Perl中的真与假深入研究

Perl认为真值是自明的(self-evident), 表示任何事物的真值都可以计算.Perl以实用的方式来定义真值,即一个实体的真值取决于这个实体的类型.Perl总是乐观的认为:这个世界上真的东西远比假的东西多的多. Perl区别与任何其他计算机语言,Perl是语言学家创造的,而语言的意思离不开上下文语境,所以Perl中的真值都可以在标量(标量$与数组@类似于英文中的单数与复数, book 与 books的区别, 真值在现实世界中,应该就是单数,所以是标量)计算,除此之外,不会做任何类型的强制
Perl中的正则表达式介绍

感谢AKA及作者. Perl 中的正则表达式正则表达式的三种形式正则表达式中的常用模式正则表达式的 8 大原则正则表达式是 Perl 语言的一大特色,也是 Perl 程序中的一点难点,不过如果大家能够很好的掌握他,就可以轻易地用正则表达式来完成字符串处理的任务,当然在 CGI 程序设计中就更能得心应手了.下面我们列出一些正则表达式书写时的一些基本语法规则. 9.1 正则表达式的三种形式首先我们应该知道 Perl 程序中,正则表达式有三种存在形式,他们分别是: 匹配:m/<regexp>;
JS 调试中常见的报错问题解决方法

报错:Uncaught SyntaxError: Unexpected token o in JSON at position 1 at JSON.parse (<anonymous>) at Function.m.parseJSON (jquery.js:8515) at Object.success (crud.html:45) at j (jquery.js:3143) at Object.fireWith [as resolveWith] (jquery.js:3255) at x (
Perl中的符号 ->;、=>; 和 :: 分别表示什么意思？

What do the ->, => and :: symbols mean? The -> is the "infix dereference operator". In other words it is the means by which one calls a sub with a pass by reference (among other things you can do with ->). As stated above most things
Perl中的特殊符号介绍

$_ 俗称perl的老地方,当你的程序中未告知使用哪个参数或者变量时,perl就会自动使用$_中的值,比如 for(1..10){ print ; } 这里print没有指定参数,所以它就会使用$_,那$_里面是什么呢?每次循环$_的值都会变化,所以$_实际上就是1 .. 10这10个值,所以上面的代码打印的结果就是12345678910 $! 当且仅当某个函数调用失败时才会设置该变量,所以经常这样使用这个变量 open FILE,"<d:/code/zdd.txt" or
Perl中的单行注释和多行注释语法

同其他大多数编程语言一样,Perl中的单行注释也是#开头,例如: 复制代码代码如下: #print "Hello,World!"; 但多行注释,不同的语言有不同的注释方式,比如说: Java,C/C++: 复制代码代码如下: /* *注释若干行 *注释若干行 *注释若干行 */ Python: 复制代码代码如下: """ 用三个双引号,多行注释用三个双引号,多行注释用三个双引号,多行注释 """ '''
Perl中的列表和数组学习笔记

一.列表列表是包含在括号里的一序列的值,可以为任何数值,也可为空,如:(1, 5.3 , "hello" , 2),空列表:(). 注:只含有一个数值的列表(如:(43.2) )与该数值本身(即:43.2 )是不同的,但它们可以互相转化或赋值.列表例: 复制代码代码如下: (17, $var, "a string") (17, 26 << 2) (17, $var1 + $var2) ($value, "The answer
Perl中的文件读写学习笔记

一.打开.关闭文件语法为open (filevar, filename),其中filevar为文件句柄,或者说是程序中用来代表某文件的代号,filename为文件名,其路径可为相对路径,亦可为绝对路径. 复制代码代码如下: open(FILE1,"file1"); open(FILE1, "/u/jqpublic/file1"); 打开文件时必须决定访问模式,在PERL中有三种访问模式:读.写和添加.后两种模式的区别在于写模式将原文件覆盖,原有内容丢失,形式为

Perl中著名的Schwartzian转换问题解决实现

相关推荐

随机推荐