php不用正则采集速度探究总结

注意:下面的所有函数都没有用正则。

以上为取出第一个匹配的三个函数,实现相同的目的

代码如下:

function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换 
$content = strstr( $str, $start ); 
$content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) ); 
return $content; 

function str_cut1($str ,$start, $end) {//取出第一个匹配,效率中,直接查找替换 
$x = strpos($str, $start); 
return substr($str, $x+strlen($start), strpos($str, $end)-$x+strlen($end)); 
}

function str_cut3($content,$start,$end){//取出第一个匹配,字符串越大,速度越慢! 
$my = explode($start,$content); 
$my = explode($end,$my[1]); 
return $my[0]; 
}

以下为取出所有匹配的3个函数(全部原创),实现相同的采集目的


代码如下:

function strcut($str ,$start, $end) //先搜个数,速度中等 

    if( strpos( $str , $start ) ) 
    { 
            $sum = substr_count($str,$start);

$carr = array(); 
            for($i=0;$i<$sum;$i++){ 
                $str = strstr( $str, $start ); 
                $str = substr( $str, strlen($start)); 
                   $carr[] = substr( $str, 0, strpos( $str, $end ) ); 
            }


    return $carr; 
}

function str_cut_all($str ,$start, $end,$carr=array()) //递归,运行效率最慢! 

    if( strpos( $str , $start ) ) 
    { 
            $str = strstr( $str, $start ); 
            $str = substr( $str, strlen($start)); 
               $carr[] = substr( $str, 0, strpos( $str, $end ) ); 
               if( strpos( $str , $start ) ) 
            { 
                   return str_cut_all($str ,$start, $end ,$carr ); 
               }


    return $carr; 
}

function my_Ca($content,$start,$end){//取出所有匹配,效率最快,因为只读一次,字符串越大越明显 
    $m = explode($start,$content); 
    $a = array(); 
    for( $i = 1;$i < count($m);$i++ ) 
    { 
        $my = explode($end,$m[$i]); 
        $a[] = $my[0]; 
        unset($my); 
    } 
    return $a; 
}

注意my-Ca比较
如果这样写:


代码如下:

function my_Ca($content,$start,$end){//取出所有匹配 
$m = explode($start,$content); 
$a = array(); 
$sum = count($m); 
for( $i = 1;$i < $sum;$i++ ) 

$my = explode($end,$m[$i]); 
$a[] = $my[0]; 
unset($my); 

return $a; 
}

速度又快了一些!

由上可以看出,并不是数组处理函数(explode)比字符串处理函数(substr等)慢,也不是那个比这个快,因为在匹配多个数据的时候匹配的越多数组函数的优势越大,处理字符串就象切蛋糕一样越切越小。匹配单个字符串运用切的思路去做也是一样的效果(str_cut)。关键还是在---算法!算法写的好,什么函数都是一样哦!

(0)

相关推荐

  • php不用正则采集速度探究总结

    注意:下面的所有函数都没有用正则. 以上为取出第一个匹配的三个函数,实现相同的目的 复制代码 代码如下: function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换  $content = strstr( $str, $start );  $content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) );  retur

  • JS不用正则验证输入的字符串是否为空(包含空格)的实现代码

    在项目中需要验证输入的字符串是否为空,包括空格,不太喜欢使用正则,所以就想到了js的indexOf函数,indexOf() 方法可返回某个指定的字符串值在字符串中首次出现的位置,如果要检索的字符串值没有出现,则该方法返回 -1. 语法:stringObject.indexOf(searchvalue,fromindex),searchvalue必需,fromindex:可选参数,在字符串中开始检索的位置.它的合法取值是 0 到 stringObject.length - 1.如省略该参数,则将从

  • php采集速度探究总结(原创)

    注意:下面的所有函数都没有用正则. 以上为取出第一个匹配的三个函数,实现相同的目的 function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换 $content = strstr( $str, $start ); $content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) ); return $content; }

  • php不用正则验证真假身份证

    直接看代码吧,很简单的一个PHP类 复制代码 代码如下: <?php $IDCard = new IDCard(); var_dump($IDCard::isCard($_GET['card']));   /**  * 身份证处理类  */ class IDCard {       //检证身份证是否正确     public static function isCard($card) {         $card = self::to18Card($card);         if (st

  • js replace正则相关的诡异问题

     测试的昵称:jesse$< 查看代码:Javascript代码 复制代码 代码如下: $id("f_msg_grow_1").innerHTML=msg["not_club"]["grow_value"].replace(/\{NICK_NAME}/,this.info["friend"]["nick_name"]); 看代码很快可以注意到两点:"replace 正则"和&quo

  • php 正则 不包含某字符串的正则表达式

    常见函数 strstr($str, "abc"); 正则匹配 preg_match("/(abc)?/is", $str); 但是要匹配一个字符串中,不包含某字符串,用正则就比较麻烦了 如果不用正则 !strstr($str, "abc"); 就可以解决问题了 但是用正则呢,就只有这样了,"/^((?!abc).)*$/is" //------------------------------------------------

  • 请php正则走开

    好了,那么我出几个题,不用正则,看我怎么解决的. 1.清除HTML中所有的标签,只保留超级链接.        我用strip_tags.         strip_tags($data,$tags)         $data为字符串,$tags为保留的标签.        strip_tags($data,'<a>')即可.完了?对,就那么简单.        如果我还想保留<img>,则strip_tags($data,'<a><img>') 2.截

  • PHP小偷程序的设计与实现方法详解

    本文实例讲述了PHP小偷程序的设计与实现方法.分享给大家供大家参考,具体如下: 其实自己一直想做一个内涵图片的网站,以前的想法是做一个CMS,然后自己上传一些图片.. 开始真这么做的,没什么动力.之后就放弃了,后来研究了一个CURL.反正还是把这个想法实现比较好. 用PHP盗图,就好比:穿着袜子穿凉鞋一样.虽然没问题,但看着确实蛋疼. 我先说一下我对PHP小偷程序的设计,PHP不支持多线程,这样就只能分先后顺序来做了 获取到目标网站的HTML页面+解析HTML页面获取到图片存储的连接+用二进制方

  • jQuery 源码分析笔记(5) jQuery.support

    其中jQuery.browser已经提供了根据UserAgent检测的浏览器信息.而jQuery.support 使用特性检测来检查浏览器的功能以及Bug. 和文档一样,首先说明一下,这个模块是很底层的代码,基本不需要在日常开发中使用,但是插件的开发者更需要.因为插件需要兼容各个浏览器.首先看一下 support模块提供了哪些浏览器特性的检测,以下结果是在Chrome 13 Dev下看到的结果.根据浏览器的不同,这里的成员可能会有变化.(PS:再次吐槽IE,大部分属性都是IE比较特别) ajax

  • python爬虫入门教程--正则表达式完全指南(五)

    前言 正则表达式处理文本有如疾风扫秋叶,绝大部分编程语言都内置支持正则表达式,它应用在诸如表单验证.文本提取.替换等场景.爬虫系统更是离不开正则表达式,用好正则表达式往往能收到事半功倍的效果. 介绍正则表达式前,先来看一个问题,下面这段文本来自豆瓣的某个网页链接,我对内容进行了缩减.问:如何提取文本中所有邮箱地址呢? html = """ <style> .qrcode-app{ display: block; background: url(/pics/qrco

随机推荐