php过滤html标记属性类用法实例

本文实例讲述了php 过滤html标记属性类及其用法。是PHP项目开发中比较常见的实用技巧。分享给大家供大家参考。具体方法如下:

HtmlAttributeFilter.class.php类文件如下:

<?php
/** HTML Attribute Filter
*  Date:  2013-09-22
*  Author: fdipzone
*  ver:  1.0
*
*  Func:
*  public strip       过滤属性
*  public setAllow      设置允许的属性
*  public setException    设置特例
*  public setIgnore     设置忽略的标记
*  private findElements    搜寻需要处理的元素
*  private findAttributes   搜寻属性
*  private removeAttributes  移除属性
*  private isException    判断是否特例
*  private createAttributes  创建属性
*  private protect      特殊字符转义
*/ 

class HtmlAttributeFilter{ // class start 

  private $_str = '';      // 源字符串
  private $_allow = array();   // 允许保留的属性 例如:array('id','class','title')
  private $_exception = array(); // 特例 例如:array('a'=>array('href','class'),'span'=>array('class'))
  private $_ignore = array();  // 忽略过滤的标记 例如:array('span','img') 

  /** 处理HTML,过滤不保留的属性
  * @param String $str 源字符串
  * @return String
  */
  public function strip($str){
    $this->_str = $str; 

    if(is_string($this->_str) && strlen($this->_str)>0){ // 判断字符串 

      $this->_str = strtolower($this->_str); // 转成小写 

      $res = $this->findElements();
      if(is_string($res)){
        return $res;
      }
      $nodes = $this->findAttributes($res);
      $this->removeAttributes($nodes);
    }
    return $this->_str;
  } 

  /** 设置允许的属性
  * @param Array $param
  */
  public function setAllow($param=array()){
    $this->_allow = $param;
  } 

  /** 设置特例
  * @param Array $param
  */
  public function setException($param=array()){
    $this->_exception = $param;
  } 

  /** 设置忽略的标记
  * @param Array $param
  */
  public function setIgnore($param=array()){
    $this->_ignore = $param;
  } 

  /** 搜寻需要处理的元素 */
  private function findElements(){
    $nodes = array();
    preg_match_all("/<([^ !\/\>\n]+)([^>]*)>/i", $this->_str, $elements);
    foreach($elements[1] as $el_key => $element){
      if($elements[2][$el_key]){
        $literal = $elements[0][$el_key];
        $element_name = $elements[1][$el_key];
        $attributes = $elements[2][$el_key];
        if(is_array($this->_ignore) && !in_array($element_name, $this->_ignore)){
          $nodes[] = array('literal'=>$literal, 'name'=>$element_name, 'attributes'=>$attributes);
        }
      }
    } 

    if(!$nodes[0]){
      return $this->_str;
    }else{
      return $nodes;
    }
  } 

  /** 搜寻属性
  * @param Array $nodes 需要处理的元素
  */
  private function findAttributes($nodes){
    foreach($nodes as &$node){
      preg_match_all("/([^ =]+)\s*=\s*[\"|']{0,1}([^\"']*)[\"|']{0,1}/i", $node['attributes'], $attributes);
      if($attributes[1]){
        foreach($attributes[1] as $att_key=>$att){
          $literal = $attributes[0][$att_key];
          $attribute_name = $attributes[1][$att_key];
          $value = $attributes[2][$att_key];
          $atts[] = array('literal'=>$literal, 'name'=>$attribute_name, 'value'=>$value);
        }
      }else{
        $node['attributes'] = null;
      }
      $node['attributes'] = $atts;
      unset($atts);
    }
    return $nodes;
  } 

  /** 移除属性
  * @param Array $nodes 需要处理的元素
  */
  private function removeAttributes($nodes){
    foreach($nodes as $node){
      $node_name = $node['name'];
      $new_attributes = '';
      if(is_array($node['attributes'])){
        foreach($node['attributes'] as $attribute){
          if((is_array($this->_allow) && in_array($attribute['name'], $this->_allow)) || $this->isException($node_name, $attribute['name'], $this->_exception)){
            $new_attributes = $this->createAttributes($new_attributes, $attribute['name'], $attribute['value']);
          }
        }
      }
      $replacement = ($new_attributes) ? "<$node_name $new_attributes>" : "<$node_name>";
      $this->_str = preg_replace('/'.$this->protect($node['literal']).'/', $replacement, $this->_str);
    }
  } 

  /** 判断是否特例
  * @param String $element_name  元素名
  * @param String $attribute_name 属性名
  * @param Array $exceptions   允许的特例
  * @return boolean
  */
  private function isException($element_name, $attribute_name, $exceptions){
    if(array_key_exists($element_name, $this->_exception)){
      if(in_array($attribute_name, $this->_exception[$element_name])){
        return true;
      }
    }
    return false;
  } 

  /** 创建属性
  * @param String $new_attributes
  * @param String $name
  * @param String $value
  * @return String
  */
  private function createAttributes($new_attributes, $name, $value){
    if($new_attributes){
      $new_attributes .= " ";
    }
    $new_attributes .= "$name=\"$value\"";
    return $new_attributes;
  } 

  /** 特殊字符转义
  * @param String $str 源字符串
  * @return String
  */
  private function protect($str){
    $conversions = array(
      "^" => "\^",
      "[" => "\[",
      "." => "\.",
      "$" => "\$",
      "{" => "\{",
      "*" => "\*",
      "(" => "\(",
      "\\" => "\\\\",
      "/" => "\/",
      "+" => "\+",
      ")" => "\)",
      "|" => "\|",
      "?" => "\?",
      "<" => "\<",
      ">" => "\>"
    );
    return strtr($str, $conversions);
  } 

} // class end 

?>

demo示例代码如下:

<?php
require('HtmlAttributeFilter.class.php'); 

$str = '<div class="bd clearfix" id="index_hilite_ul"><ul class="list"><li><img src="http://su.bdimg.com/static/skin/img/logo_white.png" width="118" height="148"><div class="cover"><a class="text" href="http://www.jb51.net"><strong>yuna</strong><p>love</p></a><strong class="t g">want to know</strong><a href="/login.html" class="ppBtn"><strong class="text">YES</strong></a></div></li></ul></div>'; 

$obj = new HtmlAttributeFilter(); 

// 允许id属性
$obj->setAllow(array('id')); 

$obj->setException(array(
  'a' => array('href'),  // a 标签允许有 href属性特例
  'ul' => array('class') // ul 标签允许有 class属性特例
)); 

// img 标签忽略,不过滤任何属性
$obj->setIgnore(array('img')); 

echo 'source str:<br>';
echo htmlspecialchars($str).'<br><br>';
echo 'filter str:<br>';
echo htmlspecialchars($obj->strip($str));
?>

本文完整源码点击此处本机下载。

希望本文所述对大家的PHP程序设计有所帮助。

(0)

相关推荐

  • PHP实现HTML生成PDF文件的方法

    本文实例讲述了在linux中利用HTML2FPDF与wkhtmltoimage把网页html直接生成pdf格式的文件方法,分享给大家供大家参考.具体实现方法如下: 找到一款在FPDF和HTML2FPDF源码基础上开发的一套开源程序,作者很给力.基本解决了中文(以及日语.韩语及东南亚和全球语言)乱码的问题,在Windows/Linux开发环境下测试可用,不需要安装别的组件支持,是没有VPS和独立服务器的网站开发者的福音. 不多说,源码名称是MPDF,官方地址是:http://www.mpdf1.c

  • html静态页面调用php文件的方法

    本文实例讲述了html静态页面调用php文件的方法.分享给大家供大家参考.具体方法如下: 静态页面中看上去好像是不能直接调用php文件的,但是却可以使用js调用方式来调用php文件,当然还可以使用ajax 调用php文件,下面就来给大家介绍一下: 举一个简单的例子来说明:   如在页面a.html中用下面这句调用,可以将action=test的参数传递到b.php. Javascript代码 复制代码 代码如下: <script type="text/javascript" sr

  • php过滤HTML标签、属性等正则表达式汇总

    $str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格)   $str=preg_replace("/<\!--.*?-->/si","",$str); //注释 $str=p

  • 利用js调用后台php进行数据处理原码

    該方法已經屬於過時方法,其中關鍵的地方也從論壇上得來的,我只是把它消化吸收后重新写了更全面的出来.公布出來只是希望更多的新手能從中學到一些東西.如果你對該代碼有任何意見可以留言,但請勿進行人身攻擊,我是一個菜鳥只能寫出這樣的東西,每个老鸟都有这样的过程. 鉴于时间问题,代碼的提交部分使用的是传统的表单POST,如果您喜欢可以根据LOAD过程自行加上相应的SCRIPT,不过好像只能用GET了.聽說XML可以實現真正的無刷新,如果誰手上有希望能借來看看. 在此感謝QQ群組中蓝劍雪狐和shelly水在

  • php跨域调用json的例子

    JSON和XML没什么太大区别,不过JSON有一个更大范围的应用,那就是,跨域的数据调用.由于安全性问题,AJAX不支持跨域调用,这样要调用不同域名下的数据,很麻烦.下面这个例子,足以展示php用json如何进跨域调用了. index.html 复制代码 代码如下: <script type="text/javascript"> function getProfile(str) {      var arr = str;      document.getElementBy

  • php调用新浪短链接API的方法

    本文实例讲述了php调用新浪短链接API的方法.分享给大家供大家参考.具体方法如下: 复制代码 代码如下: <?php //Sina App_Key define('SINA_APPKEY', '31641035'); function curlQuery($url) {  //设置附加HTTP头  $addHead = array(  "Content-type: application/json"  );  //初始化curl,当然,你也可以用fsockopen代替  $cu

  • php中创建和调用webservice接口示例

    作为开发者来讲,要想写webservice接口或者调用别人的webservice接口,首先需要了解什么是webservice.简单说, WebService就是一些站点开放一些服务出来, 也可以是你自己开发的Service, 也就是一些方法, 通过URL,指定某一个方法名,发出请求,站点里的这个服务(方法),接到你的请求,根据传过来的参数,做一些处理,然后把处理后的结果以XML形式返回来给你,你的程序就解析这些XML数据,然后显示出来或做其它操作. 写webservice需要了解:基础的 Web

  • PHP调用C#开发的dll类库方法

    有的时候,我们需要在php中利用到其他语言编写的dll类库,如C#编写的dll,方法就是利用PHP new COM方法来调用,在调用之前先要把dll库注册并把程序集放入到全局缓存中. 1. 创建一个 C# Class Library ,命名为:HelloWorld 2. 打开项目的属性,在点选左边的 "Application"(就是第一个tab) , 然后点击Assembly Information 按钮 ,在弹出的Dialog中, 必须在底部勾上: Make assembly COM

  • PHP json格式和js json格式 js跨域调用实现代码

    先看一个js函数 复制代码 代码如下: function jsontest() { var json = [{'username':'crystal','userage':'20'},{'username':'candy','userage':'24'}]; alert(json[1].username); var json2 = [['crystal','20'],['candy','24']]; alert(json2[0][0]); } 这个函数,第一个alert(json[1].user

  • PHP使用ob_start生成html页面的方法

    本文实例讲述了PHP使用ob_start生成html页面的方法.分享给大家供大家参考.具体方法分析如下: ob_start([string output_callback])- 打开输出缓冲区 所有的输出信息不在直接发送到浏览器,而是保存在输出缓冲区里面,可选得回调函数用于处理输出结果信息. ob_end_flush - 结束(发送)输出缓冲区的内容,关闭输出缓冲区 使用output control 函数可以让自由控制脚本中数据的输出,这在我们想在header之前输出时很有用. 复制代码 代码如

  • 海河写的 Discuz论坛帖子调用js的php代码

    调用代码 <script language="javascript" src="js_bbs.php?fid=1"></script> js_bbs.php(放在根目录下) 内容 <?php require ("bbs/config.inc.php"); //连接,选择数据库  $link = mysql_connect( $dbhost,$dbuser,$dbpw) or die('Could not connec

随机推荐