一个用php实现的获取URL信息的类

获取URL信息的类

使用这个类,你能获得URL的如下信息:

- Host 
- Path 
- Statuscode (eg. 404,200, ...) 
- HTTP Version 
- Server 
- Content Type 
- Date 
- The whole header string of the URL


代码如下:

<?
/**
* Class for getting information about URL's
* @author    Sven Wagener <[email]sven.wagener@intertribe.de[/email]>
* @copyright Intertribe limited
* @PHP中文社区收集整理 [url]www.phpNet.cn[/url]
* @include          Funktion:_include_
*/
class url{

var $url="";
  var $url_host;
  var $url_path;
  var $file="";

var $code="";
  var $code_desc="";
  var $http_version=""; // Variable for HTTP version

var $header_stream;
  var $header_array;

var $timeout="1";

/**
  * Constructor of class url
  * @param string        $url the complete url
  * @desc Constructor of class url
  */
  function url($url){
    $this->url=$url;

$url_array=parse_url($this->url);
    $this->url_host=$url_array['host'];
    $this->url_path=$url_array['path'];

if($this->url_path==""){
            $this->url_path="/";
    }

$this->refresh_headerinfo();
  }

/**
  * Returns the whole url
  * @return string $url the whole url
  * @desc Returns the whole url
  */
  function get_url(){
          return $this->url;
  }

/**
  * Returns the host of the url
  * @return string $url_host the host of the url
  * @desc Returns the host of the url
  */
  function get_url_host(){
    return $this->url_host;
  }

/**
  * Returns the path of the url
  * @return string $url_path the path of the url
  * @desc Returns the path of the url
  */
  function get_url_path(){
    return $this->url_path;
  }

/**
  * Returns the status code of the url
  * @return string $status_code the status code
  * @desc Returns the status code of the url
  */
  function get_statuscode(){
    return $this->code;
  }

/**
  * Returns the status code description of the url
  * @return string $status_code_desc the status code description
  * @desc Returns the status code description of the url
  */
  function get_statuscode_desc(){
    return $this->code_desc;
  }

/**
  * Returns the http version of the url by the returned headers of the server
  * @return string $http_version the http version
  * @desc Returns the http version of the url by the returned headers of the server
  */
  function get_info_http_version(){
    return $this->http_version;
  }

/**
  * Returns the server type of the url's host by the returned headers of the server
  * @return string header_array['Server'] the server type
  * @desc Returns the server type of the url's host by the returned headers of the server
  */
  function get_info_server(){
    return $this->header_array['Server'];
  }

/**
  * Returns the date of the url's host by the returned headers of the server
  * @return string $header_array['Date'] the date
  * @desc Returns the date of the url's host by the returned headers of the server
  */
  function get_info_date(){
    return $this->header_array['Date'];
  }

/*
  function get_info_content_length(){
    return $this->header_array['Content-Length'];
  }
  */

/**
  * Returns the content type by the returned headers of the server
  * @return string header_array['Content-Type'] the content type
  * @desc Returns the content type by the returned headers of the server
  */
  function get_info_content_type(){
    return $this->header_array['Content-Type'];
  }

/**
  * Returns the content of the url without the headers
  * @return string $content the content
  * @desc Returns the content of the url without the headers
  */
  function get_content(){
    // Get a web page into a string
    $string = implode ('', file ($this->url));
    return $string;
  }

/**
  * Returns the whole header of url without content
  * @return string $header the header
  * @desc Returns the whole header of url without content
  */
  function get_header_stream(){
    return $this->header_stream;
  }

/**
  * Returns the whole headers of the url in an array
  * @return array $header_array the headers in an array
  * @desc Returns the whole headers of the url in an array
  */
  function get_headers(){
    return $this->header_array;
  }

/**
  * Refreshes the header information
  * @desc Refreshes the header information
  */
  function refresh_headerinfo(){
    // Open socket for connection via port 80 to put headers
    $fp = fsockopen ($this->url_host, 80, $errno, $errstr, 30);
    if (!$fp) {
      // echo "$errstr ($errno)";
      if($errno==0){
              $errstr="Server Not Found";
      }
      $this->code=$errno;
      $this->code_desc=$errstr;
    } else {

$put_string="GET ".$this->url_path." HTTP/1.0rnHost: ".$this->url_host."rnrn";
      fputs ($fp, $put_string);
      @socket_set_timeout($fp,$this->timeout);

$stream="";
      $this->header_array="";
      $header_end=false;

// Getting header string and creating header array
      $i=0;
      while (!feof($fp) && !$header_end) {
        $line=fgets($fp,128);
        if(strlen($line)==2){
          $header_end=true;
        }else{
          if($i==0){
            $line1=$line;
          }
          $stream.=$line;
          $splitted_line=split(":",$line);
          $this->header_array[$splitted_line[0]]=$splitted_line[1];
          $i++;
        }
      }
      fclose ($fp);

$this->header_stream=$stream;

$splitted_stream=split(" ",$line1);

// Getting status code and description of the URL
      $this->code=$splitted_stream[1];
      $this->code_desc=$splitted_stream[2];
      if(count($splitted_stream)>3){
        for($i=3;$i<count($splitted_stream);$i++){
          $this->code_desc.=" ".$splitted_stream[$i];
        }
      }
      // Cleaning up for n and r
      $this->code_desc=preg_replace("[\n]","",$this->code_desc);
      $this->code_desc=preg_replace("[\r]","",$this->code_desc);

// Getting Http Version
      $http_array=split("/",$splitted_stream[0]);
      $this->http_version=$http_array[1];
      }
  }

/**
  * Sets the timeout for getting header data from server
  * @param int $seconds time for timeout in seconds
  * @desc Sets the timeout for getting header data from server
  */
  function set_timeout($seconds){
    $this->timeout=$seconds;
  }
}
?>

代码如下:

<?php 
include("url.class.php");
$url=new url("[url]http://www.phpNet.cn/[/url]");

echo $url->get_header_stream();
$headers=$url->get_headers();

echo $headers['Server'];

echo $url->get_content();
echo "URL: <b>".$url->get_url()."</b><br>n";
echo "URL Host: ".$url->get_url_host()."<br>n";
echo "URL Path: ".$url->get_url_path()."<br>n<br>n";

echo "Statuscode: ".$url->get_statuscode()."<br>n";
echo "Statuscode description: ".$url->get_statuscode_desc()."<br>n";
echo "HTTP Version: ".$url->get_info_http_version()."<br>n";
echo "Server: ".$url->get_info_server()."<br>n";
echo "Content Type: ".$url->get_info_content_type()."<br>n";
echo "Date: ".$url->get_info_date()."<br>n<br>n";

echo "WHOLE HEADERS:<br>n";
echo $url->get_header_stream();
?>

(0)

相关推荐

  • 一个用php实现的获取URL信息的类

    获取URL信息的类 使用这个类,你能获得URL的如下信息: - Host  - Path  - Statuscode (eg. 404,200, ...)  - HTTP Version  - Server  - Content Type  - Date  - The whole header string of the URL 复制代码 代码如下: <? /** * Class for getting information about URL's * @author    Sven Wage

  • asp.net Request获取url信息的各种方法比较

    本页地址: Request.URL; 上页地址: 复制代码 代码如下: Request.UrlReferrer Request.ServerViables["http_referer"] Request.RawUrl Request.RawUrl.QueryAndPath System.IO.Path.GetFileName(Request.FilePath.ToString()) 在ASP.NET编程中经常需要用Request获取url的有关信息,Request中有多种方法获取 ur

  • jsp Request获取url信息的各种方法对比

    从Request对象中可以获取各种路径信息,以下例子: 假设请求的页面是index.jsp,项目是WebDemo,则在index.jsp中获取有关request对象的各种路径信息如下 String path = request.getContextPath(); String basePath = request.getScheme()+"://"+request.getServerName()+":"+request.getServerPort()+path+&q

  • 详解javascript获取url信息的常见方法

    先以"http://www.cnblogs.com/wuxibolgs329/p/6188619.html#flag?test=12345"为例,然后获得它的各个组成部分. 1.获取页面完整的url var a=location.href; console.log(a); // "http://www.cnblogs.com/wuxibolgs329/p/5261577.html#flag?test=12345" 2.获取页面的域名 var host = windo

  • 使用jquery获取url及url参数的简单实例

    使用jquery获取url以及使用jquery获取url参数是我们经常要用到的操作 1.jquery获取url很简单,代码如下: window.location.href; 其实只是用到了javascript的基础的window对象,并没有用jquery的知识. 2.jquery获取url参数比较复杂,要用到正则表达式,所以学好javascript正则式多么重要的事情 首先看看单纯的通过javascript是如何来获取url中的某个参数: //获取url中的参数 function getUrlP

  • jquery获取url参数及url加参数的方法

    使用jquery获取url以及使用jquery获取url参数是我们经常要用到的操作,下面通过文字说明加代码分析的形式给大家解析,具体详情请看下文. 1.jquery获取url很简单,代码如下: 复制代码 代码如下: window.location.href; 其实只是用到了javascript的基础的window对象,并没有用jquery的知识. 2.jquery获取url参数比较复杂,要用到正则表达式,所以学好javascript正则式多么重要的事情 首先看看单纯的通过javascript是如

  • 使用jquery获取url以及jquery获取url参数的实现方法

    使用jquery获取url以及使用jquery获取url参数是我们经常要用到的操作 1.jquery获取url很简单,代码如下 window.location.href; 其实只是用到了javascript的基础的window对象,并没有用jquery的知识 2.jquery获取url参数比较复杂,要用到正则表达式,所以学好javascript正则式多么重要的事情 首先看看单纯的通过javascript是如何来获取url中的某个参数 function getUrlParam(name) { va

  • c#反射机制学习和利用反射获取类型信息

    1..NET可执行应用程序结构 程序代码在编译后生成可执行的应用,我们首先要了解这种可执行应用程序的结构. 应用程序结构分为应用程序域-程序集-模块-类型-成员几个层次,公共语言运行库加载器管理应用程序域,这种管理包括将每个程序集加载到相应的应用程序域以及控制每个程序集中类型层次结构的内存布局. 程序集包含模块,而模块包含类型,类型又包含成员,反射则提供了封装程序集.模块和类型的对象.我们可以使用反射动态地创建类型的实例,将类型绑定到现有对象或从现有对象中获取类型,然后调用类型的方法或访问其字段

  • Android获取手机信息的工具类

    网上收集的一些获取收集信息的代码,制作成一个工具类,以后可以方便调用. import java.io.BufferedReader; import java.io.FileReader; import java.io.IOException; import android.app.Activity; import android.content.Context; import android.content.pm.ApplicationInfo; import android.content.p

  • python获取url的返回信息方法

    如下所示: #!/usr/bin/env python # -*- coding: utf-8 -*- import os import sys import urllib import urllib2 import string #########start 获取url的返回信息############ def jwkj_url_postget(url,vlaues): data = urllib.urlencode(values) req = urllib2.Request(url, dat

随机推荐