提供几个关于采集的函数(ASP)

<%
''''''''''''''''断剑注释'''''''''''''''''''''''''
''''strText为要切取内容的那段打的内容''''''''''''
''''strStarTag为要切取内容的开始的地方''''''''''
''''strEndTag为要切取内容的结束的地方''''''''''
''''GetText返回值为切取出来的内容''''''''''''''
'''''''''''''''注释结束''''''''''''''''''''''''
Function GetText(strText, strStartTag, strEndTag)
dim intStart
intStart = instr(strText, strStartTag)
if intStart then
intStart = intStart + len(strStartTag)
intEnd = InStr(intStart, strText, strEndTag)
GetText = Mid(strText, intStart, intEnd - intStart)
else
GetText = " "
end if
End Function

%>
<%
'''''''''断剑注释''''''''''''
'''''''''以下的函数都可以不管'''''''''
''''''''只管入口函数getHTTPPage'''''''
''''''''path为要读取的网页地址''''''''
''''''''getHTTPPage返回读取到的网页内容''
''''''''这里应该注意的是gb2312这里,如果被读取的网页编码是
''gb2312就用gb2312,如果是UTF-8的话,就换成UTF-8''''
''''''''注释结束''''''''''
Function getHTTPPage(Path)
t = GetBody(Path)
getHTTPPage=BytesToBstr(t,"gb2312")
End function

Function GetBody(url)
on error resume next
Set Retrieval = CreateObject("Microsoft.XMLHTTP")
With Retrieval
.Open "get", url, False, "", ""
.Send
GetBody = .ResponseBody
End With
Set Retrieval = Nothing
End Function
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
%>

(0)

相关推荐

  • 提供几个关于采集的函数(ASP)

    <%''''''''''''''''断剑注释'''''''''''''''''''''''''''''strText为要切取内容的那段打的内容''''''''''''''''strStarTag为要切取内容的开始的地方''''''''''''''strEndTag为要切取内容的结束的地方''''''''''''''GetText返回值为切取出来的内容'''''''''''''''''''''''''''''注释结束''''''''''''''''''''''''Function GetText(

  • 判断Email地址是否正确的几个函数(asp/php/javascript)

    用js判断 复制代码 代码如下: function is_email( str ){ p = /^([\w\.-]+)@([a-zA-Z0-9-]+)(\.[a-zA-Z\.]+)$/; if(str.search(p) == -1){ return false; }else{ return true; } } 用PHP判断 复制代码 代码如下: function is_email($email){ $pattern="/^([\w\.-]+)@([a-zA-Z0-9-]+)(\.[a-zA-Z

  • 写入文本文件的过程函数(ASP)

    今天写程序的时候要反复用到写入文本文件,于是就写了一个过程函数,希望对大家有用. 代码: 复制代码 代码如下: Sub Write2File(strFile, strContent, blnAppend) ' 写入文件  ' strFile 文件名(路径) , strContent 写入的内容, blnAppend 是否追加          On Error Resume Next          Set objFSO = Server.CreateObject("Scripting.Fil

  • 检测函数 asp class

    复制代码 代码如下: <% Dim Cmd Set Cmd = New Cls_Command Class Cls_Command     Private Re Public Function IsPositiveInteger(value)         Set Re = New RegExp         Re.Pattern = "^[1-9][\d]*$"         Re.IgnoreCase = True         Re.Global = True   

  • 用asp+xmlhttp编写web采集程序

    web采集程序?网页抓取程序?小倫程序?不管怎么叫,这种程序应用倒是蛮广的.本文不讨论这种使用这种程序引起的版权或道德问题,只谈这种程序在ASP+VBScript环境下的实现 :-) 预备知识:除了一般的ASP+VBScript的知识外,你还需要了解xmlhttp对象和正则表达式对象.xmlhttp对象是时下风头正劲的Ajax的主角:而学好了正则表达式,你再也不用为处理复杂的字符串犯愁. 在编写和调试正则表达式时,RegEx 这个小工具非常有用. 目录 抓取一个远程网页并保存到本地  改进:处理

  • 推荐ASP中VBScript常用函数

    /*-------------------ASP文档参考集-----------------------*/ *-->作者:草履虫 *-->时间:2007-4.28---2007-4.30(原来是自己编写的手册,现在发在这里) *-->联系:caolvchong@gmail.com *-->文档功能: 1.复习了ASP,加深了对ASP结构的理解和ASP的体会 2.可以用来做ASP参考,自己写的,参考起来更方便 这是第五部分:ASP中VBScript常用函数 /*----------

  • ASP转换格林威治时间函数DateDiff()应用

    我今天介绍的是在ASP中如果把时间(例如:2008-8-8 13:45:22)转换成秒的函数,和相反的把秒转换成时间的函数.当然时间转换的时候.必须有一个相对的固定时间,那就是格林威治时间.大家想想因为格林威治时间是以" 1970 年 1 月 1 日 00:00:00 "开始的,ASP提供了一个叫 DateDiff() 的函数,这个函数可以返回一个时间差的秒,那就是说我们放进去一个格林威治标准时间与现在的时间对比一下返回秒就OK.但我们还要注意时区,我们中国是GMT+08:00:00(

  • 基于curl数据采集之单页面并行采集函数get_htmls的使用

    用第一篇的get_html()实现简单的数据采集,由于是一个一个执行才采集数据的传输时间就会是所有页面下载的总时长,一个页面假设1秒,那么10个页面就是10秒了.所幸curl还提供了并行处理的功能. 要写一个并行采集的函数,先要了解要采集什么样的页面,对采集的页面用什么请求,才能写出一个相对常用的函数. 功能需求分析: 返回什么? 当然每一个页面的html集合成的数组 传递什么参数? 编写get_html()时,我们知道了可以用options数组来传递更多的curl参数,那么多页面同时采集函数的

  • 发一个采集(小偷)用的类,ASP+缓存实现

    简单采集类1.0测试版------------------------------Cls_Ajax.asp 负责采集网页Cls_Filter.asp 负责过滤数据Cls_Thief.asp 前2个类的整合,并负责数据处理和缓存 演示和使用已在index.asp给出 这里的抓取多已百度为主,原因是页面简洁,容易写正则 其实很多地方,抓rss效果和效率会更好, 本人只是在上次看到一个ajax留言本后,用此练习下,类的功能很简单,仅用于练习 正则写的不好,望高手指点 演示地址:http://home.

  • asp 采集实战代码

    最近实在是太流行采集了,本人是不喜欢采集的,但对采集的原理我却很有兴趣进行研究,拿到了网上采集常用函数,对其进行了一番研究,并实战,结果成功,撇开效率问题,采集原理并不复杂,大家可以在搜索吧输入"采集"查看其原理.下面是一个采集的例子: 复制代码 代码如下: <%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%> <% Response.CodePage=65001%>  <% Respo

随机推荐