解析php通过cookies获取远程网页的指定代码
function Steal($url, $post_data = ""){
//$header[] = "Accept: text/vnd.wap.wml,*.*";
$user_agent = "Mozilla/4.0";
$follow_loc = 1;
$cookie_file ="./tmp/cook.txt";
$ch = @curl_init();
@curl_setopt($ch, CURLOPT_URL, $url);
@curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);
@curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);
@curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
@curl_setopt($ch, CURLOPT_HEADER, $header);
@curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
@curl_setopt($ch, CURLOPT_FOLLOWLOCATION, $follow_loc);
@curl_setopt($ch, CURLOPT_TIMEOUT, 1000);
if (trim($post_data)!= "") {
@curl_setopt($ch, CURLOPT_POST, 1);
@curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
}
$result = @curl_exec($ch);
@curl_close($ch);
return $result;
}
//获取网页代码的方法
function Cut($file,$from,$end){
$message=explode($from,$file);
$message=explode($end,$message[1]);
if ($message[0] == "")
{
$message[0] = "<font color= '#ff0000'>无法获取内容</font>";
}
return $message[0];
}
//截取代码的方法
相关推荐
-
PHP CURL获取cookies模拟登录的方法
要提取google搜索的部分数据,发现google对于软件抓取它的数据屏蔽的厉害,以前伪造下 USER-AGENT 就可以抓数据,但是现在却不行了.利用抓包数据发现,Google 判断了 cookies,当你没有cookies的时候,直接返回 302 跳转,而且是连续几十个302跳转,根本抓不了数据.因此,在发送搜索命令时,需要先提取 cookies 并保存,然后利用保存下来的这个cookies再次发送搜索命令即可正常抓数据了.这其实和论坛的模拟登录一个道理,先POST登录,获取cookies并
-
PHP之COOKIE支持详解
一: 设置cookie 使用cookie前必须设置cookie. 函数原型:int setcookie(string name,string value,int expire,string path,string domain,int secure) 其中,除name外,所有的参数都是可选的,可以用空的字符串表示未设置. 属性value: 用来指定值. 属性path: 用来指定cookie被发送到服务器的哪一个目录路径下. 属性domain:能够在浏览器端对cookie的发送进行限定. expi
-
PHP setcookie指定domain参数后,在IE下设置cookie失效的解决方法
下面的代码:在chrome和firefox下可以生成三个cookie: cookie[one].cookie[two].cookie[three] 在IE下,只能生成cookie[one].cookie[two]两个cookie,第三个因为指定了".65.la",导致cookie[three]生成失败. 复制代码 代码如下: <?php setcookie("cookie[one]", "cookieone",time()+36000,&q
-
php cookie 登录验证示例代码
复制代码 代码如下: <html> <head> <title>Login</title> <meta http-equiv="Content-Type" content="text/html; charset=gb2312"> </head> <body> <form name="form1" method="post" action=
-
php中使用cookie来保存用户登录信息的实现代码
使用cookie保存页面登录信息 1.数据库连接配置页面:connectvars.php 复制代码 代码如下: <?php //数据库的位置 define('DB_HOST', 'localhost'); //用户名 define('DB_USER', 'root'); //口令 define('DB_PASSWORD', '19900101'); //数据库名 define('DB_NAME','test') ; ?> 2.登录页面:logIn.php 复制代码 代码如下: <?php
-
curl不使用文件存取cookie php使用curl获取cookie示例
复制代码 代码如下: /*-----保存COOKIE-----*/$url = 'www.xxx.com'; //url地址$post = "id=user&pwd=123456"; //POST数据$ch = curl_init($url); //初始化curl_setopt($ch,CURLOPT_HEADER,1); //将头文件的信息作为数据流输出curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); //返回获取的输出文本流curl_se
-
php第一次无法获取cookie问题处理
首先编写以下简单的代码: 复制代码 代码如下: <?php setcookie('a','value'); print $_COOKIE['a']; 第一次访问时,报错: 报错的原因是$_COOKIE['a']的值不存在.第二次访问: 问:为什么第一次访问的时候,会没有cookie呢??我不是先设置,再获取吗?? 答:使用firefox的firebug查看"网络": 客户端: 可以看到,浏览器(客户端)向服务器发出一次请求,发出请求的时候,在请求头信息中带上了各种
-
PHP setcookie设置Cookie用法(及设置无效的问题)
结果碰到一个问题,setcookie设置了Cookie并没有生效,在浏览器端也没有看到.查了一下,原来是setcookie是通过HTTP请求响应的Header来完成的,需要在请求响应内容输出之前执行(就像其他Header设定一样). 在php.ini中error_reporting = E_ALL的情况下,输出内容之后再setcookie会弹出以下提示: 复制代码 代码如下: Warning: Cannot modify header information – headers already
-
解析php通过cookies获取远程网页的指定代码
复制代码 代码如下: function Steal($url, $post_data = ""){//$header[] = "Accept: text/vnd.wap.wml,*.*"; $user_agent = "Mozilla/4.0"; $follow_loc = 1; $cookie_file ="./tmp/cook.txt"; $ch = @curl_init(); @curl_setopt($ch
-
asp获取远程网页的指定内容的实现代码
代码如下: 复制代码 代码如下: <% '用ASP获取远程目标网页指定内容,代码由广州网站建设http://www.jb51.net提供 On Error Resume Next Server.ScriptTimeOut=9999999 Function getHTTPPage(Path) t = GetBody(Path) getHTTPPage=BytesToBstr(t,"GB2312") End function Function Newstring(wstr,strng
-
asp.net中获取远程网页的内容之一(downmoon原创)
获取远程网页的内容之一(downmoon原创) 一.本机直接上网时: 获取指定远程网页内容#region 获取指定远程网页内容 复制代码 代码如下: /**//// <summary> /// 获取指定远程网页内容 /// </summary> /// <param name="strUrl">所要查找的远程网页地址</param> /// <param nam
-
获取远程网页的内容之一(downmoon原创)
获取远程网页的内容之一(downmoon原创) 一.本机直接上网时: 获取指定远程网页内容#region 获取指定远程网页内容 复制代码 代码如下: /**//// <summary> /// 获取指定远程网页内容 /// </summary> /// <param name="strUrl">所要查找的远程网页地址</param> /// <para
-
获取远程网页的内容之二(downmoon原创)
本文仅针AD下代理上网的情况: 代码如下: 1.定义变量: 定义变量#region 定义变量 复制代码 代码如下: private string strFireWallIP ...{ get ...{ return System.Configuration.ConfigurationSettings.AppSettings["strFireWallIP"];
-
asp.net下获取远程网页的内容之二(downmoon原创)
本文仅针AD下代理上网的情况: 代码如下: 1.定义变量: 定义变量#region 定义变量 复制代码 代码如下: private string strFireWallIP ...{ get ...{ return System.Configuration.ConfigurationSettings.AppSettings["strFireWallIP"];
-
Python获取远程文件大小的函数代码分享
复制代码 代码如下: def getRemoteFileSize(url, proxy=None): """ 通过content-length头获取远程文件大小 url - 目标文件URL proxy - 代理 """ opener = urllib2.build_opener() if proxy: if url.lower().startswith('https://'):
-
asp获取当前网页地址的代码
当前页地址 <%dim urlname urlname=Request.ServerVariables("QUERY_STRING")%> <%=Request.ServerVariables("SCRIPT_NAME")%><%if urlname<>"" then%>?<%=urlname%><%end if%>
-
解析PHP中的file_get_contents获取远程页面乱码的问题
PHP的file_get_contents获取远程页面内容,如果是gzip编码过的,返回的字符串就是编码后的乱码1.解决方法,找个ungzip的函数来转换下2.给你的url加个前缀,这样调用$content = file_get_contents("compress.zlib://".$url);无论页面是否经过gzip压缩,上述代码都可以正常工作!使用curl模块同样可解决问题 复制代码 代码如下: function curl_get($url, $gzip=false){
-
PHP高效获取远程图片尺寸和大小的实现方法
PHP高效获取远程图片尺寸和大小的实现方法 在这里分享一下自己的心得,希望和大家一起分享技术,如果有什么不足,还请大家指正.写出这篇目的,就是希望大家一起成长,我也相信技术之间没有高低,只有互补,只有分享,才能使彼此更加成长. 实现代码: /** * 获取远程图片的宽高和体积大小 * * @param string $url 远程图片的链接 * @param string $type 获取远程图片资源的方式, 默认为 curl 可选 fread * @param boolean $isGetF
随机推荐
- 基于Javascript实现倒计时功能
- 巧用CSS的MASK滤镜
- 星外在多台受控服务器的情况下,临时域名的解析办法
- .NET的DateTime函数获取上个月的起始和截止时间的方法
- 彻底杜绝PHP的session cookie错误
- 深入分析C++中两个大数相乘结果不正确的问题
- MySQL中ADDDATE()函数的使用教程
- android开发教程之listview显示sqlite数据
- node.js中的console.log方法使用说明
- mssql中得到当天数据的语句
- jQuery实现的瀑布流加载效果示例
- 深入理解结构体中占位符的用法
- 完美解决spring websocket自动断开连接再创建引发的问题
- Google雅虎造就了域名停放
- Apache下禁止特定目录执行PHP 提高服务器安全性
- php修改指定文件后缀的方法
- C++实现下载的代码
- 基于iScroll实现内容滚动效果
- Unity3D Shader实现贴图切换效果
- 详解如何使用koa实现socket.io官网的例子