基于PHP CURL用法的深入分析
<?php
header('Context-Type:text/html;charset:gb2312;');
$urls = array(
'http://www.baidu.com/',
'http://www.pconline.com.cn/',
'http://www.163.com/'
);
$options = array(
CURLOPT_RETURNTRANSFER=>1,
CURLOPT_FOLLOWLOCATION=>1,
CURLOPT_HEADER => false,
CURLOPT_HTTPHEADER => array(
'Accept'=>' text/html, application/xhtml+xml,',
'Accept-Encoding'=>' gzip, deflate',
'Accept-Language'=>' zh-CN',
'Connection'=>' Keep-Alive',
'User-Agent'=>' Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)',
),
);
function curlMultiRequest($urls,$options=array()){
$ch = array();
$results = array();
$mh = curl_multi_init();
foreach($urls as $key=>$val){
$ch[$key] = curl_init();
if($options){
curl_setopt_array($ch[$key],$options);
}
curl_setopt($ch[$key],CURLOPT_URL,$val);
curl_multi_add_handle($mh,$ch[$key]);
}
$running = null;
do{
curl_multi_exec($mh,$running);
}while($running>0);
foreach($ch as $key=>$val){
//$results[$key] = iconv('gb2312','utf-8',curl_multi_getcontent($val));
$results[$key] = curl_multi_getcontent($val);
curl_multi_remove_handle($mh,$val);
curl_close($val);
}
curl_multi_close($mh);
return $results;
}
$results = curlMultiRequest($urls,$options);
print_r($results);
?>
相关推荐
-
PHP CURL获取cookies模拟登录的方法
要提取google搜索的部分数据,发现google对于软件抓取它的数据屏蔽的厉害,以前伪造下 USER-AGENT 就可以抓数据,但是现在却不行了.利用抓包数据发现,Google 判断了 cookies,当你没有cookies的时候,直接返回 302 跳转,而且是连续几十个302跳转,根本抓不了数据.因此,在发送搜索命令时,需要先提取 cookies 并保存,然后利用保存下来的这个cookies再次发送搜索命令即可正常抓数据了.这其实和论坛的模拟登录一个道理,先POST登录,获取cookies并
-
使用PHP curl模拟浏览器抓取网站信息
官方解释curl是一个利用URL语法在命令行方式下工作的文件传输工具.curl是一个利用URL语法在命令行方式下工作的文件传输工具.它支持很多协议:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP.curl同样支持HTTPS认证,HTTP POST方法, HTTP PUT方法, FTP上传, kerberos认证, HTTP上传, 代理服务器, cookies, 用户名/密码认证, 下载文件断点续传,上载文件断点续传, http
-
php curl选项列表(超详细)
第一类:对于下面的这些option的可选参数,value应该被设置一个bool类型的值:选项可选value值备注 CURLOPT_AUTOREFERER当根据Location:重定向时,自动设置header中的Referer:信息.CURLOPT_BINARYTRANSFER在启用CURLOPT_RETURNTRANSFER的时候,返回原生的(Raw)输出.CURLOPT_COOKIESESSION启用时curl会仅仅传递一个session cookie,忽略其他的cookie,默认状况下cUR
-
解析php扩展php_curl.dll不加载的解决方法
方法一(已通过测试)已经内置有php_curl.dll,在ext目录下,此DLL用于支持SSL和zlib.在php.ini中找到有extension=php_curl.dll, 去掉前面的注释.设置extension_dir=c:\php\ext, 刷新PHP页面时报错, 说找不到模块php_curl.dll.拷贝php_curl.dll 到windows\system32,还是同样的错. 在网上找了一下,需要将:libeay32.dll, ssleay32.dll, php5ts.dll, p
-
解析php中curl_multi的应用
相信许多人对php手册中语焉不详的curl_multi一族的函数头疼不已,它们文档少,给的例子 更是简单的让你无从借鉴,我也曾经找了许多网页,都没见一个完整的应用例子.•curl_multi_add_handle •curl_multi_close •curl_multi_exec •curl_multi_getcontent •curl_multi_info_read •curl_multi_init •curl_multi_remove_handle •curl_multi_select 一
-
PHP Curl多线程原理实例详解
给各位介绍一下Curl多线程实例与原理.不对之处请指教相信许多人对php手册中语焉不详的curl_multi一族的函数头疼不已,它们文档少,给的例子 更是简单的让你无从借鉴,我也曾经找了许多网页,都没见一个完整的应用例子.curl_multi_add_handle curl_multi_close curl_multi_exec curl_multi_getcontent curl_multi_info_read curl_multi_init curl_multi_remove_handle
-
解析PHP 使用curl提交json格式数据
复制代码 代码如下: $data = array("name" => "Hagrid", "age" => "36");$data_string = json_encode($data); $ch = curl_init('http://api.local/rest/users');curl_setopt($ch, CURLOPT_CUSTOMREQUEST, "POST");curl_seto
-
php cURL和Rolling cURL并发方式比较
在实际项目或者自己编写小工具(比如新闻聚合,商品价格监控,比价)的过程中, 通常需要从第3方网站或者API接口获取数据, 在需要处理1个URL队列时, 为了提高性能, 可以采用cURL提供的curl_multi_*族函数实现简单的并发.本文将探讨两种具体的实现方法, 并对不同的方法做简单的性能对比.1. 经典cURL并发机制及其存在的问题经典的cURL实现机制在网上很容易找到, 比如参考PHP在线手册的如下实现方式: 复制代码 代码如下: function classic_curl($urls,
-
基于PHP CURL获取邮箱地址的详解
CURL可谓居家旅行必备之杀人良药,为何如此形容?就是因为他好用方便能实现页面抓取模拟登录采集等一系列功能.记得第一次接触CURL的时候是要实现完成从邮箱用户列表的抓取.当时为了赶进度没有细细研究只是网上找了一些资料实现了功能.现在把当初的代码整理一下功能依旧能用 复制代码 代码如下: <?php error_reporting ( 0 ); set_time_limit ( 0 ); header ( "Content-Type: text/html; charset=GB2312
-
深入PHP curl参数的详解
curl_setopt (PHP 4 >= 4.0.2) curl_setopt -- 为CURL调用设置一个选项 描述 bool curl_setopt (int ch, string option, mixed value) curl_setopt()函数将为一个CURL会话设置选项.option参数是你想要的设置,value是这个选项给定的值. 下列选项的值将被作为长整形使用(在option参数中指定): CURLOPT_INFILESIZE: 当你上传一个文件到远程站点,这个选项告诉PH
-
php curl获取网页内容(IPV6下超时)的解决办法
原因:在程序中我对curl获取内容都作了较为严格的超时限制,所以就会造成无法获取内容的问题. 解决方法:设置默认访问为ipv4.php的curl设置方法如下: 复制代码 代码如下: <?php/*** IPV6下curl超时问题*/$ch = curl_init();curl_setopt ($ch, CURLOPT_URL, $url);curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true);//设置curl默认访问为IPv4if(defined('CU
-
解析php curl_setopt 函数的相关应用及介绍
一.要想使用curl_setopt 这个函数必须在服务器里边进行编译curl这个组件,怎么安装编译这个组件请具体到google搜索二.curl_setopt的php帮助文档的解释bool curl_setopt (int ch, string option, mixed value)curl_setopt()函数将为一个CURL会话设置选项.option参数是你想要的设置,value是这个选项给定的值.下列选项的值将被作为长整形使用(在option参数中指定): CURLOPT_INFILESI
-
PHP的curl实现get,post和cookie(实例介绍)
类似于dreamhost这类主机服务商,是显示fopen的使用 的.使用php的curl可以实现支持FTP.FTPS.HTTP HTPPS SCP SFTP TFTP TELNET DICT FILE和LDAP.curl 支持SSL证书.HTTP POST.HTTP PUT .FTP 上传,kerberos.基于HTT格式的上传.代理.cookie.用户+口令证明.文件传送恢复.http代理通道就最常用的来说,是基于http的 get和post方法.代码实现:1.http的get实现 复制代码
-
php使用curl模拟登录后采集页面的例子
今天接到的功课是从一个网站获取商品库存,但是这个网站需要登录,我用fsockopen传递了整个header头都没用,只能求助于curl了.附带说一下curl模块的开启办法:(1)从php目录下拷贝:libeay32.dll,ssleay32.dll 到windows目录下.(2)打开php.ini,查找"extension_dir = xxxxx",确认后面的文件目录内有php_curl.dll文件.(3)同样是php.ini,查找"extension=php_curl.dl
-
php中通过curl检测页面是否被百度收录
最近要对网站做个整理,需要检测网站内哪些页面没有被百度搜索引擎收录从而进行相关的调整.由于使用site命令一条条的去看实在是看不过来,就想到了使用php程序来批量处理一下,研究了一下,发现其实很简单,下面就将作者使用php实现的检测页面是否被百度收录的功能分享一下. 下面是具体代码: 复制代码 代码如下: <?php/** 检测网页是否被百度收录,返回1则表示收录 返回0表示没有收录* @ param string $url 待检测的网址*/function checkBaiduInclude(
-
PHP CURL CURLOPT参数说明(curl_setopt)
CURLOPT_RETURNTRANSFER 选项: curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); 如果成功只将结果返回,不自动输出任何内容. 如果失败返回FALSE curl_setopt($ch, CURLOPT_RETURNTRANSFER,0); 或着不使用这个选项: 如果成功只返回TRUE,自动输出返回的内容. 如果失败返回FALSE PHP中CURL方法curl_setopt()函数的一些参数 . bool curl_setopt (int
-
关于php 接口问题(php接口主要也就是运用curl,curl函数)
接口问题php调用接口最主要的就是使用curl抓取信息 复制代码 代码如下: $ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url); //url地址curl_setopt($ch, CURLOPT_POST, true); //是否post请求curl_setopt($ch, CURLOPT_POSTFIELDS, $data); //post请求传递的数据curl_setopt($ch, CURLOPT_HTTPHEADER, $head
-
php curl基本操作详解
cURL是与各种的服务器使用各种类型的协议进行连接和通讯的工具.它是一个强大的库支持http.https.ftp.telnet.file等协议,同时也支持HTTPS认证.HTTP POST.HTTP PUT. FTP 上传.HTTP 基于表单的上传.代理.cookies和用户名+密码的认证. 可能大家也用过file_get_contents()函数,但是这种做法如处理coockies.验证.表单提交.文件上传等等就力不从心了. 使用cURL的基本方法如下:首先修改php.ini文件的设置,找到p
随机推荐
- ASP程序中常用的脚本语言
- JAVA 多线程之信号量(Semaphore)实例详解
- 登录oracle数据库时密码忘记的解决方法
- VMware12中MS-DOS 7.10安装图文教程
- javascript笛卡尔积算法实现方法
- Js+XML 操作
- PHP中类的自动加载的方法
- 星球大战与Python之间的那些事
- Android实现本地图片选择及预览缩放效果
- 亲自动手实现Android App插件化
- javascript判断回文数详解及实现代码
- JS限制上传图片大小不使用控件在本地实现
- python下载图片实现方法(超简单)
- 简单对比分析JavaScript中的apply,call与this的使用
- 局域网的基本组成
- 关于php支持的协议与封装协议总结(推荐)
- 详解使用Spring Security OAuth 实现OAuth 2.0 授权
- Django生成PDF文档显示在网页上以及解决PDF中文显示乱码的问题
- 用pandas中的DataFrame时选取行或列的方法
- 易语言实现多线程验证代理是否有效的代码