正则表达式,提取网页中的链接地址
<td class=cate width="45%" style="word-break:break-all">
<a class=M href="http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html" onMouseDown="return aliclick(this,'?alishop=companylistcompanyname');" target="_blank" class=M>江门市蓬江区凤彩工艺厂</a>
<br>
代码如上.我请问如何用正则表达式,把"http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html"提取出来?
代码如下:
/(http:\/\/\[^" ']+)/gm
/href *= *['"]*(\S+)["']* */gm
根据不同需要选择。
相关推荐
-
php 正则表达式提取网页超级链接url的函数
复制代码 代码如下: function match_links($document) { preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$document,$links); while(list($key,$val) = each($links[2])) { if(!empty($val)) $mat
-
php获取网页上所有链接的方法
本文实例讲述了php取得网页上所有链接的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: <?php function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'u
-
php 自写函数代码 获取关键字 去超链接
1.根据权重获取关键字 复制代码 代码如下: function getkey($contents){ $rows = strip_tags($contents); $arr = array(' ',' ',"\s", "\r\n", "\n", "\r", "\t", ">", "“", "”"); $qc_rows = str_replac
-
PHP使用正则表达式清除超链接文本
可以用$str = preg_replace("/<a[^>]*href=[^>]*>|<\/[^a]*a[^>]*>/i","",$strhtml); 这段来实现需求,如果想要更多解决方法,可以参看以下的. 1.删除内容中的超链接 复制代码 代码如下: ereg_replace('<a([^>]*)>([^<]*)</a>','<font color="red"
-
ASP超级链接和HTML函数正则表达式 修正版
过滤超级链接 复制代码 代码如下: Function RegRemoveHref(HTMLstr) Set ra = New RegExp ra.IgnoreCase = True ra.Global = True ra.Pattern = "<A[^>]+>(.+?)<\/A>" RegRemoveHref = ra.replace(HTMLstr,"$1") END Function 过滤所有HTML代码 复制代码 代码如下: Fu
-
node.js正则表达式获取网页中所有链接的代码实例
实现代码 复制代码 代码如下: var http = require('http'); //定义函数var getAHref = function(htmlstr){ var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim; var arr = []; while(tem=reg.exec(htmlstr)){ arr.push(tem[2]); } return a
-
php正则表达式取得内容所有链接的方法
本文实例讲述了php正则表达式取得内容所有链接的方法.分享给大家供大家参考.具体如下: 这里提供二款关于php正则链接的方法,他们可以取得内容所有链接并且保存到一个数组,当然也可以把链接全部替换. 方法一,代码如下: 复制代码 代码如下: function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)<
-
PHP获取短链接跳转后的真实地址和响应头信息的方法
获取到一个短连接,需要将短连接转换成真实的网址,通过查资料,发现 PHP 提供了一个函数 get_headers() ,可以完成这个任务,先把 头部信息获取到,然后再分析跳转地址即可: 复制代码 代码如下: $url = 'http://t.cn/h5mwx'; $headers = get_headers($url, TRUE); print_r($headers); //输出跳转到的网址 echo $headers['Location']; 附完整数组: 复制代码 代码如下: Array (
-
php正则表达式获取内容所有链接
方法一: function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'url'=>$arr[1]); } 方法二: /** * date 2015-07-24 **/ $site=substr($ur
-
java正则表达式匹配网页所有网址和链接文字的示例
复制代码 代码如下: import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.MalformedURLException;import java.net.URL;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.
随机推荐
- jQuery学习笔记(1)--用jQuery实现异步通信(用json传值)具体思路
- 使用正则表达式的格式化与高亮显示json字符串
- FLEX TitleWindow之间数据传输的示例
- 详解Oracle在out参数中访问光标
- js获取下拉列表框<option>中的value和text的值示例代码
- 在ASP.NET中插入flash代码实例
- PHP排序算法类实例
- Android编程记录ListView标记行状态的方法
- C#提取网页中超链接link和text部分的方法
- Android 调用系统照相机拍照和录像
- PHP基于IMAP收取邮件的方法示例
- Node.js抓取中文网页乱码问题和解决方法
- Linux下的Grep命令使用方法详细介绍
- nodejs个人博客开发第三步 载入页面
- ASP 代码出现80040e14错误的解决方法
- 将ACCESS转化成SQL2000要注意的问题
- [基础知识]Linux新手系列之四
- Linux操作系统定时调度系统Cron深入介绍
- 开放封闭原则_动力节点Java学院整理
- 详解Android自定义View--自定义柱状图