正则表达式,提取网页中的链接地址
<td class=cate width="45%" style="word-break:break-all">
<a class=M href="http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html" onMouseDown="return aliclick(this,'?alishop=companylistcompanyname');" target="_blank" class=M>江门市蓬江区凤彩工艺厂</a>
<br>
代码如上.我请问如何用正则表达式,把"http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html"提取出来?
代码如下:
/(http:\/\/\[^" ']+)/gm
/href *= *['"]*(\S+)["']* */gm
根据不同需要选择。
相关推荐
-
ASP超级链接和HTML函数正则表达式 修正版
过滤超级链接 复制代码 代码如下: Function RegRemoveHref(HTMLstr) Set ra = New RegExp ra.IgnoreCase = True ra.Global = True ra.Pattern = "<A[^>]+>(.+?)<\/A>" RegRemoveHref = ra.replace(HTMLstr,"$1") END Function 过滤所有HTML代码 复制代码 代码如下: Fu
-
php 自写函数代码 获取关键字 去超链接
1.根据权重获取关键字 复制代码 代码如下: function getkey($contents){ $rows = strip_tags($contents); $arr = array(' ',' ',"\s", "\r\n", "\n", "\r", "\t", ">", "“", "”"); $qc_rows = str_replac
-
php正则表达式取得内容所有链接的方法
本文实例讲述了php正则表达式取得内容所有链接的方法.分享给大家供大家参考.具体如下: 这里提供二款关于php正则链接的方法,他们可以取得内容所有链接并且保存到一个数组,当然也可以把链接全部替换. 方法一,代码如下: 复制代码 代码如下: function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)<
-
php获取网页上所有链接的方法
本文实例讲述了php取得网页上所有链接的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: <?php function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'u
-
PHP使用正则表达式清除超链接文本
可以用$str = preg_replace("/<a[^>]*href=[^>]*>|<\/[^a]*a[^>]*>/i","",$strhtml); 这段来实现需求,如果想要更多解决方法,可以参看以下的. 1.删除内容中的超链接 复制代码 代码如下: ereg_replace('<a([^>]*)>([^<]*)</a>','<font color="red"
-
PHP获取短链接跳转后的真实地址和响应头信息的方法
获取到一个短连接,需要将短连接转换成真实的网址,通过查资料,发现 PHP 提供了一个函数 get_headers() ,可以完成这个任务,先把 头部信息获取到,然后再分析跳转地址即可: 复制代码 代码如下: $url = 'http://t.cn/h5mwx'; $headers = get_headers($url, TRUE); print_r($headers); //输出跳转到的网址 echo $headers['Location']; 附完整数组: 复制代码 代码如下: Array (
-
node.js正则表达式获取网页中所有链接的代码实例
实现代码 复制代码 代码如下: var http = require('http'); //定义函数var getAHref = function(htmlstr){ var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim; var arr = []; while(tem=reg.exec(htmlstr)){ arr.push(tem[2]); } return a
-
php正则表达式获取内容所有链接
方法一: function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'url'=>$arr[1]); } 方法二: /** * date 2015-07-24 **/ $site=substr($ur
-
java正则表达式匹配网页所有网址和链接文字的示例
复制代码 代码如下: import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.MalformedURLException;import java.net.URL;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.
-
php 正则表达式提取网页超级链接url的函数
复制代码 代码如下: function match_links($document) { preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$document,$links); while(list($key,$val) = each($links[2])) { if(!empty($val)) $mat
随机推荐
- 详解Spring Boot配置排序依赖技巧
- VUE2实现事件驱动弹窗示例
- php+ajax实现仿百度查询下拉内容功能示例
- mysql数据库迁移至Oracle数据库
- java 抛出异常处理的方法
- JavaScript进阶教程(第三课第二部分)第1/2页
- 用PHP代码在网页上生成图片
- Yii2增加验证码步骤详解
- python使用multiprocessing模块实现带回调函数的异步调用方法
- Python操作Word批量生成文章的方法
- Java中使用JCOM操作Office对象
- IIS启用Gzip的方法与优缺点分析
- PHP5.2中PDO的简单使用方法
- 详解WordPress中用于合成数组的wp_parse_args()函数
- python模块之StringIO使用示例
- 用vbscript实现在文本文件中搜索两个项
- Windows下利用注册表的小技巧
- 网站主机简介告诉你网站运行的原理
- Python线程的两种编程方式
- C# List<T>的用法小结