Python3正则表达式之:(?(id/name)yes-pattern|no-pattern)条件性匹配

目录
  • 1. 用途
  • 2. 参数含义
  • 3. 语法
  • 4. 用法详解
    • 4.1 把(\d+)后面的问号去掉, 也就是说必须存在group 1,不是可有可无
    •  4.2 改一下匹配字符串
    •  4.3 group可有可无的情况(group后增加问号)
    •  4.4 只匹配group 1 部分, yes部分没有匹配
  • 5.结论
    • 1. 通过4.1 4.2  4.3 对比可以发现:
    • 2. 通过4.4可知:可以仅匹配group部分, 如果yes-patternno-pattern没有匹配到, 则会仅输出group匹配的内容

1. 用途

(?(id/name)yes-pattern|no-pattern)的作用是:

对于给出的id或者name,先尝试去匹配 yes-pattern部分的内容;

如果idname条件不满足,则去匹配no-pattern部分的内容;

这句话听着还是很拗口的,或者说一下子还是很难懂的。

2. 参数含义

此处的name或id,是针对(当前位置的)条件性匹配之前的,某个已经通过group去分组的内容

name: 如果是有命名的分组,即named group,则对应的该分组就有对应的name,即此处所指的就是对应的name;

id: 如果是无命名的分组,即unnamed group,则对应的该分组也有对应的分组的编号,称为group的number,也叫做id,对应的就是这里的id;

yes-pattern: 如果前面的group匹配成功,则此处,就执行yes-pattern的匹配;

no-pattern: 如果前面group匹配不成功,即没有找到符合该的group内容,则就匹配no-pattern;

注意: 上面的yes-patternno-pattern,都是普通的正则表达式,用来匹配所需的内容。

3. 语法

如果存在no-pattern,则前面要有个竖杠'|',用来分隔yes-patternno-pattern

如果不想匹配no-pattern的部分,则可以连同'|'一起不写。

实例:

>>> re.search(r'(\d+)?(?(1)\w+|jb51\.\w+)', 'jb51.com')>>> re.search(r'(\d+)?(?(1)\w+)', '100jb51')

其中的?(1)代表序号为1的group, 也就是上面(\d+), 第二个表达式中就没有使用no-pattern

4. 用法详解

还是上面的例子, 我们变换一下, 用实例探索它们的详细用法及技巧

4.1 把(\d+)后面的问号去掉, 也就是说必须存在group 1,不是可有可无

执行:

>>> re.search(r'(\d+)(?(1)\w+|jb51\.\w+)', 'jb51.com')
>>>

整体规则匹配失败,返回为空,no-pattern部分并没有按照预想执行。

 4.2 改一下匹配字符串

>>> re.search(r'(\d+)(?(1)\w+|jb51\.\w+)', '1jb51.com')

可以匹配到, group1和yes部分都匹配到了

 4.3 group可有可无的情况(group后增加问号)

>>> re.search(r'(\d+)?(?(1)\w+|jb51\.\w+)', 'jb51')
>>>

如果group没有匹配到,且它可有可无, 那么group会被认为匹配不成功,继续执行no-pattern部分匹配

 4.4 只匹配group 1 部分, yes部分没有匹配

>>> re.search(r'(\d+)(?(1)\w+|jb51\.\w+)', '1000')

只匹配group 1 部分, yes部分没有匹配,也是有匹配结果的, 那说明yes-pattern和no-pattern不一定必须匹配成功

5.结论

1. 通过4.1 4.2  4.3 对比可以发现:

当该特殊规则中的作为判断条件的组本身不允许为空的时候,在该组对目标字符串匹配为空的情况下,整体规则匹配失败,所以后面的作为整体一部分的特殊规则自然也就无效了。所以要想特殊规则的no-pattern生效,必须判断条件对应组匹配数可以为0。

2. 通过4.4可知:可以仅匹配group部分, 如果yes-patternno-pattern没有匹配到, 则会仅输出group匹配的内容

更多关于Python3正则表达式的相关教程请查看下面的相关链接

(0)

相关推荐

  • 对python3中的RE(正则表达式)-详细总结

    1.引入正则模块(Regular Expression) 要使用python3中的RE则必须引入 re模块 import re #引入正则表达式 2.主要使用的方法 match(), 从左到右进行匹配 #pattern 为要校验的规则 #str 为要进行校验的字符串 result = re.match(pattern, str) #如果result不为None,则group方法则对result进行数据提取 3. 正则表达式 1️⃣单字符匹配规则 字符 功能 . 匹配任意1个字符(除了\n) []

  • python3.x提取中文的正则表达式示例代码

    实例一: 读取txt文件中含有中文的字符 import re ##此处使用的编辑器是python3.x d="[\u4e00-\u9fa5]+" #中文匹配的符号 f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档 #文档内容: Hello world China 你好,你好好 This is a txt File s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3 #此处涉及到文本的读取工作

  • 详解Python3中的正则表达式的基本用法

    正则表达式 本节我们看一下正则表达式的相关用法,正则表达式是处理字符串的强大的工具,它有自己特定的语法结构,有了它,实现字符串的检索.替换.匹配验证都不在话下. 当然对于爬虫来说,有了它,我们从HTML里面提取我们想要的信息就非常方便了. 实例引入 说了这么多,可能我们对它到底是个什么还是比较模糊,下面我们就用几个实例来感受一下正则表达式的用法. 我们打开开源中国提供的正则表达式测试工具http://tool.oschina.net/regex/,打开之后我们可以输入待匹配的文本,然后选择常用的

  • python3爬虫之入门基础和正则表达式

    前面的python3入门系列基本上也对python入了门,从这章起就开始介绍下python的爬虫教程,拿出来给大家分享:爬虫说的简单,就是去抓取网路的数据进行分析处理:这章主要入门,了解几个爬虫的小测试,以及对爬虫用到的工具介绍,比如集合,队列,正则表达式: 用python抓取指定页面: 代码如下: import urllib.request url= "http://www.baidu.com" data = urllib.request.urlopen(url).read()# d

  • pycharm使用正则表达式批量添加print括号完美从python2迁移到python3

    网络下载的python代码,版本参差,从python2.x迁移python3.x的过程中,存在print语法问题,即python2.x中print无括号,python3.x中print有括号. 逐行添加括号未免效率过低,因此,可使用正则表达式的方法,提供解决方法. 1.在pycharm编译器中,Ctrl+R调出替换功能框,勾选"Regex",选择正则表达式替换方法 2. 从上到下,第一个搜索框输入 print (.*?);?$ 正则表达式 含义 . 匹配任意字符,除了换行符,当re.D

  • Python3使用正则表达式爬取内涵段子示例

    本文实例讲述了Python3使用正则表达式爬取内涵段子的方法.分享给大家供大家参考,具体如下: 似乎正则在爬虫中用的不是很广泛,但是也是基本功需要我们去掌握. 先将内涵段子网页爬取下来,之后利用正则进行匹配,匹配完成后将匹配的段子写入文本文档内.代码如下: # -*- coding:utf-8 -*- from urllib import request as urllib2 import re # 利用正则表达式爬取内涵段子 url = r'http://www.neihanpa.com/ar

  • python3 正则表达式基础廖雪峰

    字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在.比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用. 正则表达式是一种用来匹配字符串的强有力的武器.它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它"匹配"了,否则,该字符串就是不合法的. 所以我们判断一个字符串是否是合法的Email的方法是: 创建一个匹配Email的正则表达式:

  • Python3正则表达式之:(?(id/name)yes-pattern|no-pattern)条件性匹配

    目录 1. 用途 2. 参数含义 3. 语法 4. 用法详解 4.1 把(\d+)后面的问号去掉, 也就是说必须存在group 1,不是可有可无  4.2 改一下匹配字符串  4.3 group可有可无的情况(group后增加问号)  4.4 只匹配group 1 部分, yes部分没有匹配 5.结论 1. 通过4.1 4.2  4.3 对比可以发现: 2. 通过4.4可知:可以仅匹配group部分, 如果yes-pattern和no-pattern没有匹配到, 则会仅输出group匹配的内容

  • JAVA正则表达式 Pattern和Matcher

    1.简介: java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式. Matcher 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查. 首先一个Pattern实例订制了一个所用语法与PERL的类似的正则表达式经编译后的模式,然后一个Matcher实例在这个给定的Pattern实例的模式控制下进行字

  • 详解Java正则表达式中Pattern类和Matcher类

    前言 本文将介绍Java正则表达式中的Pattern类与Matcher类.首先我们要清楚指定为字符串的正则表达式必须首先被编译为pattern类的实例.因此如何更好的了解这两个类,是编程人员必须知道的. 以下我们就分别来看看这两个类: 一.捕获组的概念 捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的.例如,在表达式 ((A)(B(C)))中,存在四个这样的组: 1 ((A)(B(C))) 2 (A) 3 (B(C)) 4 (C) 组零始终代表整个表达式. 以 (?) 开头的组是纯的

  • Java正则表达式Pattern和Matcher原理详解

    这篇文章主要介绍了Java正则表达式Pattern和Matcher原理详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 基本使用 Scanner中的使用正则表达式 //Scanner 支持的分组 Scanner cin=new Scanner("red a bbc").useDelimiter("\\s*a\\s*"); System.out.println(cin.next()); System.out.pri

  • Java正则表达式之Pattern类实例详解

    目录 前言 Pattern 概述 Pattern 匹配模式(Pattern flags) 代码示例 多行模式:Pattern.MULTILINE 示例 忽略大小写:Pattern.CASE_INSENSITIVE 示例 启用注释:Pattern.COMMENTS 示例 启用 dotall 模式:Pattern.DOTALL 示例 平白字符模式 模式:Pattern.LITERAL 示例 附:贪婪匹配与懒惰匹配 总结 前言 这个系列的文章我们使用以下的顺序进行讲解: Pattern 详解: Mat

随机推荐