正则表达式查找相似单词的方法

本文通过展示各种不同的正则表达式结构,以及在实际应用中会用到的技巧,熟悉掌握正则表达式的应用。

问题描述:

在这个实例中你要解决如下几个问题。

1、想要在一个字符串中找到所有的color和colour。

2、想要找到这3个以"at”结尾的单词中的任意一个:bat、cat或rat。

3、想要找到以phobia结尾的单词。

4、想要找的名字"Steven”的常见变形:Steve、Steven和Stephen。

5、想要匹配术语"regular expression”的所有常见形式。

解决方案:

下面按顺序列出用来解决这些问题的正则表达式。所有这些解决方案中都使用了不区分大小写的选项。

问题1:color和colour

\bcolou?r\b

正则选项:不区分大小写

正则流派:.NET、Java、JavaScript、PCRE、Perl、Python、Ruby

问题2:bat、cat或rat

\b[bcr]at\b

正则选项:不区分大小写

问题3:以"phobia"结尾的单词

\b\w*phobia\b

正则选项:不区分大小写

问题4:Steve、Steven和Stephen

\bSte(?:ven?|phen)\b

问题5:"regular expression”的变体

\breg(?:ular·expressions?|ex(?:ps?|e[sn])?)\b

正则选项:不区分大小写

正则流派:.NET、Java、JavaScript、PCRE、Perl、Python、Ruby

解析:

\b                            #判断一个单词边界位置

reg                        #匹配"reg”

(?:                         #分组但是不捕获

ular\                    #        匹配"ular”

expressions?        #       匹配"expression”或"expressions"

|                           #  或者:

ex                         #       匹配"ex”

(?:                        #        分组但是不捕获

ps?                     #            匹配"p”或"ps"

|                           #       或者:

e[sn]                   #            匹配"es”或"en"

)?                          #         结束非捕获分组,整个分组为可选

)                             # 非捕获分组的结束

\b                            #判断一个单词边界位置

注:这5个正则表达式都使用了单词边界(<\b>)确保只会匹配整个单词。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • JS查找英文文章中出现频率最高的单词

    下面这个函数是js查找一篇英文文章中出现频率最高的单词(由26个英文字母大小写构成),输出该单词及出现次数,不区分大小写,主要是正则的运用: function counts(article){ article = article.trim().toUpperCase(); var array = article.match(/[A-z]+/g); article = " "+array.join(" ")+" "; var max = 0,wor

  • Javascript中查找不以XX字符结尾的单词示例代码

    首先,让我声明一下,我在写这篇文章之前花了2个多小时在弄正则表达式.悲~悲~悲~ 按照一般的思路,先来看看其他几个插找方式: 我以字符串 复制代码 代码如下: var str = "eattd gebcat gedat jadu geat beu"; 為例子. 1.以"ge"為开头的,结果应该是"gebcat, gedat, geat".因為单词以"ge"开头,则我可以放入一个新的数组供以后使用. 复制代码 代码如下: var

  • 正则表达式查找相似单词的方法

    本文通过展示各种不同的正则表达式结构,以及在实际应用中会用到的技巧,熟悉掌握正则表达式的应用. 问题描述: 在这个实例中你要解决如下几个问题. 1.想要在一个字符串中找到所有的color和colour. 2.想要找到这3个以"at"结尾的单词中的任意一个:bat.cat或rat. 3.想要找到以phobia结尾的单词. 4.想要找的名字"Steven"的常见变形:Steve.Steven和Stephen. 5.想要匹配术语"regular expressi

  • Python查找相似单词的方法

    本文实例讲述了Python查找相似单词的方法.分享给大家供大家参考.具体分析如下: 问题: 给你一个单词a,如果通过交换单词中字母的顺序可以得到另外的单词b,那么定义b是a的兄弟单词.现在给你一个字典,用户输入一个单词,让你根据字典找出这个单词有多少个兄弟单词. Python代码如下: from itertools import tee,izip from collections import defaultdict def pairwise(iterable): a, b = tee(iter

  • Java正则表达式实现在文本中匹配查找换行符的方法【经典实例】

    本文实例讲述了Java正则表达式实现在文本中匹配查找换行符的方法.分享给大家供大家参考,具体如下: 默认情况下,正则表达式 ^ 和 $ 忽略行结束符,仅分别与整个输入序列的开头和结尾匹配.如果激活 MULTILINE 模式,则 ^ 在输入的开头和行结束符之后(输入的结尾)才发生匹配.处于 MULTILINE 模式中时,$ 仅在行结束符之前或输入序列的结尾处匹配. NLMatch.java: package nlMatch; import java.util.regex.Pattern; /**

  • 在python中使用正则表达式查找可嵌套字符串组

    在网上看到一个小需求,需要用正则表达式来处理.原需求如下: 找出文本中包含"因为--所以"的句子,并以两个词为中心对齐输出前后3个字,中间全输出,如果"因为"和"所以"中间还存在"因为""所以",也要找出来,另算一行,输出格式为: 行号 前面3个字 *因为* 全部 &所以& 后面3个字(标点符号算一个字) 2 还不是 *因为* 这里好, &所以& 没有人 实现方法如下: #e

  • swift 3.0 正则表达式查找/替换字符的实现代码

    1.什么是正则表达式 正则表达式,又称正规表示法.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念. 正则表达式使用单个字符串来描述.匹配一系列符合某个句法规则的字符串. 在很多文本编辑器里,正则表达式通常被用来检索.替换那些符合某个模式的文本. 2.正则表达式的字符组成 普通字符[a~z].特殊字符(称为"元字符") 3.支持 几乎所有的程序设计语言都支持正则表达式,例如:OC,swift,java,c#,

  • js正则表达式中test,exec,match方法的区别说明

    js正则表达式中test,exec,match方法的区别说明 test test 返回 Boolean,查找对应的字符串中是否存在模式.var str = "1a1b1c";var reg = new RegExp("1.", "");alert(reg.test(str)); // true exec exec 查找并返回当前的匹配结果,并以数组的形式返回.var str = "1a1b1c";var reg = new R

  • ASP 正则表达式常用的几种方法(execute、test、replace)

    RegExp就是建立正则的对像. 如: Set regEx = New RegExp regEx.Pattern 就是来设置正则的模式的, 如: regEx.Pattern ="/d+" regEx.IgnoreCase = True ' 设置是否区分大小写 regEx.Global = True ' 设置全程可用性. RegExp对像有3种方法,分别是execute.test.replace. test方法是对指定的字符串执行一个正则表达式搜索,并返回一个 Boolean 值指示是否

  • JS正则表达式获取分组内容的方法详解

    支持多次匹配的方式: 复制代码 代码如下: var testStr = "now test001 test002";   var re = /test(\d+)/ig;    var r = "";   while(r = re.exec(testStr)) {       alert(r[0] + "  " + r[1]);   } 此外也可以用testStr.match(re),但是这样的话就不能有g的选项,而且只能得到第一个匹配. 另外备忘

  • js使用正则子表达式匹配首字母与尾字母相同单词的方法

    本文实例讲述了js使用正则子表达式匹配首字母与尾字母相同单词的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: <html> <head> <script type="text/javascript"> //子表达式实例:找到首字母与尾字母相同的单词 function t1(){  var con = document.getElementsByName('content')[0].value;  var reg = /\b(\w

  • 详解正则表达式Matcher类中group方法

    前言 同事把一个excel表给我,里面的数据大概有几千的样子吧.自己需要把里面的数据一个一个拿出来做一个http请求,对得到的结果进行过滤,然后再写到上面去.这是就涉及到用脚本来进行操作了,于是自己搞了一个Java的脚本出来,里面涉及到一些正则表达式,自己虽然说会,但是一直对 Matcher类中的group方法 不太了解.网上的博客也没有写的特别清楚,于是有了此文. 0|1Pattern 和 Matcher 在java.util.regex 包下 Pattern(模式类) : 用来表达和陈述所要

随机推荐