Python实现对字符串中字符提取校验

2026-03-30 04:52:46

众所周知，python之所以很方便在一定程度上是因为随时都可能有人又创作了一个好用又方便的python非标准库。

正好有一个小需求需要校验一个python字符串中是否存在某种类型的字符，需求其实不难但是自己写的话又要耗时费力，可能还存在BUG需要测试。

于是想找找看有没有大佬已经实现这样的python非标准库，还真给找到了就是-txdpy，先安装起来吧，确实比较方便给大佬递茶！

pip install txdpy -i https://pypi.tuna.tsinghua.edu.cn/simple/

安装完成之后将txdpy导入到我们的代码块中，对常用的函数进行测试执行是否能够完成我们的常规逻辑处理。

# Importing the txdpy module and renaming it to tx.
import txdpy as tx

from loguru import logger

# A string that is used to test the functions in the txdpy module.
common_str = '123er45io9@Python 集中营.'

def is_num():
    """
    It returns True if the input is a number, and False otherwise
    """

    # A logging statement.
    logger.info('是否纯数字字符串：{0}'.format(tx.is_num(common_str)))

# It returns True if the input is a number, and False otherwise.
is_num()

结果执行之后以外情况发生了，依次报错没有导入下面的三个模块。说明在我们的txdpy模块中调用了下面的三个模块，没有关系，若是没有安装下面三个模块的话安装一下即可。

File "C:\software\python\lib\site-packages\txdpy\requests_operation.py", line 1, in <module>
    from lxml import etree
ModuleNotFoundError: No module named 'lxml'

File "C:\software\python\lib\site-packages\txdpy\PyReBf.py", line 1, in <module>
    import mmh3
ModuleNotFoundError: No module named 'mmh3'

  File "C:\software\python\lib\site-packages\txdpy\PyReBf.py", line 2, in <module>
    import redis
ModuleNotFoundError: No module named 'redis'

将报错的上面三个模块使用pip的方式进行安装，默认还是清华大学的镜像站。如果没有报错证明已经安装了，直接执行就OK了。

pip install lxml -i https://pypi.tuna.tsinghua.edu.cn/simple/

pip install mmh3 -i https://pypi.tuna.tsinghua.edu.cn/simple/

pip install redis -i https://pypi.tuna.tsinghua.edu.cn/simple/

安装成功了这个时候环境是没啥问题，我们接着执行is_num函数，返回结果为False，说明不是纯数字的字符串，结果正确。

2022-09-17 20:11:05.245 | INFO | __main__:is_contain_num:26 - 是否包含数字：False

接下来再执行几个字符串是否为某种纯字符的校验，然后依次使用logger模块打印出结果查看是否能够完成准确的校验。

def is_letter():
    """
    It checks if the input is a letter.
    """

    # A logging statement.
    logger.info('是否纯字母字符串：{0}'.format(tx.is_letter(common_str)))

# It checks if the input is a letter.
is_letter()

2022-09-17 20:24:36.232 | INFO     | __main__:is_letter:66 - 是否纯字母字符串：False

def is_num_letter():
    """
        It checks if the input is a letter or num.
    """

    common_str = '123com'

    logger.info('是否数字、字母字符串：{0}'.format(tx.is_num_letter(common_str)))

is_num_letter()

2022-09-17 20:27:44.313 | INFO     | __main__:is_num_letter:80 - 是否数字、字母字符串：True

除此之外，还有几个比较使用的函数就是可以将字符串中的某种类型的字符串通过函数提取出来，它的底层是通过不同的正则表达式来实现的，不用我们再去考虑使用各式各样的正则表达式来匹配数据了。

common_str = '123er45io9@Python 集中营.'

def get_chinese():
    """
    It returns the string "Chinese"
    """

    # A logging statement.
    logger.info('提取到字符串中的中文是：{0}'.format(tx.get_chinese(common_str)))

# It returns the string "Chinese"
get_chinese()

2022-09-17 20:39:40.356 | INFO     | __main__:get_chinese:102 - 提取到字符串中的中文是：['集中营']

def get_num():
    """
    It returns the number of times the function has been called.
    """

    # A variable that is used to store the number of times the function has been called.
    logger.info('提取到字符串中的中文是：{0}'.format(tx.get_num(common_str)))

get_num()

2022-09-17 20:41:27.998 | INFO     | __main__:get_num:115 - 提取到字符串中的中文是：['123', '45', '9']

以上是我们使用到的一些比较的常规的字符串处理的用法，还有更多的比较方便的函数的调用大家可以在使用中多看看，可以为我们的业务开发节省更多的时间

到此这篇关于Python实现对字符串中字符提取校验的文章就介绍到这了,更多相关Python字符提取校验内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

如何利用python提取字符串中的数字

目录一.isdigit()函数二.filter() 函数三.提取一段字符串中的数字四.匹配指定字符串开头的数字五.匹配时间,17:35:24 六.匹配时间,20181011 15:28:39 总结一.isdigit()函数 isdigit()函数是检测输入字符串是否只由数字组成.如果字符串只包含数字则返回 True 否则返回 False. dream = "123456" print(dream.isdigit()) # 返回:True dream = "123a
python利用正则表达式提取字符串

前言正则表达式的基础知识就不说了,有兴趣的可以点击这里,提取一般分两种情况,一种是提取在文本中提取单个位置的字符串,另一种是提取连续多个位置的字符串.日志分析会遇到这种情况,下面我会分别讲一下对应的方法. 一.单个位置的字符串提取这种情况我们可以使用(.+?)这个正则表达式来提取. 举例,一个字符串"a123b",如果我们想提取ab之间的值123,可以使用findall配合正则表达式,这样会返回一个包含所以符合情况的list. 代码如下: import re str = "
Python利用正则表达式从字符串提取数字

目录前言利用正则表达式从字符串提取数字附python正则表达式抽取文本中的时间日期总结前言正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python 语言拥有全部的正则表达式功能. 利用正则表达式从字符串提取数字主要用到下面几个函数 (1)compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象.该对象拥有一系列方法用于正则
python如何用正则表达式提取字符串

目录用正则表达式提取字符串 1. 单个位置的字符串提取 2. 连续多个位置的字符串提取用正则表达式提取字符串中的整数总结用正则表达式提取字符串在日常工作中经常遇见在文本中提取特定位置字符串的需求. python的正则性能好,很适合做这类字符串的提取,正则表达式的提取一般分两种情况,一种是提取在文本中提取单个位置的字符串,另一种是提取连续多个位置的字符串. 日志分析会遇到这种情况. 1. 单个位置的字符串提取这种情况我们可以使用(.+?)这个正则表达式来提取. 举例,一个字符串"a12
使用Python提取文本中含有特定字符串的方法示例

今天搞了一天的文本处理,发现python真的太适合做数据处理了.废话不多说,一起学习吧! 1.我的原始数据是这样的,如图 2.如果要提取每行含有pass的字符串,代码如下: import re filepath = "E:/untitled1/analyze_log/test.log" txt = open(filepath, "r").read() result="" test_text = re.findall(".........
python正则表达式从字符串中提取数字的思路详解

python从字符串中提取数字使用正则表达式,用法如下: ## 总结 ## ^ 匹配字符串的开始. ## $ 匹配字符串的结尾. ## \b 匹配一个单词的边界. ## \d 匹配任意数字. ## \D 匹配任意非数字字符. ## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符). ## x* 匹配0次或者多次 x 字符. ## x+ 匹配1次或者多次 x 字符. ## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次. ## (a|b|c) 要么匹配
python实现将字符串中的数字提取出来然后求和

因工作原因,很久没有学习python知识了,感觉都快忘记了,前天看到一个练习题,如何将字符串中的数字提取出来,然后求和呢?下面我来解释一下如何通过python代码来实现. 题目:字符串43...3y2.f67se2.666. 将其中的所有数字提取出来然后求和思考: 1.字符串中包含了字母和数字和小数点,怎么取出来比较呢? 2.小数点连续有很多个的时候怎么处理? 3.最后取出来的数该怎么求和? 4.最后一个是小数点该怎么办? 解题思路: 1.首先通过循环遍历去将字符串中的数字取出来 2.去判断取
Python 结构化字符串中提取数据详情

目录前言从结构化字符串中提取数据字符串解析前言在许多自动化任务中,我们都需要从已知格式结构化的输入文本中提取相关信息.例如,我们可能需要在一段电影评论数据中提取观影时间.电影名.评分等信息,以便存储后进行进一步分析.在本节中,我们将以提取电影评论数据信息为例讲解如何从结构化字符串中提取数据. 从结构化字符串中提取数据假设我们具有以下结构的电影评分数据,我们需要解析存储观影时间.电影名.评分等信息: [<Timestamp>] - MOVIE ID: <movie id>
Python实现判断字符串中包含某个字符的判断函数示例

本文实例讲述了Python实现判断字符串中包含某个字符的判断函数.分享给大家供大家参考,具体如下: #coding=utf8 #参数包含两个: #containVar:查找包含的字符 #stringVar:所要查找的字符串 def containVarInString(containVar,stringVar): try: if isinstance(stringVar, str): if stringVar.find(containVar): return True else: return
Python统计一个字符串中每个字符出现了多少次的方法【字符串转换为列表再统计】

本文实例讲述了Python统计一个字符串中每个字符出现了多少次的方法.分享给大家供大家参考,具体如下: #coding=utf-8 #统计一个字符串中的每一个字符出现了多少次 #定义一个字符串 str = 'abbcccdddd' #在字符串的每一个字符之间插入一个空格组成一个新的字符串 str = ' '.join(str) #打印新的字符串看看 print('str = ',str) #将新字符串按空格分割成一个列表 li = str.split(' ') #打印新的列表 print('li
Python实现计算字符串中出现次数最多的字符示例

本文实例讲述了Python实现计算字符串中出现次数最多的字符.分享给大家供大家参考,具体如下: 1. 看了网上挺多写的方法都没达到我所需要的效果,我干脆自己写了个方法共享给大家 ee = 'aa111(((bbhhhhhh%jjjjjj%(ccc((vvvv22' cc='11222333' def max_letter_count(n): list4 = [] list1 = [] list2 = [] for i in n: list3 = [] count_max = n.count(i)
Python删除字符串中字符的四种方法示例代码

目录一.删除字符串两端的一种或多种字符二.删除字符串中单个固定位置的字符三.删除字符串中任意位置的一种或多种字符四.同时删除字符串内的多种不同字符一.删除字符串两端的一种或多种字符 #strip().lstrip().rstrip()方法:(默认删除空格符) A.list.strip(字符):删除字符串两端的一种或多种字符: 例:删除字符串s两端 a 或 b 或 c 字符: s = 'abbmmmcccbbb' s1 = s.strip('abc') print(s1) #输出:mmm
python 正则表达式获取字符串中所有的日期和时间

提取日期前的处理 1.处理文本数据的日期格式统一化 text = "2015年8月31日,衢州元立金属制品有限公司仓储公司(以下简称元立仓储公司)成品仓库发生一起物体打击事故,造成直接经济损失95万元." text1 = "2015/12/28下达行政处罚决定书" text2 = "2015年8月发生一起物体打击事故" # 对文本处理一下 # 2015-8-31 2015-12-28 text = text.replace("年&quo
python 计算一个字符串中所有数字的和实例

如下所示: # 计算一个字符串中所有数字的和 def numsum(s): sum = 0 #定义变量,准备记录数字的和 for i in range(len(s)): #遍历字符串 if s[i] >= '0' and s[i] <= '9': #如果i处的字符属于数字字符 sum = sum + int(s[i]) #将字符转成int,求和 return sum s = input("请输入一个字符串:") print(numsum(s)) 以上这篇python 计算一
python获取指定字符串中重复模式最高的字符串方法

给定一个字符串,如何得到其中重复模式最高的子字符串,我采用的方法是使用滑窗机制,对给定的字符串切分,窗口的大小从1增加到字符串长度减1,将所有的得到的切片统计结果,在这里不考虑单个字符的重复模式,好了,很简单看具体实现: #!usr/binenv python #encoding:utf-8 ''' __Author__:沂水寒城统计一个给定字符串中重复模式数量得到最高重复模式串 ''' def slice(num_str,w): ''' 对输入的字符串滑窗切片返回结果列表 ''' resul

Python实现对字符串中字符提取校验

相关推荐

随机推荐