如何利用python提取字符串中的数字

2025-04-08 15:38:56

一、isdigit()函数

isdigit()函数是检测输入字符串是否只由数字组成。如果字符串只包含数字则返回 True 否则返回 False。

dream = "123456"
print(dream.isdigit())
# 返回：True

dream = "123abc456"
print(dream.isdigit())
# 返回：False

dream = 'abcd'
print(dream.isdigit())
# 返回：False

二、filter() 函数

说明：filter() 函数用于过滤序列，过滤掉不符合条件的元素，返回一个迭代器对象；

如果要转换为列表，可以使用 list() 来转换。

该接收两个参数，第一个为函数，第二个为序列，序列的每个元素作为参数传递给函数进行判断，然后返回 True 或 False，最后将返回 True 的元素放到新列表中。

语法：

filter(function, iterable)

1、过滤出列表中的所有奇数：

def is_odd(n):
    return n % 2 == 1

tmplist = filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
newlist = list(tmplist)
print(newlist)

2、过滤出列表中的所有偶数：

l = [x for x in range(10)]
print(list(filter(lambda x : x%2 == 0, l)))

3、过滤出1~100中平方根是整数的数：

import math
def is_sqr(x):
    return math.sqrt(x) % 1 == 0

tmplist = filter(is_sqr, range(1, 101))
newlist = list(tmplist)
print(newlist)

4、删除1-100中素数

L = range(1, 101)

def isprimer(n):
    flag = 1
    for i in range(2, n):
        if n % i == 0:
            flag = 0
    if flag == 0:
        return n

print(list(filter(isprimer, L)))

5、去除空格和空值

def not_empty(s):
  return s and s.strip()

filter(not_empty, ['A', '', 'B', None, 'C', ' '])

6、高阶运用

def _odd_iter():
    n = 1
    while True:
        n = n + 2
        yield n

def _not_divisible(n):
    return lambda x : x%n>0

def primes():
    yield 2
    it = _odd_iter()
    ftr = filter(_not_divisible(2), it) #1
    while True:
        n = next(ftr )        #2
        yield n
        ftr = filter(_not_divisible(n), ftr ) #3

for n in primes():
    if n < 100:
        print('now:',n)
    else:
        break

三、提取一段字符串中的数字

列表转字符串

number = ['12', '333', '4']
number_ = "".join(number)    # 列表转字符串
print(number_)    # 123334

a = "".join(list(filter(str.isdigit, '123ab45')))
print(a)
# 返回12345

b = list(filter(str.isdigit, '123ab45'))
print(b)
# 返回['1', '2', '3', '4', '5']

time_ = "2019年09月04日 11:00"
time_filter = filter(str.isdigit, time_)

print(time_filter)           # <filter object at 0x0000019358731BE0>
print(type(time_filter))     # <class 'filter'>
time_list = list(time_filter)       # ['2', '0', '1', '9', '0', '9', '0', '4', '1', '1', '0', '0']
time_str = "".join(time_list)       # 转为str    201909041100
time_int = int(time_str)            # 转为int    201909041100

利用正则表达式

import re
str_ = "12今天333天气4不错"
number = re.findall("\d+",str_)    # 输出结果为列表
print(number)

# 输出结果：['12', '333', '4']

四、匹配指定字符串开头的数字

例如下面的string：

tensorflow:Final best valid 0 loss=0.20478513836860657 norm_loss=0.767241849151384 roc=0.8262403011322021 pr=0.39401692152023315 calibration=0.9863265752792358 rate=0.0

提取 calibration=0.9863265752792358 .

# 匹配“calibration=”后面的数字
pattern = re.compile(r'(?<=calibration=)\d+\.?\d*')
pattern.findall(string)

# ['0.9863265752792358']

五、匹配时间，17:35:24

string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training"
pattern = re.compile(r'\d{2}:\d{2}:\d{2}')
pattern.findall(string)
# ['15:28:39']

六、匹配时间，20181011 15:28:39

string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training"
pattern = re.compile(r'\d{4}\d{2}\d{2}\s\d{2}:\d{2}:\d{2}')
pattern.findall(string)
# ['20181011 15:28:39']

总结

到此这篇关于如何利用python提取字符串中的数字的文章就介绍到这了,更多相关python提取字符串中数字内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python实现将字符串中的数字提取出来然后求和

因工作原因,很久没有学习python知识了,感觉都快忘记了,前天看到一个练习题,如何将字符串中的数字提取出来,然后求和呢?下面我来解释一下如何通过python代码来实现. 题目:字符串43...3y2.f67se2.666. 将其中的所有数字提取出来然后求和思考: 1.字符串中包含了字母和数字和小数点,怎么取出来比较呢? 2.小数点连续有很多个的时候怎么处理? 3.最后取出来的数该怎么求和? 4.最后一个是小数点该怎么办? 解题思路: 1.首先通过循环遍历去将字符串中的数字取出来 2.去判断取
python正则表达式从字符串中提取数字的思路详解

python从字符串中提取数字使用正则表达式,用法如下: ## 总结 ## ^ 匹配字符串的开始. ## $ 匹配字符串的结尾. ## \b 匹配一个单词的边界. ## \d 匹配任意数字. ## \D 匹配任意非数字字符. ## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符). ## x* 匹配0次或者多次 x 字符. ## x+ 匹配1次或者多次 x 字符. ## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次. ## (a|b|c) 要么匹配
详解Python3中字符串中的数字提取方法

逛到一个有意思的博客在里面看到一篇关于ValueError: invalid literal for int() with base 10错误的解析,针对这个错误,博主已经给出解决办法,使用的是re.sub 方法 totalCount = '100abc' totalCount = re.sub("\D", "", totalCount) 但是没有说明什么含义,于是去查了其他的资料,做一下记录: 在Python3.5.2 官方文档re模块中sub函数的定义是: re
如何利用python提取字符串中的数字

目录一.isdigit()函数二.filter() 函数三.提取一段字符串中的数字四.匹配指定字符串开头的数字五.匹配时间,17:35:24 六.匹配时间,20181011 15:28:39 总结一.isdigit()函数 isdigit()函数是检测输入字符串是否只由数字组成.如果字符串只包含数字则返回 True 否则返回 False. dream = "123456" print(dream.isdigit()) # 返回:True dream = "123a
java基于正则提取字符串中的数字功能【如提取短信中的验证码】

本文实例讲述了java基于正则提取字符串中的数字功能.分享给大家供大家参考,具体如下: 使用Java正则可以很方便的从字符串中提取符合条件的内容. 1.提取字符串中所有的手机号: private void getPhoneNum(String smsBody) { Pattern pattern = Pattern.compile("(13|14|15|18)\\d{9}"); Matcher matcher = pattern.matcher(smsBody); while (mat
Mysql中实现提取字符串中的数字的自定义函数分享

因需要在mysql的数据表中某一字符串中的字段提取出数字,在网上找了一通,终于找到了一个可用的mysql函数,可以有效的从字符串中提取出数字. 该mysql提取出字符串中的数字函数如下: 复制代码代码如下: CREATE FUNCTION GetNum (Varstring varchar(50)) RETURNS varchar(30) BEGIN DECLARE v_length INT DEFAULT 0; DECLARE v_Tmp varchar(50) default ''; se
python 将字符串中的数字相加求和的实现

计算字符串中所有数字的和,字符串中有数字和字母组合而成如果出现连续数字,按照一个数操作具体解释在代码行里: def sum_str(str1): len1=len(str1) #首先将字符串str1的长度赋值给len1 sum = n = 0 #建立一个值为0的空变量sun #建立一个值为0的空变量n for i in range(len1): #用i来遍历字符串的长度 if 49 <= ord(str1[i]) <= 57: #判断字符ascii码是否在数字ascii值范围内 n = n
使用Python提取文本中含有特定字符串的方法示例

今天搞了一天的文本处理,发现python真的太适合做数据处理了.废话不多说,一起学习吧! 1.我的原始数据是这样的,如图 2.如果要提取每行含有pass的字符串,代码如下: import re filepath = "E:/untitled1/analyze_log/test.log" txt = open(filepath, "r").read() result="" test_text = re.findall(".........
python 计算一个字符串中所有数字的和实例

如下所示: # 计算一个字符串中所有数字的和 def numsum(s): sum = 0 #定义变量,准备记录数字的和 for i in range(len(s)): #遍历字符串 if s[i] >= '0' and s[i] <= '9': #如果i处的字符属于数字字符 sum = sum + int(s[i]) #将字符转成int,求和 return sum s = input("请输入一个字符串:") print(numsum(s)) 以上这篇python 计算一
python字符串中匹配数字的正则表达式

Python 正则表达式简介正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python 语言拥有全部的正则表达式功能. compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象.该对象拥有一系列方法用于正则表达式匹配和替换. re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数. 本章节给大家介
利用python对Excel中的特定数据提取并写入新表的方法

最近刚开始学python,正好实习工作中遇到对excel中的数据进行处理的问题,就想到利用python来解决,也恰好练手. 实际的问题是要从excel表中提取日期.邮件地址和时间,然后统计在一定时间段内某个人在某个项目上用了多少时间,最后做成一张数据透视表(这是问题的大致意思). 首先要做的就是数据提取了,excel中本身有一个text to column的功能,但是对列中规律性不好的数据处理效果很差,不能分割出想要的数据,所以我果断选择用python来完成. 要用的库一个是对excel读写处理
Python正则表达式匹配字符串中的数字

1.使用"\d+"匹配全数字代码: import re zen = "Arizona 479, 501, 870. Carlifornia 209, 213, 650." m = re.findall("\d+", zen) print(m) 结果: ['479', '501', '870', '209', '213', '650'] 但是上述这种方式也会引入非纯数据,例子如下: import re zen = "Arizona 47