使用Python去除字符串中某个字符的多种实现方式比较

目录
  • 1、如何去掉字符串中不需要的字符?
  • 2、代码演示
  • 总结

1、如何去掉字符串中不需要的字符?

实际案例:

(1)过滤掉用户输入前后多余的空白字符:' nick2008@gmail.com '

(2)过滤某windows下编辑文本中的'\r':'hello world\r\n'

(3)去掉文本中的unicode组合符号(调音):u'ní hǎo, chī fàn'(或 èěéēàǎā)

解决方案;

方法1:字符串strip(),lstrip(),rstrip()方法去掉字符串两端字符。

方法2:删除单个固定位置的字符,可以使用切片+拼接的方式。

方法3:字符串的replace()替换方法或正则表达式re.sub()删除任意位置字符。(通用)

方法4:字符串translate()方法,可以同时删除多种不同字符。

2、代码演示

# 方法1:strip类的方法
# 去掉字符串两端的字符
s = '  abc  123   '
'''
str.strip方法介绍:
    strip([chars]) -> string or unicode
    chars不指定默认情况下去掉空白字符(空格,\n,\t,\r)
'''
# 去掉两端空白,但保留了中间的空白
print(s.strip())
# 只去掉左端的空白
print(s.lstrip())
# 只去掉右端的空白
print(s.rstrip())
s2 = '---abc+++'
# 去掉s2中的加减
print(s2.strip('-+'))

# 方法2:删除固定位置字符,切片+拼接
s3 = 'abc:123'
# 只删除固定位置的冒号
s4 = s3[0:3] + s3[4:]
print(s4)

# 方法3:
'''
因为第1种方法不能删除中间的某些字符,只能在两端进行删除,
第3种就能完成删除中间某些字符的事情。
'''
s5 = '\tabc\t123\txyz'
# 清除s5中的所有\t,可以使用字符串替换replace,
# 但是这种方式只能替换一种
print(s5.replace('\t', ''))
s6 = '\tabc\t123\txyz\ropq\r'
import re

# 去除s6中的\t和\r
print(re.sub('[\t\r]', '', s6))

# 方法4:
'''
str.translate方法介绍:
    S.translate(table) -> string
    table如果是None不做任何映射,如果存在就是一个字符映射到另一个字符上去的表;
'''
s7 = 'abc1230323xyz'
# 现在对s7字符串进行加密,加密规则是将其中a全部替换成x,
# b替换成y,c替换成z,反过来将其中的xyz分别替换成abc

# 构建映射表
make = str.maketrans('abcxyz', 'xyzabc')
print(make)
# 对s7字符串进行加密转换
print(s7.translate(make))
s8 = 'abc\refg\n2342\t'
# 删除s8中\r,\n,\t,构建映射表str_trans
str_trans = str.maketrans('', '', '\t\r\n')
print(s8.translate(str_trans))

# 去掉音标符号
u = u'nǐ hǎo, chī fàn'
import unicodedata, sys

# 将原始输入标准化为分解形式字符
a = unicodedata.normalize('NFD', u)
'''
使用dict.fromkeys() 方法构造一个字典,每个Unicode和音调作为键,对应的值全部为None
sys.maxunicode : 给出最大Unicode代码点的值的整数,即1114111(十六进制的0x10FFFF)。
unicodedata.combining:将分配给字符chr的规范组合类作为整数返回。如果未定义组合类,则返回0
这样我们就成功将所有组合类的值全部设置为None
'''
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode)
                         if unicodedata.combining(chr(c)))
# 调用translate函数删除所有音调
print(a.translate(cmb_chrs))

总结

到此这篇关于使用Python去除字符串中某个字符的多种实现方式比较的文章就介绍到这了,更多相关Python去除字符串中字符内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python去除字符串前后空格的几种方法

    其实如果要去除字符串前后的空格很简单,那就是用strip(),简单方便 >>> ' A BC '.strip() 'A BC' 如果不允许用strip()的方法,也是可以用正则匹配的方法来处理. >>> s1 = ' A BC' >>> s2 = 'A BC ' >>> s3 = ' A BC ' >>> s4 = 'A BC' >>> def trim(s): ... import re ...

  • python 如何去除字符串头尾的多余符号

    在读文件时常常得到一些\n和引号之类的符号,可以使用字符串的成员函数strip()来去除. 1.去除首尾不需要的字符 a= '"This is test string"' # strip()会默认去除'\n','\r','\t',' ',制表回车换行和空格等字符 a.strip('"') >>> 'This is test string' b = ' This is another string ' #首尾两个空格 b.strip(' ') >>

  • 去除python中的字符串空格的简单方法

    python编程中,我们在修改代码,遇到空格很多的情况下,我们要删除空格.本文小编整理了三种字符串去除空格的方法: 方法一:使用字符串函数replace,去除全部空格. 实例: >>> a = " a b c " >>> a.replace(" ", "") 'abc' 方法二:使用字符串函数split,去除字符串开头或者结尾的空格. 实例: >>> a = ''.join(a.split()

  • Python 去除字符串中指定字符串

    1.背景 最近的项目中,再次踩到Python字符串处理的坑,决定把此次解决方案记录一下,以勿踩坑. 2.遇到坑 原本字符串:大坪英利国际8号楼88-88号重庆汉乔科技有限公司大坪英利国际8号楼 去除最左边的字符串:大坪英利国际8号楼 预期结果:88-88号重庆汉乔科技有限公司大坪英利国际8号楼 自然而然,第一个想到的就是lstrip()函数. Python中lstrip() 方法用于截掉字符串左边的空格或指定字符. 但实际上结果: lstrip: -88号重庆汉乔科技有限公司大坪英利国际8号楼

  • Python去除字符串两端空格的方法

    目的 获得一个首尾不含多余空格的字符串 方法 可以使用字符串的以下方法处理: string.lstrip(s[, chars]) Return a copy of the string with leading characters removed. If chars is omitted or None, whitespace characters are removed. If given and not None, chars must be a string; the character

  • Python 字符串去除空格的五种方法

    在处理Python代码字符串的时候,我们常会遇到要去除空格的情况,所以就总结了多种方法供大家参考. 1.strip()方法 去除字符串开头或者结尾的空格 str = " Hello world " str.strip() 输出: "Hello world" 2.lstrip()方法 去除字符串开头的空格 str = " Hello world " str.lstrip() 输出: 'Hello world ' 3.rstrip()方法 去除字符串

  • python如何去除字符串中不想要的字符

    问题: 过滤用户输入中前后多余的空白字符 '    ++++abc123---    ' 过滤某windows下编辑文本中的'\r': 'hello world \r\n' 去掉文本中unicode组合字符,音调 "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng" 如何解决以上问题? 去掉两端字符串: strip(), rstrip(),lstrip() #!/usr/bin/python3 s = ' -----abc123++++ ' # 删除两边空字符 p

  • Python去除、替换字符串空格的处理方法

    个人想到的解决方法有两种,一种是  .replace(' old ',' new ')   第一个参数是需要换掉的内容比如空格,第二个是替换成的内容,可以把字符串中的空格全部替换掉. 第二种方法是像这样 str_1_data = ' a b c ' str_2_list = str_1_data.split() str_1 = '' for i in range(len(str_2_list)): #这里可以直接用 str_1.join(str2_list) str_1 += str_2_lis

  • 使用Python去除字符串中某个字符的多种实现方式比较

    目录 1.如何去掉字符串中不需要的字符? 2.代码演示 总结 1.如何去掉字符串中不需要的字符? 实际案例: (1)过滤掉用户输入前后多余的空白字符:' nick2008@gmail.com ' (2)过滤某windows下编辑文本中的'\r':'hello world\r\n' (3)去掉文本中的unicode组合符号(调音):u'ní hǎo, chī fàn'(或 èěéēàǎā) 解决方案: 方法1:字符串strip(),lstrip(),rstrip()方法去掉字符串两端字符. 方法2

  • python去除字符串中的换行符

    今天写这个,要用python去除字符串中的换行符并写入文件,网上查阅,就一句代码replace("\n",""),加上之后,搞了半天,还是不对. 以上是我今天遇到的问题,以下是解决方案. 本地测试是window系统,正式用的时候是unix服务器.两者对换行符具体有什么差别我也不是很清楚.于是将 字符串写入的文件用 notepad++打开,显示 行尾符(如何用notepad++显示行尾符自己百度),发现是 CR, 所以将代码改为 replace("\r&qu

  • python统计字符串中指定字符出现次数的方法

    本文实例讲述了python统计字符串中指定字符出现次数的方法.分享给大家供大家参考.具体如下: python统计字符串中指定字符出现的次数,例如想统计字符串中空格的数量 s = "Count, the number of spaces." print s.count(" ") x = "I like to program in Python" print x.count("i") PS:本站还提供了一个关于字符统计的工具,感兴

  • python删除字符串中指定字符的方法

    最近开始学机器学习,学习分析垃圾邮件,其中有一部分是要求去除一段字符中的标点符号,查了一下,网上的大多很复杂例如这样 import re temp = "司法局让我和户 1 5. 8 0. !!?? 客户维护户外" temp = temp.decode("utf8") string = re.sub("[\s+\.\!\/_,$%^*(+\"\']+|[+--!,.?.~@#¥%--&*()]+".decode("ut

  • python去掉字符串中重复字符的方法

    复制代码 代码如下: If order does not matter, you can use "".join(set(foo))set() will create a set of unique letters in the string, and "".join() will join the letters back to a string in arbitrary order. If order does matter, you can use colle

  • Python 实现字符串中指定位置插入一个字符

    如下所示: str_1='wo shi yi zhi da da niu/n'str_list=list(str_1) nPos=str_list.index('/') str_list.insert(nPos,',') str_2="".join(str_list) print(str_2) 从文件中提取行,在行最末尾插入一个逗号. 以上这篇Python 实现字符串中指定位置插入一个字符就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们. 您可能感兴趣的文章

  • Python去掉字符串中空格的方法

    我们经常在处理字符串时遇到有很多空格的问题,一个一个的去手动删除不是我们程序员应该做的事情,今天这篇技巧的文章我们就来给大家讲一下,如何用Python去除字符串中的空格.我们先创建一个左右都有N个空格的字符串变量s,看代码: 复制代码 代码如下: >>> s = "   我们    ">>> 去除字符串空格,在Python里面有它的内置方法,不需要我们自己去造轮子了.lstrip:删除左边的空格这个字符串方法,会删除字符串s开始位置前的空格. 复制代

  • python过滤字符串中不属于指定集合中字符的类实例

    本文实例讲述了python过滤字符串中不属于指定集合中字符的类.分享给大家供大家参考.具体如下: # -*- coding: utf-8 -*- import sets class Keeper(object): def __init__(self, keep): self.keep = sets.Set(map(ord, keep)) def __getitem__(self, n): if n not in self.keep: return None return unichr(n) de

随机推荐