Python对字符串实现去重操作的方法示例

前言

最近在工作经常会碰到对字符串进行去重操作,下面就给大家列出用Python如何处理的,话不多说了,来一起看看详细的介绍吧。

比如说,要拿下面的字符传去掉重复的AA, A(B,C)

S = 'AA, BB, EE, DD, AA, A(B,C), CC, A(B,C)'

代码如下:

备注:

1. 用str.split(',')只能分隔逗号一种;如果涉及到多重分隔的话就需要使用re.split(',|:')

2. 原字符串以逗号分隔的,后面有一个或多个字符串,所以re.split(', | ')

3. 执行re.split(r', | ', S)操作之后,列表中会产生大量的'',就需要将filter过滤掉

4. 使用L.count(x) == 1 或者 L.count(x) > 1来保留重复项或,非重复项

5. set(L)则是保留列表中的唯一项,再用list()将其转换为列表

6. 使用 ', '.join(L) ,将列表拼接成我们想要的字符串

总结

借助于python中的正则表达式(re),及列表,字符串,集合的等操作,来处理字符串还是很灵活的!

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

(0)

相关推荐

  • python去掉字符串中重复字符的方法

    复制代码 代码如下: If order does not matter, you can use "".join(set(foo))set() will create a set of unique letters in the string, and "".join() will join the letters back to a string in arbitrary order. If order does matter, you can use colle

  • Python对字符串实现去重操作的方法示例

    前言 最近在工作经常会碰到对字符串进行去重操作,下面就给大家列出用Python如何处理的,话不多说了,来一起看看详细的介绍吧. 比如说,要拿下面的字符传去掉重复的AA, A(B,C) S = 'AA, BB, EE, DD, AA, A(B,C), CC, A(B,C)' 代码如下: 备注: 1. 用str.split(',')只能分隔逗号一种:如果涉及到多重分隔的话就需要使用re.split(',|:') 2. 原字符串以逗号分隔的,后面有一个或多个字符串,所以re.split(', | ')

  • Python 5种常见字符串去除空格操作的方法

    目录 1:strip()方法 2:lstrip()方法 3:rstrip()方法 4:replace()方法 5: join()方法+split()方法 1:strip()方法 去除字符串开头或者结尾的空格 >>> a = " a b c " >>> a.strip() 'a b c' 2:lstrip()方法 去除字符串开头的空格 >>> a = " a b c " >>> a.lstrip(

  • 对python 匹配字符串开头和结尾的方法详解

    1.你需要通过指定的文本模式去检查字符串的开头或者结尾,比如文件名后缀,URL Scheme 等等.检 查 字 符 串 开 头 或 结 尾 的 一 个 简 单 方 法 是 使 用str.startswith() 或 者 是str.endswith()方法.比如: >>> filename = 'spam.txt' >>> filename.endswith('.txt') True >>> filename.startswith('file:') Fa

  • Python 存储字符串时节省空间的方法

    从 Python 3 开始,str 类型代表着 Unicode 字符串.取决于编码的类型,一个 Unicode 字符可能会占 4 个字节,这个有些时候有点浪费内存. 出于内存占用以及性能方面的考虑,Python 内部采用下面 3 种方式来存储 Unicode 字符: 一个字符占一个字节(Latin-1 编码) 一个字符占二个字节(UCS-2 编码) 一个字符占四个字节(UCS-4 编码) 使用 Python 进行开发的时候,我们会觉得字符串的处理都很类似,很多时候根本不需要注意这些差别.可是,当

  • python将字符串转换成json的方法小结

    最近在工作中遇到了一个小问题,如果要将字符串型的数据转换成dict类型,我第一时间就想到了使用json函数.但是里面出现了一些问题 1.通过json来转换: In [1]: import json In [2]: mes = '{"InsId": 2, "name": "lege-happy", "CreationTime": "2019-04-23T03:18:02Z"}' In [3]: mes_to_

  • Python数字/字符串补零操作实例代码

    有时候在使用 Python 的时候,想要对一个数字或者字符串进行补零操作,即把「1」变为一个八位数的「00000001」,这个时候可以使用一下方法来进行补零. 字符串补零: 可以使用 zfill() 函数来给字符串补零: >>> str = "123" >>> print(str.zfill(8)) 00000123 还能把整数转化成字符来使用 zfill() 补零: >>> num = 123 >>> print

  • 关于Python中字符串的各种操作

    目录 1.字符串拼接 2.字符串截取(字符串切片) 3.分割字符串 4.合并字符串 5.统计字符串出现的次数 6.检测字符串是否包含某子串 7.字符串对齐方法 8.检索字符串是否以指定字符串开头(startswith()) 9.检索字符串是否以指定字符串结尾(endswith()) 10.字符串大小写转换(3种)函数及用法 11.去除字符串中空格(删除特殊字符)的3种方法 12.encode()和decode()方法:字符串编码转换 13.序列化和反序列化 1.字符串拼接 通过+运算符 现有字符

  • python中字符串String及其常见操作指南(方法、函数)

    目录 下标与切片 常见方法 查找 替换 分割 大小写格式化 对齐格式化 清除空白字符 检查 补充:16个常用函数 总结 注意:对字符串的所有操作,原始数据(即原字符串)不变 !(字符串是不可变类型) 对原字符串操作会返回一个操作后的数据, 可以使用变量去接受数据 ----------------------------------------------------------------------------------------------------------------------

  • python中字符串的常见操作总结(一)

    目录 前言 python中的对象 什么是对象? 字符串的capitalize()函数 capitalize()的功能 capitalize()的用法 字符串的小写内置函数 字符串的upper()函数 字符串的swapcase()函数 字符串的zfill()函数 字符串中的count()函数 字符串中startswith()与endswith()函数 字符串中的find()与index()函数 字符串中的strip()函数 字符串中的replace()函数 字符串中返回bool类型的函数 issp

  •  python中字符串的常见操作总结(二)

    目录 字符串的编码格式 什么是编码格式? 常见的编码格式 字符串格式化 什么是字符串格式化? 格式化字符串的使用场景 第一种格式化方法—% 第二种格式化方法–格式化函数format() 第三种格式化方法–f-strings(python3.6及之后的版本支持) 详解对不同数据类型的格式化 format() 不常用的格式 字符串的转义字符 python中的转义字符 将转义字符无效化 字符串的编码格式 什么是编码格式? 通俗来讲,编码格式就是编码的规则 在脚本的开头指定编码格式,来告诉操作系统根据什

随机推荐