python 用所有标点符号分隔句子的示例
问题
给出一段话,由短句组成,短句之间可能被任意标点符号隔开。想要提取所有的短句。
解决
使用 re.split 函数,用正则式匹配的方法,一次性分隔所有短句。
import re pattern = r',|\.|/|;|\'|`|\[|\]|<|>|\?|:|"|\{|\}|\~|!|@|#|\$|%|\^|&|\(|\)|-|=|\_|\+|,|。|、|;|‘|'|【|】|·|!| |…|(|)' test_text = 'b,b.b/b;b\'b`b[b]b<b>b?b:b"b{b}b~b!b@b#b$b%b^b&b(b)b-b=b_b+b,b。b、b;b‘b'b【b】b·b!b b…b(b)b' result_list = re.split(pattern, test_text) print(result_list)
输出为
['b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b', 'b']
可见所有的 b 都被提取了出来。
以上这篇python 用所有标点符号分隔句子的示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
相关推荐
-
Python实现按逗号分隔列表的方法
方法一: def commaSpiltList(self, listData): listData = list(listData) strs = str(listData[0]) for letter in range(1, len(listData) - 1): strs = strs + ',' + str(listData[letter]) strs += ',' + str(listData[len(listData) - 1]) print(strs) 方法二: #!/usr/bin
-
python过滤中英文标点符号的实例代码
如下所示: import re # 过滤不了\\ \ 中文()还有---- r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,.?★.-[]<>?""''![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符 # 者中规则也过滤不完全 r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+--!,.?.~@#¥%--&*()]+" # \\\可以过滤掉
-
python3去掉string中的标点符号方法
网上看到的python去掉字符串中的标点符号的方法,大多是基于python2的,不适用python3,调整后代码如下: 代码 lower_case_documents = ['Hello, how are you!','Win money, win from home.','Call me now.','Hello, Call hello you tomorrow?'] sans_punctuation_documents = [] import string for i in lower_ca
-
python print 按逗号或空格分隔的方法
1)按,分隔 a, b = 0, 1 while b < 1000: print(b, end=',') a, b = b, a+b 1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987, 2)按空格分隔 a, b = 0, 1 while b < 1000: print(b, end=' ') a, b = b, a+b 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 3)print的用法 print(..
-
python 用所有标点符号分隔句子的示例
问题 给出一段话,由短句组成,短句之间可能被任意标点符号隔开.想要提取所有的短句. 解决 使用 re.split 函数,用正则式匹配的方法,一次性分隔所有短句. import re pattern = r',|\.|/|;|\'|`|\[|\]|<|>|\?|:|"|\{|\}|\~|!|@|#|\$|%|\^|&|\(|\)|-|=|\_|\+|,|.|.|:|'|'|[|]|·|!| |-|(|)' test_text = 'b,b.b/b;b\'b`b[b]b<b
-
Python 闭包,函数分隔作用域,nonlocal声明非局部变量操作示例
本文实例讲述了Python 闭包,函数分隔作用域,nonlocal声明非局部变量操作.分享给大家供大家参考,具体如下: 实例对象也可以实现闭包的功能,不过实例对象消耗的资源(内存)比闭包多. demo.py(闭包): # 闭包,分割作用域. 外层函数内部嵌套内部函数,外层函数分割变量作用域,并返回内部函数的引用. # 外层函数负责分割作用域,内层函数才是闭包提供的功能. 外层函数返回内层函数的引用,供外部使用. def my_line(k, b): # k,b只在my_line函数以及creat
-
Python实现Wordcloud生成词云图的示例
wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概. 首先贴出一张词云图(以哈利波特小说为例): 在生成词云图之前,首先要做一些准备工作 1.安装结巴分词库 pip install jieba Python中的分词模块有很多,他们的功能也都是大同小异,我们安装的结巴分词 是当前使用的最多的类型. 下面我来简单介绍一下结巴分词的用法 结巴分词的分词模式分为三种: (1)全模式:把句子中所有的可以成词的词语都扫描出
-
python渗透测试linux密码激活的示例
上篇文章给大家介绍过 Python脚本破解Linux口令(crypt模块) 感兴趣的朋友点击查看. linux密码破解 这段代码通过分别读取两个文件,一个为加密口令文件(cryptPass),另一个为用于猜测的字典文件(key.txt). 在testPass()函数中读取字典文件,并通过crypt.crypt()进行加密,加密时需要一个明文密码以及两个字节salt(加密口令的前两个字母),通过salt和明文密码加密形成 cryptWord. 最后将cryptWord和cryptPass进行对比
-
Python CSV 文件解析和生成方法示例
目录 思路 Python with CSV CSV 格式 使用 Python 的 csv 库 其他 思路 简单的生成和读取 CSV CSV 文件格式 使用 csv 库 Python with CSV 先有个很朴素的生成和解析的方法. 生成: data = [ [1, 2, 3], [4, 5, 6], [7, 8, 9], ] for cow in data: print(','.join(map(str, cow))) 生成结果: 1,2,34,5,67,8,9 解析 s = ""&
-
Python实现曲线点抽稀算法的示例
本文介绍了Python实现曲线点抽稀算法的示例,分享给大家,具体如下: 目录 何为抽稀 道格拉斯-普克(Douglas-Peuker)算法 垂距限值法 最后 正文 何为抽稀 在处理矢量化数据时,记录中往往会有很多重复数据,对进一步数据处理带来诸多不便.多余的数据一方面浪费了较多的存储空间,另一方面造成所要表达的图形不光滑或不符合标准.因此要通过某种规则,在保证矢量曲线形状不变的情况下, 最大限度地减少数据点个数,这个过程称为抽稀. 通俗的讲就是对曲线进行采样简化,即在曲线上取有限个点,将其变为折
-
在Python中使用AOP实现Redis缓存示例
越来越觉得的缓存是计算机科学里最NB的发明(没有之一),本文就来介绍了一下在Python中使用AOP实现Redis缓存示例,小伙伴们一起来了解一下 import redis enable=True #enable=False def readRedis(key): if enable: r = redis.Redis(host='10.224.38.31', port=8690,db=0, password='xxxx') val = r.get(key) if val is None: pri
-
Python文件的读写和异常代码示例
一.从文件中读取数据 #!/usr/bin/env python with open('pi') as file_object: contents = file_object.read() print(contents) =================================== 3.1415926 5212533 2324255 1.逐行读取 #!/usr/bin/env python filename = 'pi' with open(filename) as file_obje
-
python shell根据ip获取主机名代码示例
这篇文章里我们主要分享了python中shell 根据 ip 获取 hostname 或根据 hostname 获取 ip的代码,具体介绍如下. 笔者有时候需要根据hostname获取ip 比如根据machine.company.com 获得ip 10.173.14.117 方法1:利用 socket 模块 里的 gethostbyname 函数 代码如下,使用socket模块 >>> import socket >>> socket.gethostbyname(&qu
-
Python实现比较扑克牌大小程序代码示例
是Udacity课程的第一个项目. 先从宏观把握一下思路,目的是做一个比较德州扑克大小的问题 首先,先抽象出一个处理的函数,它根据返回值的大小给出结果. 之后我们在定义如何比较两个或者多个手牌的大小,为方便比较大小,我们先对5张牌进行预处理,将其按照降序排序,如下: def card_ranks(hand): ranks = ['--23456789TJQKA'.INDEX(r) for r, s in hand] ranks.sort(reverse=True) return ranks 然后
随机推荐
- PHP 正则的使用基础入门
- input输入密码变黑点密文的实现方法
- Centos6.4编译安装mysql 8.0.0 详细教程
- AngularJS动态加载模块和依赖的方法分析
- 学习 WSH 的理由小结
- c# HttpWebRequest通过代理服务器抓取网页内容应用介绍
- Python中的赋值、浅拷贝、深拷贝介绍
- vue params、query传参使用详解
- Android唤醒、解锁屏幕代码实例
- node.js中的buffer.toString方法使用说明
- Python实现保证只能运行一个脚本实例
- jquery tab插件制作实现代码
- eclipse导入jquery包后报错的解决方法
- Android中Window添加View的底层原理
- js实现运行代码需要刷新的解决方法
- 浅析C/C++变量在内存中的分布
- android仿微信支付宝的支付密码输入框示例
- Java递归实现字符串全排列与全组合
- django使用xlwt导出excel文件实例代码
- 在lnmp环境中的nginx编译安装