Python 删除整个文本中的空格,并实现按行显示
希望以后每天写一篇博客,总结一下每天用到的基本功能,不然项目做完也就做完了,给自己留下的资料太少了。
今天需要造大量的姓名和家庭住址的数据,因此根据读取文件中现有的lastname、firstname以及省、市、道路等随机生成大量的模拟姓名和住址。其中用python进行了简单的文本处理,去掉文本中的空格,数字或者没用的字符等。
example 1: 从ifn文件中读取数据,根据空格进行逐个读取,并进行换行显示。
#encoding = utf-8# ifn = r"firstname.txt" ofn = r"Output.txt" infile = open(ifn,'rb') outfile = open(ofn,'wb') for eachline in infile.readlines(): lines = eachline.split(' ') for temp in lines print temp outfile.write(temp+'\n') infile.close outfile.close
example2:去掉所有的数字和某个符号,用正则表达式实现。
#只剩下数字,空格和. import os,sys,string str = "12.mengegsihello." result = filter(lambda ch:ch in '.0123456789 ',str) print result
#过滤掉所有的数字,空格和.,可以根据需要设置任何符号 import os,sys,string str = "12.mengegsihello." result = filter(lambda ch:ch not in '.0123456789 ',str) print result
Tips:有时候中文符号和英文符号会出现混乱,当实际的输出和预期的不一样的时候,在vim下可以通过set list命令让其显示所有的符号,以便观察。
以上这篇Python 删除整个文本中的空格,并实现按行显示就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
相关推荐
-
Python文本处理之按行处理大文件的方法
以行的形式读出一个文件最简单的方式是使用文件对象的readline().readlines()和xreadlines()方法. Python2.2+为这种频繁的操作提供了一个简化的语法--让文件对象自身在行上高效迭代(这种迭代是严格的向前的). 为了读取整个文件,可能要使用read()方法,且使用字符串的split()来将它拆分WEIGHT行或其他块. 下面是一些例子: >>> for line in open('chap1.txt'): # Python 2.2+ ... # proc
-
python 删除列表里所有空格项的方法总结
首先,我们来随便写一个带空格的列表: list1 = ['122','2333','3444',' ','422',' ',' ','54',' '] 相信已经有人尝试过,诸如以下的方式去删掉空格,例如: # -*- coding:utf-8 -*- for i in list1: if i == ' ': list1.remove(' ') print list1 但是结果你会发现是这样的,它总是不能完全的删完空格,会在末尾留下一个. 方法一: 这个时候,可以尝试把'=='改为in: # -*
-
Python去除、替换字符串空格的处理方法
个人想到的解决方法有两种,一种是 .replace(' old ',' new ') 第一个参数是需要换掉的内容比如空格,第二个是替换成的内容,可以把字符串中的空格全部替换掉. 第二种方法是像这样 str_1_data = ' a b c ' str_2_list = str_1_data.split() str_1 = '' for i in range(len(str_2_list)): #这里可以直接用 str_1.join(str2_list) str_1 += str_2_lis
-
python去除空格和换行符的实现方法(推荐)
一.去除空格 strip() " xyz ".strip() # returns "xyz" " xyz ".lstrip() # returns "xyz " " xyz ".rstrip() # returns " xyz" " x y z ".replace(
-
python将文本中的空格替换为换行的方法
测试文本 jb51.txt welcome to jb51.net I love you very much python代码 # -*- coding: utf-8 -*- ''' 遇到文中的空格就换行 ''' def delblankline(infile, outfile): infopen = open(infile, 'r',encoding="utf-8") outfopen = open(outfile, 'w',encoding="utf-8") d
-
Python 删除整个文本中的空格,并实现按行显示
希望以后每天写一篇博客,总结一下每天用到的基本功能,不然项目做完也就做完了,给自己留下的资料太少了. 今天需要造大量的姓名和家庭住址的数据,因此根据读取文件中现有的lastname.firstname以及省.市.道路等随机生成大量的模拟姓名和住址.其中用python进行了简单的文本处理,去掉文本中的空格,数字或者没用的字符等. example 1: 从ifn文件中读取数据,根据空格进行逐个读取,并进行换行显示. #encoding = utf-8# ifn = r"firstname.txt&q
-
python 去除txt文本中的空格、数字、特定字母等方法
使用场景:需要去除txt文本中的空格.数字.特定字母等. 需要修改的txt文本叫做:train.txt 修改之后保存成:train_output.txt # ecoding=utf-8 ifn = r"train.txt" ofn = r"train_output.txt" infile = open(ifn,'rb') outfile = open(ofn,'wb') for eachline in infile.readlines(): #去掉文本行里面的空格.
-
数据清洗之如何用一行Python代码去掉文本中的各种符号
目录 前言 1. 问题描述 2. 相关知识 3. 解决方案 总结 前言 在搜集了很多文本语料之后,会开始漫长的数据清洗过程,通常要不断迭代. 1. 问题描述 有些文本数据中,会包含一些特殊符号. 猜想可能是从某些富文本编辑器中直接粘贴到了网页. 如果要清除这些特殊符号,就需要专门的工具. 2. 相关知识 Unicode标准把符号分为四大类,分别是: 缩写 详情 [Sc] Symbol, Currency [Sk] Symbol, Modifier [Sm] Symbol, Math [So] S
-
python统计一个文本中重复行数的方法
本文实例讲述了python统计一个文本中重复行数的方法.分享给大家供大家参考.具体实现方法如下: 比如有下面一个文件 2 3 1 2 我们期望得到 2,2 3,1 1,1 解决问题的思路: 出现的文本作为key, 出现的数目作为value,然后按照value排除后输出 最好按照value从大到小输出出来,可以参照: 复制代码 代码如下: in recent Python 2.7, we have new OrderedDict type, which remembers the order in
-
Python删除Java源文件中全部注释的实现方法
本文实例讲述了Python删除Java源文件中全部注释的实现方法.分享给大家供大家参考,具体如下: 同事想删除一个Java项目中的全部注释,让我帮忙想想办法. 没找不到合适工具,就写了这个脚本,遍历指定目录,查找*.java文件,删除其中/* */之间,及// 至行末的内容. (用之前要改改其中的路径): #!D:\Python32 # 过滤JAVA程序中的注释 # 如果字符串中有注释符号的话会有问题. import os import re import io # 改这个目录!!! top_d
-
用python删除文件夹中的重复图片(图片去重)
第一部分:判断两张图片是否相同 要查找重复的图片,必然绕不开判断两张图片是否相同.判断两张图片简单呀!图片可以看成数组,比较两个数组是否相等不就行了.但是这样做太过简单粗暴,因为两个数组的每个元素都要一一比较,效率很低.为了尽量避免两个庞大的数组比较: 先进行两张图片的大小(byte)比较,若大小不相同,则两张图片不相同: 在两张图片的大小相同的前提下,进行两张图片的尺寸(长和宽)比较,若尺寸不相同,则两张不相同: 在两张图片的尺寸相同的前提下,进行两张图片的内容(即数组元素)比较,若内容不相同
-
python 删除大文件中的某一行(最有效率的方法)
用 python 处理一个文本时,想要删除其中中某一行,常规的思路是先把文件读入内存,在内存中修改后再写入源文件. 但如果要处理一个很大的文本,比如GB级别的文本时,这种方法不仅需要占用很大内存,而且一次性读入内存时耗费时间,还有可能导致内存溢出. 所以,需要用另外一个思路去处理. 我们可以使用 open() 方法把需要修改的文件打开为两个文件,然后逐行读入内存,找到需要删除的行时,用后面的行逐一覆盖.实现方式见以下代码. with open('file.txt', 'r') as old_fi
-
python实现统计文本中单词出现的频率详解
本文实例为大家分享了python统计文本中单词出现频率的具体代码,供大家参考,具体内容如下 #coding=utf-8 import os from collections import Counter sumsdata=[] for fname in os.listdir(os.getcwd()): if os.path.isfile(fname) and fname.endswith('.txt'): with open(fname,'r') as fp: data=fp.readlines
-
易语言删除文本中的全部空格功能
删全部空命令 英文命令:TrimAll 操作系统支持:Windows.Linux 所属类别:文本操作 返回一个文本,其中包含被删除了所有全角或半角空格的指定文本. 语法: 文本型 删全部空 (欲删除空格的文本) 例程 说明 通过"删全部空"命令将一段文本中的空格全部删除. 例如:" 这里 既有全角 空格, 也有半角 空格. "删除全部空格后的结果是:"这里既有全角空格,也有半角空格.". 运行结果: 总结 以上就是这篇文章
随机推荐
- Apache Thrift环境配置
- PHP简单实现生成txt文件到指定目录的方法
- PowerShell中的加法运算详解
- mysql服务启动却连接不上的解决方法
- 精通JavaScript的this关键字
- ren 命令在使用通配符时需要注意的地方
- C++中的异常处理机制详解
- java文件操作之Path,Paths,Files
- 详解SpringBoot中Session超时原理说明
- Oracle DATABASE LINK(DBLINK)创建与删除方法
- asp.net页面master页面与ascx用户控件传值的问题
- ASP.NET中的Cache使用介绍
- asp.net下用DataSet生成XML的问题
- MySQL查询倒数第二条记录实现方法
- jquery教程ajax请求json数据示例
- Jquery动态改变图片IMG的src地址示例
- 快速掌握Node.js环境的安装与运行方法
- jquery text(),val(),html()方法区别总结
- JavaScript实现父子dom同时绑定两个点击事件,一个用捕获,一个用冒泡时执行顺序的方法
- JS实现简单的天数计算器完整实例