python利用pandas将excel文件转换为txt文件的方法
python将数据换为txt的方法有很多,可以用xlrd库实现。本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件。
直接上代码:
''' function:将excel文件转换为text author:Nstock date:2018/3/1 ''' import pandas as pd import re import codecs #将excel转化为txt文件 def exceltotxt(excel_dir, txt_dir): with codecs.open(txt_dir, 'w', 'utf-8') as f: neg=pd.read_excel(excel_dir, header=None, index=None) f.write(neg.to_string()) #去除记录行首的数字和空格 def del_linehead_number_speace(orig_txt_dir,saveas_txt_dir): with open(orig_txt_dir,'r+') as f, open(saveas_txt_dir,'r+') as fw: lines = f.readlines() print(len(lines)) #行数 texts = [re.sub(r'(\d)+(\s)+','',lines[num]) for num in range(len(lines)) ] texts = list(set(texts)) #去重如果要保留重复记录注释该行 line_num = len(texts) # for num in range(line_num): #查看转化后的文本 # print(texts[num]) fw.writelines(texts) exceltotxt('./data/neg.xls', './data/neg_temp.txt') del_linehead_number_speace('./data/neg_temp.txt','./data/neg.txt')
说明:xxx_dir带目标文件名为:xxx_dir='保存路径/'+'文件名'
以上这篇python利用pandas将excel文件转换为txt文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
相关推荐
-
python pandas写入excel文件的方法示例
pandas读取.写入csv数据非常方便,但是有时希望通过excel画个简单的图表看一下数据质量.变化趋势并保存,这时候csv格式的数据就略显不便,因此尝试直接将数据写入excel文件. pandas可以写入一个或者工作簿,两种方法介绍如下: 1.如果是将整个DafaFrame写入excel,则调用to_excel()方法即可实现,示例代码如下: # output为要保存的Dataframe output.to_excel('保存路径 + 文件名.xlsx') 2.有多个数据需要写入多个exce
-
python使用pandas处理excel文件转为csv文件的方法示例
由于客户提供的是excel文件,在使用时期望使用csv文件格式,且对某些字段内容需要做一些处理,如从某个字段中固定的几位抽取出来,独立作为一个字段等,下面记录下使用acaconda处理的过程: import pandas df = pandas.read_excel("/***/***.xlsx") df.columns = [内部为你给你的excel每一列自定义的名称](比如我给我的excel自定义列表为: ["url","productName&quo
-
Python利用pandas处理Excel数据的应用详解
最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做自动化测试的时候,如果涉及到数据的读取和存储,那么而利用pandas就会非常高效,基本上3行代码可以搞定你20行代码的操作!该教程仅仅限于结合柠檬班的全栈自动化测试课程来讲解下pandas在项目中的应用,这仅仅只是冰山一角,希望大家可以踊跃的去尝试和探索! 一.安装环境: 1:pandas依赖处理Excel的xlrd模块,所以我们需要提前安装这个,安装命令
-
Python pandas实现excel工作表合并功能详解
import os,pandas as pd,re #1.获取文件夹下要合并的文件名 dirpath = '文件夹地址' #工作表3特殊处理 需要开始下标和结束下标 begin = 231 end = 238 excel_names = os.listdir(dirpath) #2.获取文件内容 sheet_1_merge = [] sheet_2_merge = [] sheet_3_merge = pd.DataFrame([0,0,0,0,0,0,0]) for excel_name in
-
python pandas实现excel转为html格式的方法
如下所示: #!/usr/bin/env Python # coding=utf-8 import pandas as pd import codecs xd = pd.ExcelFile('/Users/wangxingfan/Desktop/1.xlsx') df = xd.parse() with codecs.open('/Users/wangxingfan/Desktop/1.html','w','utf-8') as html_file: html_file.write(df.to_
-
python利用pandas将excel文件转换为txt文件的方法
python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将excel文件转换为text author:Nstock date:2018/3/1 ''' import pandas as pd import re import codecs #将excel转化为txt文件 def exceltotxt(excel_dir, txt_dir): with co
-
python实现npy格式文件转换为txt文件操作
如下代码会将npy的格式数据读出,并且输出来到控制台: import numpy as np ##设置全部数据,不输出省略号 import sys np.set_printoptions(threshold=sys.maxsize) boxes=np.load('./input_output/boxes.npy') print(boxes) np.savetxt('./input_output/boxes.txt',boxes,fmt='%s',newline='\n') print('----
-
python实现Excel文件转换为TXT文件
在处理数据的时候经常需要读取TXT文件类型的数据转换为可执行的list,但是当我们有Excel的文件,如何将Excel文件转换为每行固定长度的TXT文件呢!如果数据量很少的情况下,人工处理还好,可是在大数据的情况下就显得不可能了,这时如果我们利用程序执行这一命令就轻松多了,废话不多说,下面介绍代码. 首先在python中import两个必要的包(我们面向的对象是.csv的Excel文件) import numpy as np import csv 接下来,就是读取Excel文件,在读取的文件路径
-
Python利用pandas计算多个CSV文件数据值的实例
功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys input_path='./' output_fiel='pandas_union_concat.csv' all_files=glob.glob(os.path.join(input_path,'sales_*')) all_data_frames=[] for file in all_files:
-
python 利用pandas将arff文件转csv文件的方法
直接贴代码啦: #coding=utf-8 import pandas as pd def arff_to_csv(fpath): #读取arff数据 if fpath.find('.arff') <0: print('the file is nott .arff file') return f = open(fpath) lines = f.readlines() content = [] for l in lines: content.append(l) datas = [] for c i
-
python使用pandas读写excel文件的方法实例
目录 引言 读取excel文件 写入文件: 总结 引言 现在本地创建一个excel表,以及两个sheet,具体数据如下: sheet1: sheet2: 读取excel文件 pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None) io:excel文件路径. sheet_name:返回指定的sheet. header:表头,默认值为0.也可以指定多行.当header取值为None
-
python利用pandas分析学生期末成绩实例代码
安装Pandas Pandas是构建在Python编程语言之上的一个快速.强大.灵活且易于使用的开源数据分析和操作工具.Pandas是基于Numpy的专业数据分析工具,可以灵活高效的处理各种数据集. 我们使用pip进行安装(如果没有可自行查询如何安装pip)安装panda最简单的方法是将其作为Anaconda的一部分安装,Anaconda主要用于数据分析和科学计算.还提供源代码.PyPI.ActivePython.各种Linux发行版或开发版本进行安装的说明. 当然,最为基础的Python环境还
-
python实现word 2007文档转换为pdf文件
在开发过程中,会遇到在命令行下将DOC文档(或者是其他Office文档)转换为PDF的要求.比如在项目中如果手册是DOC格式的,在项目发布时希望将其转换为PDF格式,并且保留DOC中的书签,链接等.将该过程整合到构建过程中就要求命令行下进行转换. Michael Suodenjoki展示了使用Office的COM接口进行命令行下的转换.但其导出的PDF文档没有书签.在Office 2007 SP2中,微软加入了该功能,对应的接口是ExportAsFixedFormat.该方法不仅适用于Word,
-
如何利用pandas将Excel转为html格式
前言 大家谈及用Pandas导出数据,应该就会想到to.xxx系列的函数. 这其中呢,比较常用的就是pd.to_csv()和pd.to_excel().但其实还可以将其导成Html网页格式,这里用到的函数就是pd.to_html()! 读取Excel 今天我们要实现Excel转为html格式,首先需要用读取Excel中的表格数据. import pandas as pd data = pd.read_excel('测试.xlsx') 查看数据 data.head() 下面我们来学习把DataFr
随机推荐
- 详解Angular.js中$http拦截器的介绍及使用
- VBS数组函数学习实例分析
- PHP 正则表达式效率 贪婪、非贪婪与回溯分析(推荐)
- 详解微信小程序开发之城市选择器 城市切换
- Bootstrap入门书籍之(四)菜单、按钮及导航
- 常用的在数据库中建立无限级树形菜单的asp.net代码
- PHP中header用法小结
- zf框架的数据库追踪器使用示例
- mysql清除log-bin日志的方法
- 多种不同的 MySQL 的 SSL 配置
- JavaScript探测CSS动画是否已经完成的方法
- php网站被挂木马后的修复方法总结
- php cookie 详解使用实例
- JS将滑动门改为选项卡(需鼠标点击)的实现方法
- e是自然对数的底 e.vbs
- MySQL OOM 系列三 摆脱MySQL被Kill的厄运
- 浅析JavaScript中的delete运算符
- C语言中的内存泄露 怎样避免与检测
- Android 开发中线程的分析
- 详解微信小程序审核不通过的解决方法