python使用pandas按照行数分割表格

2025-02-20 12:53:02

问题

一张excel表格，大概1万行，需要录入系统
系统每次最多只能录入500行表格数据，一旦超过500行，就会录入失败
需要把1万行的数据按照500行分割，形成20个表格，这样才能录入系统

思路

使用pandas得到总行数，比如10002行，分割表格的时候，要保留一行表头
第一张表，是1-500行，第二张表是 501-1000，以此类推
最后一张表应该是1000-10002行，生成的表格数量是10000/500+1,21张
生成的表格按照顺序保存到一个目录中
写一个函数，可以按照任意指定的分割数量进行分割。

代码实现

#按行数分割表格函数
#问题
#1.如果有有一个十万行表格，要录入系统，但是系统每次最多只能录入500行？
#解决问题：
#1.按照指定的行数分割表格
#2.分割出来的表格按照序号命名
import pandas as pd
import os
def SplitExcel(file,num):
    file_dir='result'   #创建目录
    if os.path.isdir(file_dir):
        os.rmdir(file_dir)
    else:
        os.mkdir(file_dir)
    n = 1
    row_list = []
    df = pd.DataFrame(pd.read_excel(file, sheet_name=0))
    row_num = int(df.shape[0])  # 获取行数
    if num >= row_num:  #如果分割行数大于总行数，报错
        raise Exception('too much!!')
    try:
        for i in list(range(num,row_num,num)):
            row_list.append(i)
        row_list.append(row_num)  # 得到完整列表
    except Exception as e:
        print (e)

    (name,ext)=os.path.splitext(file)  #获取文件名

    for m in row_list:

        filename=os.path.join(file_dir,name+'-' + str(n) + '.xlsx')
        if m <row_num:
            df_handle=df.iloc[m-num:m] #获取n行之前
            print (df_handle)
            df_handle.to_excel(filename , sheet_name='sheet1',index=False)
        elif m == int(row_num):
            remainder=int(int(row_num)%num) #余数
            df_handle=df.iloc[m-remainder:m] #获取最后不能整除的行
            df_handle.to_excel(filename , sheet_name='sheet1', index=False)
        n = n + 1

if __name__=='__main__':
    file= 'result.xls'
    SplitExcel(file,num=10)

测试效果

一张83行的表格，去除表头，一共82行，按照10行分割，一共要获得9张表格，最后一张表格，应该只有两行，中间的表格，数据必须是连续的，

分割前

分割后

到此这篇关于python使用pandas按照行数分割表格的文章就介绍到这了,更多相关pandas按行分割表格内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

pandas 如何分割字符的实现方法

摘要:本文主要是在pandas中如何对字符串进行切分.我们考虑一下下面的应用场景. 这个是我们的数据集(data),可以看到,数据集中某一列(name)是某个行业的分类.各个行业之间用符号 '|'分割.我们要把用每个'|'进行分割的内容抽取出来.pandas有个一步到到位的方法,非常方便. import pandas as pd data['name'].str.split('|',expand=True) 关键是参数expand,这个参数取True时,会把切割出来的内容当做一列. 如果不需要p
Pandas中DataFrame的分组/分割/合并的实现

学习<Python3爬虫.数据清洗与可视化实战>时自己的一些实践. DataFrame分组操作注意分组后得到的就是Series对象了,而不再是DataFrame对象. import pandas as pd # 还是读取这份文件 df = pd.read_csv("E:/Data/practice/taobao_data.csv", delimiter=',', encoding='utf-8', header=0) # 计算'成交量'按'位置'分组的平均值 groupe
python使用pandas实现数据分割实例代码

本文研究的主要是Python编程通过pandas将数据分割成时间跨度相等的数据块的相关内容,具体如下. 先上数据,有如下dataframe格式的数据,列名分别为date.ip,我需要统计每5s内出现的ip,以及这些ip出现的频数. ip date 0 127.0.0.21 15/Jul/2017:18:22:16 1 127.0.0.13 15/Jul/2017:18:22:16 2 127.0.0.11 15/Jul/2017:18:22:17 3 127.0.0.11 15/Jul/2017
python使用pandas按照行数分割表格

目录问题思路代码实现测试效果问题一张excel表格,大概1万行,需要录入系统系统每次最多只能录入500行表格数据,一旦超过500行,就会录入失败需要把1万行的数据按照500行分割,形成20个表格,这样才能录入系统思路使用pandas得到总行数,比如10002行,分割表格的时候,要保留一行表头第一张表,是1-500行,第二张表是 501-1000,以此类推最后一张表应该是1000-10002行,生成的表格数量是10000/500+1,21张生成的表格按照顺序保存到一个目录
js动态生成指定行数的表格

下面用js实现可以生成用户所需行数的表格. 1.首先在body中填入下列代码,获取用户填入的行数值复制代码代码如下: <table> <tr> <td>动态生成表格</td> <td><input id="Cold" type="text" class="input" size="10" name="Num"/>行</td&g
python实现统计代码行数的方法

本文实例讲述了python实现统计代码行数的方法.分享给大家供大家参考.具体实现方法如下: ''' Author: liupengfei Function: count lines of code in a folder iteratively Shell-format: cmd [dir] Attention: default file encode is utf8 and default file type is java-source-file. But users can customi
python实现统计代码行数的小工具

一个用python实现的统计代码行数的小工具,供大家参考,具体内容如下实现功能计算出某一目录以及子目录下代码文件的行数在计算代码的过程中,只对标准命名的文件进行统计,如[文件名.文件类型] 排除了以"#"开头的包含文件,宏定义等,如#include, #define, #pragma等排除了c,cpp文件中的"//", "/-/"等的注释排除了python文件中import, from 等开头的导入使用方法新建countLines.
Python脚本实现代码行数统计代码分享

之前用bash实现过(http://www.jb51.net/article/61943.htm),不过那个不能在windows下使用,所以就写了个python版,也方便我以后使用--这里就不多介绍了,不懂的google下. 实现代码复制代码代码如下: #!/usr/bin/python ''' File : count.py Author : Mike E-Mail : Mike_Zhang@live.com ''' i
python DataFrame获取行数、列数、索引及第几行第几列的值方法

1.df=DataFrame([{'A':'11','B':'12'},{'A':'111','B':'121'},{'A':'1111','B':'1211'}]) print df.columns.size#列数 2 print df.iloc[:,0].size#行数 3 print df.ix[[0]].index.values[0]#索引值 0 print df.ix[[0]].values[0][0]#第一行第一列的值 11 print df.ix[[1]].values[0][1]
Python pandas按行、按列遍历DataFrame的几种方式

目录前言一.按行遍历 1. 使用loc或iloc方法 2. 使用iterrows()方法二.按列遍历 1. 使用列索引方式 2. 使用iteritems()方法补充:遍历dataframe每一行的每一个元素总结前言在对DataFrame数据进行处理时,存在需要对数据内容进行遍历的场景.因此记录一下按照行,列遍历的几种方式. 一.按行遍历 1. 使用loc或iloc方法 loc:表示location,填写内容为行的值或者列表,若填写内容为值,则返回对应行的内容(Series类型):若
基于JavaScript实现动态创建表格和增加表格行数

在工作,项目需求中,有时候表格的行数不能够满足我们的需求,这时需要我们动态的增加表格的行数,下面小编通过一段代码实例给大家介绍js创建表格和增加表格的行数的方法,并且还实现了隔行变色功能.对此感兴趣的朋友可以参考一下代码: js代码如下所示: <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>动态操作表格</title> </head>
python中pandas.DataFrame排除特定行方法示例

前言大家在使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame,关于python中pandas.DataFrame的基本操作,大家可以查看这篇文章. pandas.DataFrame排除特定行如果我们想要像Excel的筛选那样,只要其中的一行或某几行,可以使用isin()方法,将需要的行的值以列表方式传入,还可以传入字典,指定列进行筛选. 但是如果我们只想要所有内容中不包含特定行的内容,却并没有一个isnotin()方法.我今天的工作就遇到了这样的需
python中pandas.DataFrame对行与列求和及添加新行与列示例

本文介绍的是python中pandas.DataFrame对行与列求和及添加新行与列的相关资料,下面话不多说,来看看详细的介绍吧. 方法如下: 导入模块: from pandas import DataFrame import pandas as pd import numpy as np 生成DataFrame数据 df = DataFrame(np.random.randn(4, 5), columns=['A', 'B', 'C', 'D', 'E']) DataFrame数据预览: A

python使用pandas按照行数分割表格

目录

问题

思路

代码实现

测试效果

相关推荐

随机推荐