Python处理excel根据全称自动填写简称

在工作中处理excel遇到需要根据器件生产供应商全称填写简称的一列,由于数据表格中器件数多达几万条,单纯靠excel筛选功能手动处理需要耗费大量时间,这里使用Python中的pandas模块,读取excel进行处理。

1、需求

根据存储有供应商全称简称对应的表格对应关系.xlsx,自动填写带有供应商全称的表格待处理文件.xlsx中简称的一列。

2.脚本思路

首先使用pandas读取第一个表格对应关系.xlsx,然后将其储存在一个字典中,字典的键为供应商的全称,字典的值为供应商的简称。

然后读取第二个表格待处理文件.xlsx,根据列的标题头,找到供应商全称所处在的列,根据这一列每一个供应商的全称查询字典中对应键的值,将其写入表格中对应行的简称处。(这里暂时假设对应关系和待处理文件中供应商的全称如果是同一家公司则公司全称是一模一样的,存在些许差别的处理的方法在下一篇文章中在记录)。

3.代码

# -*- coding: utf-8 -*-
"""
Created on Thu Mar 4 21:25:05 2021
@author: ruofei
"""

import pandas as pd

#填写待处理文件和对应关系的excel文件路径
#注意:脚本运行时需保证被使用excel文件处于关闭状态
file1 = r'待处理文件.xlsx'
file2 = r'对应关系.xlsx'

#填写待处理文件中 全称所在的列名和简称要放置的列名
qc1="供应商"
jc1="简称"

#填写对应关系中  全称所在的列数和简称所在的列数
qc2="全称"
jc2="简称"

#填写读取excel文件的sheet表名
sheet1="Sheet1"
sheet2="Sheet1"

#--------------------*-------------*--------------*---------------------
#--------------------*-------------*--------------*---------------------
data1 = pd.read_excel(file1, sheet_name = sheet1)
data2 = pd.read_excel(file2, sheet_name = sheet2)

#print("输出表格所有")
#print(data1)

row1 = data1.shape[0]#行数
col1=data1.shape[1]#列数

row2 = data2.shape[0]#行数
col2=data2.shape[1]#

#print("表格文件有"+str(row1)+"行,"+str(col1)+"列")

duiying=dict()

#生成对应关系的字典
for i in range(row2):

  quancheng=data2.loc[i,qc2]
  jiancheng=data2.loc[i,jc2]

  duiying[quancheng]=jiancheng

  #print(quancheng)

#company1=data1.loc[0][0]
#company2=data1.loc[1][0]
#print("公司一为"+str(company1)+"\n"+"公司二为"+str(company2))

for i in range(row1):

  a=data1.loc[i,qc1]
  #[qc1-1]
  #print(str(a))

  jiancheng=duiying.get(a)
  if a in duiying.keys():

    #print(jiancheng)
    data1.loc[i,jc1]=jiancheng
  else:

    #此处修改没有简称赋予值,若赋予全称值则=a,若为空则="  "
    data1.loc[i,jc1]=a

data1.to_excel('处理好的文件.xlsx',sheet_name='Sheet1')

4.实现功能

根据预先整理好的对应关系表格自动填写了表格中简称空白的一列,如果表格中存在对应关系中不存在的公司,则在相应的简称位置填写其全称本身。如下图中,由于表中的小米华为没有给出其简称,因此原样照填。

5.存在问题

在实际应用中处理几万条数据时,绝大部分正常,存在问题是,比如对应关系中全称为(中国)茅台公司,而在要处理的文件中不存在括号,或者括号中英文不同,或者括号中空格数不同,都会在后面读取为不同的字符串,在查询字典中显示不存在。处理方式在下篇中解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • Python实现疫情通定时自动填写功能(附代码)

    自疫情始,学校就要求学生每天在学校内系统填写个人每日疫情相关情况,称为疫情通. 但是,由于个人原因,出现了下图情况. 记性太差,人又懒,于是决定用Python实现自动化定时任务. 1.核心模块 打开IEChrome. 打开网页按下F12拿到请求头和请求体. (假装此处有图片) Pycharm启动! 根据拿到的请求头和请求体,完成核心代码编写. url = "https://xxcapp.xidian.edu.cn/ncov/wap/default/save" headers = {'C

  • Python3+Selenium+Chrome实现自动填写WPS表单

    引言   本文通过python3.第三方python库Selenium和谷歌浏览器Chrome,完成WPS表单的自动填写. 开发环境配置   python3的安装:略,网上都有教程.   Selenium的安装:在命令行输入pip3 install selenium并回车即可完成安装,如果不成功,查找网上教程.   Chrome的安装:略,网上都有教程.   因为Selenium需要ChromeDriver来驱动Chrome,所以还需要下载驱动ChromeDriver.下面重点介绍一下Chrom

  • 通过Python实现自动填写调查问卷

    0X00 前言 快开学了,看到空间里面各种求填写调查问卷的,我才想起来貌似我也还没做.对于这种无意义的问卷,我是不怎么感冒的,所以我打算使用"特技"来完成,也就是python,顺便重新复习一下python,真的好久没用了.下面,表演开始-- 0X01代码编写思路 首先先创建一份问卷 我们随便填写一个问卷并提交,在提交之前开启Burpsuite截获数据包 对于截获的数据包进行分析,有的被url编码了不利于分析,可以使用Burpsuite编码模块解码替换,这样就好分析了 通过观察可以发现,

  • Python处理excel根据全称自动填写简称

    在工作中处理excel遇到需要根据器件生产供应商全称填写简称的一列,由于数据表格中器件数多达几万条,单纯靠excel筛选功能手动处理需要耗费大量时间,这里使用Python中的pandas模块,读取excel进行处理. 1.需求 根据存储有供应商全称简称对应的表格对应关系.xlsx,自动填写带有供应商全称的表格待处理文件.xlsx中简称的一列. 2.脚本思路 首先使用pandas读取第一个表格对应关系.xlsx,然后将其储存在一个字典中,字典的键为供应商的全称,字典的值为供应商的简称. 然后读取第

  • python生成可执行exe控制Microsip自动填写号码并拨打功能

    控制的前提是已经运行Microsip.exe 首先选择文件, 选择txt格式文件,一行一个手机号格式:如下 点击拨打下一个,就会自动输入自动拨打 代码: import tkinter import win32gui import win32con from tkinter import filedialog import tkinter.messagebox import os import time def next_phone(phone): win = win32gui.FindWindo

  • Python+Selenium实现自动填写问卷

    目录 前提条件 相关介绍 实验环境 填写问卷 问卷地址 获取Xpath 主要思路 代码实现 输出结果 前提条件 熟悉Python 熟悉HTML 熟悉Xpath 熟悉Selenium 相关介绍 Python是一种跨平台的计算机程序设计语言.是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言.最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的.大型项目的开发. Time是python标准库,无需额外下载,主要用于处理时间问题. Random

  • Python自动化办公之Excel拆分与自动发邮件

    目录 需求 需求解析 代码实现 需求 需要向大约 500 名用户发送带有 Excel 附件的电子邮件,同时必须按用户从主 Excel 文件中拆分数据以创建他们自己的特定文件,然后将该文件通过电子邮件发送给正确的用户 需求解析 大致的流程就是上图,先拆分 Excel 数据,提取出对应的邮件地址和用户的数据信息,再自动添加到邮件的附件当中 代码实现 首先我们先来看下我们手中 Excel 的数据形式是怎么样的 import datetime import os import shutil from p

  • Python实现自动填写脚本流程详解

    目录 前言 环境使用 模块使用 本次案例代码实现思路 最终效果 代码实现 前言 环境使用 Python 3.8 Pycharm 模块使用 import requests —> 数据请求模块 pip install requests import parsel —> 数据解析模块 pip install parsel from selenium import webdriver —> 自动测试模块 pip install selenium==3.141.0 本次案例代码实现思路 打开考试网

  • Python操作Excel插入删除行的方法

    1. 前言 由于近期有任务需要,要写一个能够处理Excel的脚本,实现的功能是,在A表格上其中一列,对字符串进行分组和排序,然后根据排序好的A表格以固定格式自动填写到B表格上. 开始写脚本之前查了很多资料,最开始采用了openpyxl这个模块,用起来很顺手,使用这个对A表格其中一列进行了重新填写,但是后来发现,需要用到删除和插入空白行的操作,使用openpyxl比较困难,这个模块仅支持在表格的最后一行继续添加新行,不支持在中间插入和删除行. 在查找的过程中发现,网上流传了一些使用openpyxl

  • python 读取excel文件生成sql文件实例详解

    python 读取excel文件生成sql文件实例详解 学了python这么久,总算是在工作中用到一次.这次是为了从excel文件中读取数据然后写入到数据库中.这个逻辑用java来写的话就太重了,所以这次考虑通过python脚本来实现. 在此之前需要给python添加一个xlrd模块,这个模块是专门用来操作excel文件的. 在mac中可以通过easy_install xlrd命令实现自动安装模块 import xdrlib ,sys import xlrd def open_excel(fil

  • python高手之路python处理excel文件(方法汇总)

    用python来自动生成excel数据文件.python处理excel文件主要是第三方模块库xlrd.xlwt.xluntils和pyExcelerator,除此之外,python处理excel还可以用win32com和openpyxl模块. 方法一: 小罗问我怎么从excel中读取数据,然后我百了一番,做下记录 excel数据图(小罗说数据要给客户保密,我随手写了几行数据): python读取excel文件代码: #!/usr/bin/env python # -*- coding: utf-

  • Python+tkinter模拟“记住我”自动登录实例代码

    本文分享的代码主要是通过Python+tkinter模拟"记住我"自动登录的功能,具体介绍如下. 基本思路:如果某次登录成功,则创建临时文件记录有关信息,每次启动程序时尝试自动获取上次登录成功的信息并自动编写.本文主要演示思路,可根据实际系统中的需要进行改写,例如读取数据库并验证用户名和密码是否正确.对用户名和密码进行本地加密存储等等. import tkinter import tkinter.messagebox import os import os.path # 获取Windo

随机推荐