Python对130w+张图片检索的实现方法

任务说明:

130w+张图片,8张excel表里记录了需要检索图片的文件名,现在需要找出对应的图片,将找出的图片按不同的excel分别保存,并且在excel里能够直接打开图片。

任务分析:

如果数据量不大的话,可以直接读取excel表里的文件名进行搜索保存,但这次的任务显然不合适,因为图片实在太多,所以考虑后按照以下步骤:

1、遍历图片文件夹,读取文件名和文件路径,写入到csv文件中;

2、使用pandas的merge函数,实现8张原始excel表与csv文件根据图片文件名的对碰;

3、使用shutil的copy函数,读取文件路径进行保存。

代码分析:

1、文件遍历

import os
import pandas as pd

file_list = []
path_list = []
path = r"此处添加图片路径"
print("任务开始")
for root,dirs,files in os.walk(path):
 for file in files:
  file_list.append(file.split('.')[0])
  path_list.append(os.path.join(root,file))
print("文件遍历结束")
file_dic = dict(zip(file_list,path_list))
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['图片1路径']).reset_index().rename(columns={'index':'图片1'})
df.to_csv("图片1.csv")
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['图片2路径']).reset_index().rename(columns={'index':'图片2'})
df.to_csv("图片2.csv")
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['图片3路径']).reset_index().rename(columns={'index':'图片3'})
df.to_csv("图片3.csv")
print("文件目录导出成功")

2、表格对碰

import pandas as pd
frame1 = pd.read_excel(r'excel表1.xlsx', 'sheet名')
frame2 = pd.read_csv(r'图片1.csv', sep=',')
frame3 = pd.read_csv(r'图片2.csv', sep=',')
frame4 = pd.read_csv(r'图片3.csv', sep=',')
frame5 = pd.merge(frame1, frame2, on = ['图片1'], how = 'left')
frame6 = pd.merge(frame5, frame3, on = ['图片2'], how = 'left')
frame7 = pd.merge(frame6, frame4, on = ['图片3'], how = 'left')
col = ['图片1','图片2','图片3']
frame7[col] = frame7[col].fillna('未找到')
frame7.to_excel('excel表1合并后.xlsx')

3、图片复制

import shutil
target = '此处为excel表1导出图片路径'
copylist1 = frame7['图片1']
for src in copylist1:
  if src != '未找到':
    shutil.copy(src, target)
copylist2 = frame7['图片2']
for src in copylist2:
  if src != '未找到':
    shutil.copy(src, target)
copylist3 = frame7['图片3']
for src in copylist3:
  if src != '未找到':
    shutil.copy(src, target)
print('复制完毕')

4、excel里打开图片,可以使用excel自带的hyperlink函数。

总结

到此这篇关于Python对130w+张图片检索实现的文章就介绍到这了,更多相关Python图片检索内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python对130w+张图片检索的实现方法

    任务说明: 130w+张图片,8张excel表里记录了需要检索图片的文件名,现在需要找出对应的图片,将找出的图片按不同的excel分别保存,并且在excel里能够直接打开图片. 任务分析: 如果数据量不大的话,可以直接读取excel表里的文件名进行搜索保存,但这次的任务显然不合适,因为图片实在太多,所以考虑后按照以下步骤: 1.遍历图片文件夹,读取文件名和文件路径,写入到csv文件中: 2.使用pandas的merge函数,实现8张原始excel表与csv文件根据图片文件名的对碰: 3.使用sh

  • python使用xlrd实现检索excel中某列含有指定字符串记录的方法

    本文实例讲述了python使用xlrd实现检索excel中某列含有指定字符串记录的方法.分享给大家供大家参考.具体分析如下: 这里利用xlrd,将excel中某列数据中,含有指定字符串的记录取出,并生成用这个字符串命名的txt文件 import os import xlrd,sys # input the excel file Filename=raw_input('input the file name&path:') if not os.path.isfile(Filename): rais

  • python 比较2张图片的相似度的方法示例

    本文介绍了python 比较2张图片的相似度的方法示例,分享给大家,具体如下: #!/usr/bin/python # -*- coding: UTF-8 -*- import cv2 import numpy as np #均值哈希算法 def aHash(img): #缩放为8*8 img=cv2.resize(img,(8,8),interpolation=cv2.INTER_CUBIC) #转换为灰度图 gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

  • 利用python模拟实现POST请求提交图片的方法

    本文主要给大家介绍的是关于利用python模拟实现POST请求提交图片的方法,分享出来供大家参考学习,下面来一看看详细的介绍: 使用requests来模拟HTTP请求本来是一件非常轻松的事情,比如上传图片来说,简单的几行代码即可: import requests files = {'attachment_file': ('1.png', open('1.png', 'rb'), 'image/png', {})} values = {'next':"http://www.xxxx.com/xxx

  • 使用Python中的tkinter模块作图的方法

    python简述: Python是一种解释型.面向对象.动态数据类型的高级程序设计语言.自从20世纪90年代初Python语言诞生至今,它逐渐被广泛应用于处理系统管理任务和Web编程.Python[1]已经成为最受欢迎的程序设计语言之一.2011年1月,它被TIOBE编程语言排行榜评为2010年度语言.自从2004年以后,python的使用率是呈线性增长. tkinter模块介绍 tkinter模块("Tk 接口")是Python的标准Tk GUI工具包的接口.Tk和Tkinter可以

  • Python实现图片滑动式验证识别方法

    1 abstract 验证码作为一种自然人的机器人的判别工具,被广泛的用于各种防止程序做自动化的场景中.传统的字符型验证安全性已经名存实亡的情况下,各种新型的验证码如雨后春笋般涌现.目前最常见的一种形式就是"滑动拼图式" 2 内容概述 关于滑动式验证,最早由国内某网络安全公司首次提出的行为式验证,以滑动拼图解锁的方式呈现在世人面前.然后大概过了好几年之后,各种各样的滑动式验证产品都出来了,那么这些看似一样的产品,它们的安全性到底如何呢? 本文特意挑选出了一些后来者的小厂商的滑动式验证来

  • Python正则匹配判断手机号是否合法的方法

    正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达式.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),是计算机科学的一个概念.正则表达式使用单个字符串来描述.匹配一系列匹配某个句法规则的字符串.在很多文本编辑器里,正则表达式通常被用来检索.替换那些匹配某个模式的文本. # 需求 # 定义一个函数,用于判断输入的手机号是否合法 # 并判断它的运营商 # 思路步骤: # 1.首先了解三大运营商的号段分布 # 2.获取用户输入内容 #

  • python实现两张图片拼接为一张图片并保存

    本文实例为大家分享了python实现两张图片拼接为一张图片并保存的具体代码,供大家参考,具体内容如下 这里主要用Python扩展库pillow中Image对象的paste()方法把两张图片拼接起来 from os import listdir from PIL import Image def pinjie(): # 获取当前文件夹中所有JPG图像 im_list = [Image.open(fn) for fn in listdir() if fn.endswith('.jpg')] # 图片

  • Python合并多个Excel数据的方法

    安装模块 1.找到对应的模块   http://www.python-excel.org/ 2.用pip install 安装 pip install xlrd pip install XlsxWriter pip list查看 XlsxWriter示例 import xlsxwriter # 创建一个工作簿并添加一个工作表 workbook = xlsxwriter.Workbook("demo.xlsx") worksheet = workbook.add_worksheet()

  • 使用python绘制3维正态分布图的方法

    今天使用python画了几个好玩的3D展示图,现在分享给大家. 先贴上图片 使用的python工具包为: from matplotlib import pyplot as plt import numpy as np from mpl_toolkits.mplot3d import Axes3D 在贴代码之前,有必要从整体上了解这些图是如何画出来的.可以把上面每一个3D图片理解成一个长方体.输入数据是三维的,x轴y轴和z轴.在第三个图片里面有x.y和z坐标的标识.在第三张图片中,我们可以理解为,

随机推荐