用Python实现筛选文件脚本的方法
在做项目时遇到需要标记数据集里面的若干图片数据,作为程序员,为避免手动一张一张的筛选,所以写了这个Python脚本实现。
Python脚本如下:
# from PIL import Image import csv import os import shutil filename = 'img.txt' def readImageName(): with open(filename) as f: lines = f.readlines() imgnames = [] for line in lines: imgnames.append(line.strip().strip(".jpg")[-4:]) print(imgnames) return imgnames def pickImg(): pickImageNames = readImageName() # 遍历所有图片集的文件名 for image in os.listdir(r"C:\Users\Administrator.PC-201708272051\Desktop\项目组\text_detect_label_data\China_SameBrowser"): # print(image[:-4]) if image[:-4] in pickImageNames: # pickImage = Image.open((r"C:\Users\Administrator.PC-201708272051\Desktop\项目组\text_detect_label_data\China_SameBrowser/%s") % image) # pickImage.save((r"C:/Users/Administrator.PC-201708272051/Desktop/labeldata/%s") % image) oldname= r"C:\Users\Administrator.PC-201708272051\Desktop\项目组\text_detect_label_data\China_SameBrowser/" + image newname= r"C:/Users/Administrator.PC-201708272051/Desktop/labeldata/" + image shutil.copyfile(oldname,newname) # readImageName() pickImg()
以上这篇用Python实现筛选文件脚本的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
相关推荐
-
使用python对多个txt文件中的数据进行筛选的方法
一.问题描述 筛选出多个txt文件中需要的数据 二.数据准备 这是我自己建立的要处理的文件,里面是随意写的一些数字和字母 三.程序编写 import os def eachFile(filepath): pathDir =os.listdir(filepath) #遍历文件夹中的text return pathDir def readfile(name): fopen=open(name,'r') for lines in fopen.readlines(): #按行读取text中的内容 lin
-
Python判断两个文件是否相同与两个文本进行相同项筛选的方法
python判断两个文件是否相同 import hashlib def getHash(f): line=f.readline() hash=hashlib.md5() while(line): hash.update(line) line=f.readline() return hash.hexdigest() def IsHashEqual(f1,f2): str1=getHash(f1) str2=getHash(f2) return str1==str2 if __name__ == '
-
python 用正则表达式筛选文本信息的实例
本文主要介绍如何对多个文本进行读取,并采用正则表达式对其中的信息进行筛选,将筛选出来的信息存写到一个新文本. 文本基础操作 打开文件:open('文件名','打开方式')>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').为避免报错,在文件名的引号前加个r. 文件打开方式:只读--r或rt,rb为二进制文件:打开文件前清空文件内容--w或wt:在文末写入--a+: 清空内容然后在文末写入--w+:写到文件任意位置--r+; 关
-
Python实现多条件筛选目标数据功能【测试可用】
本文实例讲述了Python实现多条件筛选目标数据功能.分享给大家供大家参考,具体如下: python中提供了一些数据过滤功能,可以使用内建函数,也可以使用循环语句来判断,或者使用pandas库,当然在有些情况下使用pandas是为了提高工作效率.举例如下: a = [('chic', 'JJ'), ('although', 'IN'), ('menu', 'JJ'), ('items', 'NNS'), ('doesnt', 'JJ'), ('scream', 'NN'), ('french',
-
用Python实现筛选文件脚本的方法
在做项目时遇到需要标记数据集里面的若干图片数据,作为程序员,为避免手动一张一张的筛选,所以写了这个Python脚本实现. Python脚本如下: # from PIL import Image import csv import os import shutil filename = 'img.txt' def readImageName(): with open(filename) as f: lines = f.readlines() imgnames = [] for line in li
-
Python模拟浏览器上传文件脚本的方法(Multipart/form-data格式)
http协议本身的原始方法不支持multipart/form-data请求,这个请求由原始方法演变而来的. multipart/form-data的基础方法是post,也就是说是由post方法来组合实现的,与post方法的不同之处:请求头,请求体. multipart/form-data的请求头必须包含一个特殊的头信息:Content-Type,且其值也必须规定为multipart/form-data,同时还需要规定一个内容分割符用于分割请求体中的多个post的内容,如文件内容和文本内容自然需要
-
恢复百度云盘本地误删的文件脚本(简单方法)
今天被同步盘搞得焦头烂额. 辛苦码的代码(除了重要的.备份过的)都被删掉了-- 当时我就石化了... 随后发现同步盘目录有个delete目录,里面还有manifest.xml,和一堆改了名的文件, 看到manifest.xml的内容时,瞬间觉得有救了,立马开搞python 废话不多说,直接上代码: #-*- coding:utf-8 -*- from xml.etree import ElementTree import os import sys reload(sys) sys.setdefa
-
Python实现修改文件内容的方法分析
本文实例讲述了Python实现修改文件内容的方法.分享给大家供大家参考,具体如下: 1 替换文件中的一行 1.1 修改原文件 ① 要把文件中的一行Server=192.168.22.22中的IP地址替换掉,因此把整行替换. data = '' with open('zhai.conf', 'r+') as f: for line in f.readlines(): if(line.find('Server') == 0): line = 'Server=%s' % ('192.168.1.1',
-
对python实现模板生成脚本的方法详解
最近项目需要,针对主项目提取一个小的基础版本,供于在新建项目时使用,所以就有这个python模板生成脚本,其作用如下: 1.通过配置文件来控制模板中的数据.格式化的过滤条件 2.执行后会把目录下所有的文件都会执行一篇 #!/usr/bin/python #encoding: utf-8 import json import codecs import os def get_files(root_path): for dir in os.walk(root_path): if dir[2]: fo
-
利用python修改json文件的value方法
做工程时遇到需要监听json文件,根据json文件中的key-value值作出相应处理的情形.为此写了修改json文件的python脚本供工程后续调用. 代码如下: # coding=utf-8 //设置文本格式 import os,sys import json def get_new_json(filepath,key,value): key_ = key.split(".") key_length = len(key_) with open(filepath, 'rb') as
-
python获取mp3文件信息的方法
本文实例讲述了python获取mp3文件信息的方法.分享给大家供大家参考.具体如下: 将代码生成.py文件放在目录下运行,可以获取该目录的所有mp3文件的信息,需要使用ID3库 import os, sys from ID3 import * files = os.listdir(os.getcwd()) for f in files: x = os.path.splitext(f) if x[1] == '.mp3': n = x[0].split(' - ') author = n[0] t
-
Python实现大文件排序的方法
本文实例讲述了Python实现大文件排序的方法.分享给大家供大家参考.具体实现方法如下: import gzip import os from multiprocessing import Process, Queue, Pipe, current_process, freeze_support from datetime import datetime def sort_worker(input,output): while True: lines = input.get().splitlin
-
Python读取csv文件分隔符设置方法
Windows下的分隔符默认的是逗号,而MAC的分隔符是分号.拿到一份用分号分割的CSV文件,在Win下是无法正确读取的,因为CSV模块默认调用的是Excel的规则. 所以我们在读取文件的时候需要添加分割符变量. import csv import os cwd = os.getcwd() print ("Current folder is %s" % (cwd) ) csvfile = open( cwd + '\data\eclipse\change-metrics.csv','r
-
对Python之gzip文件读写的方法详解
gzip文件读写的时候需要用到Python的gzip模块. 具体使用如下: # -*- coding: utf-8 -*- import gzip # 写文件 f_out = gzip.open("xxx.gz", "wb") # 读文件 # f_in = gzip.open("xxx.gz", "rb") for line in open("yyy.txt", "rb"): f_out
随机推荐
- Mootools 1.2教程(21)——类(二)
- 在Python中移动目录结构的方法
- 轻松修复Discuz!数据库
- CI框架Session.php源码分析
- Python的一些用法分享
- 详解Python中open()函数指定文件打开方式的用法
- Android 自定义View 密码框实例代码
- C#实现线程安全的简易日志记录方法
- MySQL OOM 系列一 Linux内存分配
- Android开发仿QQ空间根据位置弹出PopupWindow显示更多操作效果
- ajax处理服务器返回的三种数据类型方法
- struts2入门Demo示例
- JSP之plugin的使用
- PHP 存取 MySQL 数据库的一个例子
- MongoDB教程之数据操作实例
- js中的DOM模拟购物车功能
- PHP实现MySQL更新记录的代码
- Python lambda函数基本用法实例分析
- 在Pandas中处理NaN值的方法
- elementui之el-tebs浏览器卡死的问题和使用报错未注册问题