Python实现xml格式转txt格式的示例代码

目录
  • 1、前言
  • 2、分析xml、txt数据
  • 3、转换过程
  • 4、最后结果对比

1、前言

最近学习Yolo v5是遇见了个问题,找的数据集全是xml文件,VOC 的标注是 xml 格式的,而YOLO是.txt格式,那么问题就来了,手动提取肯定是不可能的,那只能借用程序解决咯。

2、分析xml、txt数据

这是xml树形结构

这是txt格式

总结:

1.提取object->name、bndbox->xmin,ymin,xmax,ymin

2.格式转化需要用公式转换

YOLO数据集txt格式:

x_center :归一化后的中心点x坐标

y_center : 归一化后的中心点y坐标

w:归一化后的目标框宽度

h: 归一化后的目标况高度

(此处归一化指的是除以图片宽和高)

VOC数据集xml格式

yolo的四个数据 xml->txt公式
x_center ((x_min+x_max)/2-1)/w_image
y_center ((y_min+y_max)/2-1)/h_image
w (x_max-x_min)/w_image
h (y_max-y_min)/h_image

3、转换过程

定义两个文件夹,train放xml数据, labels放txt数据。

代码解析:

import os
import xml.etree.ElementTree as ET
import io
find_path = './train/'    #xml所在的文件
savepath='./labels/'   #保存文件

class Voc_Yolo(object):
    def __init__(self, find_path):
        self.find_path = find_path
    def Make_txt(self, outfile):
        out = open(outfile,'w') 
        print("创建成功:{}".format(outfile))
        return out
    def Work(self, count):
    #找到文件路径
        for root, dirs, files in os.walk(self.find_path):
        #找到文件目录中每一个xml文件
            for file in files:
            #记录处理过的文件
                count += 1
                #输入、输出文件定义
                input_file = find_path + file
                outfile = savepath+file[:-4]+'.txt'
                #新建txt文件,确保文件正常保存
                out = self.Make_txt(outfile)
                #分析xml树,取出w_image、h_image
                tree=ET.parse(input_file)
                root=tree.getroot()
                size=root.find('size')
                w_image=float(size.find('width').text)
                h_image=float(size.find('height').text)
                #继续提取有效信息来计算txt中的四个数据
                for obj in root.iter('object'):
                #将类型提取出来,不同目标类型不同,本文仅有一个类别->0
                    classname=obj.find('name').text
                    cls_id = classname
                    xmlbox=obj.find('bndbox')
                    x_min=float(xmlbox.find('xmin').text)
                    x_max=float(xmlbox.find('xmax').text)
                    y_min=float(xmlbox.find('ymin').text)
                    y_max=float(xmlbox.find('ymax').text)
                    #计算公式
                    x_center=((x_min+x_max)/2-1)/w_image
                    y_center=((y_min+y_max)/2-1)/h_image
                    w=(x_max-x_min)/w_image
                    h=(y_max-y_min)/h_image
                    #文件写入
                    out.write(str(cls_id)+" "+str(x_center)+" "+str(y_center)+" "+str(w)+" "+str(h)+'\n')
                out.close()
        return count
if __name__ == "__main__":
    data = Voc_Yolo(find_path)
    number = data.Work(0)
    print(number)

4、最后结果对比

创建成功

与真实数据对比误差很小

到此这篇关于Python实现xml格式转txt格式的示例代码的文章就介绍到这了,更多相关Python xml转txt内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python代码xml转txt实例

    为了训练深度学习模型,经常要整理大量的标注数据,需统一不同格式的标注数据,一般情况下习惯读取TXT格式的数据.但实际中经常遇到XML格式的标注数据,在此举例:1.读取XML标注数据:2.写入TXT文件. XML标注数据如下 <annotation verified="no"> <folder>suE</folder> <filename>Drivingrecord_001</filename> <path>C:\D

  • 解决python将xml格式文件转换成txt文件的问题(xml.etree方法)

    概述 先来介绍一下xml格式的文件,从数据分析的角度去看xml格式的数据集,具有以下的优点开放性(能在任何平台上读取和处理数据,允许通过一些网络协议交换xml数据).简单性(纯文本,能在不同的系统之间交换数据).结构和内容分离(不同于HTML,数据的显示和数据本身是分开的).可扩展性(派生出其他标记语言) 问题描述 那么我们在进行数据分析的时候,如何运用xml里面的数据呢? 我们就需要将这类文件转化成其他类型的文件. (其实我认为说成提取xml的数据组成新的类型文件比较好一点) 就我个人的观点,

  • Python实现xml格式转txt格式的示例代码

    目录 1.前言 2.分析xml.txt数据 3.转换过程 4.最后结果对比 1.前言 最近学习Yolo v5是遇见了个问题,找的数据集全是xml文件,VOC 的标注是 xml 格式的,而YOLO是.txt格式,那么问题就来了,手动提取肯定是不可能的,那只能借用程序解决咯. 2.分析xml.txt数据 这是xml树形结构 这是txt格式 总结: 1.提取object->name.bndbox->xmin,ymin,xmax,ymin 2.格式转化需要用公式转换 YOLO数据集txt格式: x_c

  • Python实现绘制Matlab格式的地图边框的示例代码

    目录 1.Python绘制色斑图 2.Python绘制比例尺.指南针 3.Python绘制Matlab格式的地图边框 1.Python绘制色斑图 import matplotlib.pyplot as plt import numpy as np from cartopy.mpl.ticker import LongitudeFormatter, LatitudeFormatter import cartopy.crs as ccrs import cartopy.feature as cfea

  • Python编程pygame模块实现移动的小车示例代码

    Pygame是跨平台Python模块,专为电子游戏设计,包含图像.声音.建立在SDL基础上,允许实时电子游戏研发而无需被低级语言(如机器语言和汇编语言)束缚. 最近一个星期学习了一下python的pygame模块,顺便做个小程序巩固所学的,运行效果如下: 其中,背景图"highway.jpg"是使用PhotoShop将其分辨率改变为640 × 480,而小车"car.png"则是将其转变为png格式的图片,并且填充其背景色,让其拥有透明性. 代码测试可用: # -*

  • Python tkinter界面实现历史天气查询的示例代码

    一.实现效果 1. python代码 import requests from lxml import etree import re import tkinter as tk from PIL import Image, ImageTk from xpinyin import Pinyin def get_image(file_nam, width, height): im = Image.open(file_nam).resize((width, height)) return ImageT

  • Python使用pickle进行序列化和反序列化的示例代码

    一.说明 早上看到Python使用pickle进行序列化和反序列化,然后发现面临的一个获取不到返回值的框架,似乎可以通过在框架中先序列化,然后在外部进行反序列化的方法来实现.就研究了一下pickle库的具体使用. 本身也没什么复杂,一方面还是怕忘记,另一方面是自从学Java听到反序化这个词开始就有一种莫明其妙的恐具感总觉得是什么高大上的东西.Java反序列化可参见"Java反序列化漏洞实现". 二.代码实现 import pickle class BeSerializing: def

  • python多线程爬取西刺代理的示例代码

    西刺代理是一个国内IP代理,由于代理倒闭了,所以我就把原来的代码放出来供大家学习吧. 镜像地址:https://www.blib.cn/url/xcdl.html 首先找到所有的tr标签,与class="odd"的标签,然后提取出来. 然后再依次找到tr标签里面的所有td标签,然后只提取出里面的[1,2,5,9]这四个标签的位置,其他的不提取. 最后可以写出提取单一页面的代码,提取后将其保存到文件中. import sys,re,threading import requests,lx

  • python 按照sheet合并多个Excel的示例代码(多个sheet)

    工作中会遇到这样的需求,有多个Excel的格式一样,都有多个sheet,且每个sheet的名字和格式一样,我们需要按照sheet 合并,就是说合并后的表的格式和合并钱的格式是一样的.A.B.C表格式如图 现在需要合并成下图: 我这次处理是保留第一个表的首行,其余的表的首行都不保留.因此结果会和上面有所不同,上面的是将所有的首行都保存 import xlrd,xlsxwriter #待合并excel allxls=["C:/xxx/xxx.xlsx", "C:/xxx/xxx.

  • Python批量解压&压缩文件夹的示例代码

    目录 一.python批量解压 二.python批量压缩 一.python批量解压 提示:如果是重要数据解压前请先备份,解压后会覆盖原压缩文件!! 解压前: 解压后:文件名为英文: 文件名中包含中文: 代码如下 import os import shutil import zipfile # 首先引入需要的工具包 # shutil为后期移动文件所需,可以忽略此项 # 路径改这里! #parent_path = r'输入路径,会解压该路径下的所有zip压缩文件' parent_path = r'E

  • Python实现动态二维码生成的示例代码

    目录 第一个库:MyQR 普通的二维码制作 带背景图片的二维码制作 带动图背景的二维码制作 第二个库:qrcode 简单的二维码制作 带背景图片的二维码制作 大家好,我是辰哥~ 今天给大家分享两个制作二维码的Python库,可以生成普通的二维码.图片背景版二维码.动图GIF版二维. 第一个库:MyQR 安装 pip install MyQR 普通的二维码制作 from MyQR import myqr #运行 myqr.run('http://mtw.so/5w0Ubz') 二维码附上了链接,用

  • Python使用pickle模块存储数据报错解决示例代码

    本文研究的主要是Python使用pickle模块存储数据报错解决方法,以代码的形式展示,具体如下. 首先来了解下pickle模块 pickle提供了一个简单的持久化功能.可以将对象以文件的形式存放在磁盘上. pickle模块只能在python中使用,python中几乎所有的数据类型(列表,字典,集合,类等)都可以用pickle来序列化, pickle序列化后的数据,可读性差,人一般无法识别. 接下来我们看下Python使用pickle模块存储数据报错解决方法. 代码: # 写入错误 TypeEr

随机推荐