如何将Yolov5的detect.py修改为可以直接调用的函数详解

2024-09-28 10:39:24

前几天学习了Yolov5，当我想实际将Yolov5实际运用的时候却不知道怎么办了

然后我决定对Yolov5的detect.py修改为可以直接调用的函数

因为我只需要识别图片，所以我将detect.py修改为只要传入一张图片他就可以返回坐标

ps：我这里用的是Yolov5（6.0版本）

# Copyright (c) 2022 guluC

#导入需要的库
import os
import sys
from pathlib import Path
import numpy as np
import cv2
import torch
import torch.backends.cudnn as cudnn

#初始化目录
FILE = Path(__file__).resolve()
ROOT = FILE.parents[0]  # 定义YOLOv5的根目录
if str(ROOT) not in sys.path:
    sys.path.append(str(ROOT))  # 将YOLOv5的根目录添加到环境变量中（程序结束后删除）
ROOT = Path(os.path.relpath(ROOT, Path.cwd()))  # relative

from models.common import DetectMultiBackend
from utils.datasets import IMG_FORMATS, VID_FORMATS, LoadImages, LoadStreams
from utils.general import (LOGGER, check_file, check_img_size, check_imshow, check_requirements, colorstr,
                           increment_path, non_max_suppression, print_args, scale_coords, strip_optimizer, xyxy2xywh)
from utils.plots import Annotator, colors, save_one_box
from utils.torch_utils import select_device, time_sync

#导入letterbox
from utils.augmentations import Albumentations, augment_hsv, copy_paste, letterbox, mixup, random_perspective

weights=ROOT / 'yolov5s.pt'  # 权重文件地址   .pt文件
source=ROOT / 'data/images'  # 测试数据文件(图片或视频)的保存路径
data=ROOT / 'data/coco128.yaml'  # 标签文件地址   .yaml文件

imgsz=(640, 640)  # 输入图片的大小 默认640(pixels)
conf_thres=0.25  # object置信度阈值 默认0.25  用在nms中
iou_thres=0.45  # 做nms的iou阈值 默认0.45   用在nms中
max_det=1000  # 每张图片最多的目标数量  用在nms中
device='0'  # 设置代码执行的设备 cuda device, i.e. 0 or 0,1,2,3 or cpu
classes=None  # 在nms中是否是只保留某些特定的类 默认是None 就是所有类只要满足条件都可以保留 --class 0, or --class 0 2 3
agnostic_nms=False  # 进行nms是否也除去不同类别之间的框 默认False
augment=False  # 预测是否也要采用数据增强 TTA 默认False
visualize=False  # 特征图可视化 默认FALSE
half=False  # 是否使用半精度 Float16 推理 可以缩短推理时间 但是默认是False
dnn=False  # 使用OpenCV DNN进行ONNX推理

# 获取设备
device = select_device(device)

# 载入模型
model = DetectMultiBackend(weights, device=device, dnn=dnn, data=data)
stride, names, pt, jit, onnx, engine = model.stride, model.names, model.pt, model.jit, model.onnx, model.engine
imgsz = check_img_size(imgsz, s=stride)  # 检查图片尺寸

# Half
# 使用半精度 Float16 推理
half &= (pt or jit or onnx or engine) and device.type != 'cpu'  # FP16 supported on limited backends with CUDA
if pt or jit:
    model.model.half() if half else model.model.float()
def detect(img):
    # Dataloader
    # 载入数据
    dataset = LoadImages(source, img_size=imgsz, stride=stride, auto=pt)
    # Run inference
    # 开始预测
    model.warmup(imgsz=(1, 3, *imgsz), half=half)  # warmup
    dt, seen = [0.0, 0.0, 0.0], 0
    #对图片进行处理
    im0 = img
    # Padded resize
    im = letterbox(im0, imgsz, stride, auto=pt)[0]
    # Convert
    im = im.transpose((2, 0, 1))[::-1]  # HWC to CHW, BGR to RGB
    im = np.ascontiguousarray(im)
    t1 = time_sync()
    im = torch.from_numpy(im).to(device)
    im = im.half() if half else im.float()  # uint8 to fp16/32
    im /= 255  # 0 - 255 to 0.0 - 1.0
    if len(im.shape) == 3:
        im = im[None]  # expand for batch dim
    t2 = time_sync()
    dt[0] += t2 - t1
    # Inference
    # 预测
    pred = model(im, augment=augment, visualize=visualize)
    t3 = time_sync()
    dt[1] += t3 - t2
    # NMS
    pred = non_max_suppression(pred, conf_thres, iou_thres, classes, agnostic_nms, max_det=max_det)
    dt[2] += time_sync() - t3
    #用于存放结果
    detections=[]
    # Process predictions
    for i, det in enumerate(pred):  # per image 每张图片
        seen += 1
        # im0 = im0s.copy()
        if len(det):
            # Rescale boxes from img_size to im0 size
            det[:, :4] = scale_coords(im.shape[2:], det[:, :4], im0.shape).round()
            # Write results
            # 写入结果
            for *xyxy, conf, cls in reversed(det):
                xywh = (xyxy2xywh(torch.tensor(xyxy).view(1, 4))).view(-1).tolist()
                xywh = [round(x) for x in xywh]
                xywh = [xywh[0] - xywh[2] // 2, xywh[1] - xywh[3] // 2, xywh[2],
                        xywh[3]]  # 检测到目标位置，格式：（left，top，w，h）
                cls = names[int(cls)]
                conf = float(conf)
                detections.append({'class': cls, 'conf': conf, 'position': xywh})
    #输出结果
    for i in detections:
        print(i)
    #推测的时间
    LOGGER.info(f'({t3 - t2:.3f}s)')
    return detections
path = 'C://Users//25096//Desktop//yoloV5//yolov5//yolov5-master//data//images//zidane.jpg'
img = cv2.imread(path)
#传入一张图片
detect(img)

我这里用的是Yolov5自带的zidane.jpg

这是输出结果

class：标签的名称

conf：置信度

position：xywh ( 左上角x,左上角y,宽，高 )

总结

到此这篇关于如何将Yolov5的detect.py修改为可以直接调用的函数的文章就介绍到这了,更多相关Yolov5的detect.py直接调用函数内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

如何将Yolov5的detect.py修改为可以直接调用的函数详解

前几天学习了Yolov5,当我想实际将Yolov5实际运用的时候却不知道怎么办了然后我决定对Yolov5的detect.py修改为可以直接调用的函数因为我只需要识别图片,所以我将detect.py修改为只要传入一张图片他就可以返回坐标 ps:我这里用的是Yolov5(6.0版本) # Copyright (c) 2022 guluC #导入需要的库 import os import sys from pathlib import Path import numpy as np import
对Pycharm创建py文件时自定义头部模板的方法详解

如下所示: # -*- coding: utf-8 -*- """ ------------------------------------------------- File Name: ${NAME} Description : Author : ${USER} date: ${DATE} ------------------------------------------------- Change Activity: ${DATE}: ----------------
对python修改xml文件的节点值方法详解

这是我的xml文件结构 <?xml version='1.0' encoding='utf-8'?> <annotation> <folder>JPEGImages</folder> <filename>train_2018-05-08_1000.jpg</filename> <path>D:\all_data\2018-05-08\JPEGImages\train_2018-05-08_1000.jpg</path
python修改文件内容的3种方法详解

这篇文章主要介绍了python修改文件内容的3种方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下一.修改原文件方式 def alter(file,old_str,new_str): """ 替换文件中的字符串 :param file:文件名 :param old_str:就字符串 :param new_str:新字符串 :return: """ file_data = "&qu
MFC修改编辑框光标显示位置方法详解

当前的开发环境:VS2010,32位 MFC框架使用MFC中系统CComboBox控件时,会有三种风格,其中有一种风格:CBN_DROPDWON,该编辑框是可以进行编辑的. 更改多CComboBox高度的友友们就会发现这样一个问题,控件高度变高后,edit编辑控件的高度光标一直处于左上角的位置,看起来很是不美观,如下图所示: 其实,想要实现光标处于垂直状态,如下图所示: 这种效果看着就比较顺眼了,此时,有人想要问,怎么改变编辑框的高度呢? 有人使用系统的MoveWindow,居然不生效?这个问
vue面试created中两次数据修改会触发几次页面更新详解

目录面试题: 一.同步的二.异步的三.附加总结面试题: created生命周期中两次修改数据,会触发几次页面更新? 一.同步的先举个简单的同步的例子: new Vue({ el: "#app", template: `<div> <div>{{count}}</div> </div>`, data() { return { count: 1, } }, created() { this.count = 2; this.coun
oracle修改scott密码与解锁的方法详解

scott用户的密码不对,进入管理员用户,修改scott用户密码即可或者这样修改密码:在运行栏里面敲:sqlplus(空格)/nolog 回车接着在弹出框里面敲:conn sys/password as sysdba回车提示已连接最后敲:alter user scott identified by tiger;回车alter user scott account unlock;回车(对SCOTT解锁)http://an:1158/em/console/logon/logon;jsessioni
Docker 修改文件是否需要重启（命令详解）

Docker 修改文件是否需要重启 Docker 修改文件是否需要重启,在做项目的时候,经常会修改文件,对于命令不是多了解,用了也是试试的态度,这里就整理下该如何使用,提高工作效率. 需要修改一期项目中的代码了,之前每次都是用"试一下"的方式得出要不要启动,现在总结下哪些情况需要启动什么 1.首先再熟悉下每条命令的作用 docker-compose up -d -将会在后台启动并运行所有的容器 docker-compose stop -停止一个已经运行的容器,但不删除它,可通过dock
修改Android中hosts文件的步骤详解

前言在开发的时候我们可能会需要修改Android的hosts文件.Android的hosts文件路径是/system/etc/hosts,在修改该文件前首先需要Android手机获取root权限.至于如何root你的手机,这里就不加详述,可以自行在网络上查找,很多也很简单. 本文将要阐述的是如何在命令行下通过adb程序访问root过的手机,把hosts拖到电脑上修改,然后再复制回手机来实现修改hosts的方法. 下面就开始具体的步骤: C:\tools>adb pull /system/etc
Python 运行.py文件和交互式运行代码的区别详解

代码版本:3.6.3 1. 交互式运行代码会直接给出表达式的结果,运行代码文件必须print才能在控制台看到结果. 直接给出结果: 没有print是看不到结果的: 有print才能看到结果: 另:交互式中可以用下划线 `_` 来查看上一次输出的结果.如果给下划线赋值,这个效果就没了. 另另:如果变量的值是空,不会显示 2. 交互式输出会输出原始内容,print会输出渲染后的内容打印字符串会带着引号,换行符也原样显示了. 字符串的引号被去掉了,换行符真的换行了 3. 交互式每一句代码都是一

如何将Yolov5的detect.py修改为可以直接调用的函数详解

相关推荐

随机推荐