python如何查找图片按钮的坐标位置

2025-01-30 17:22:44

python查找图片按钮的坐标位置

因为业务需求，了解到一些python自动化的内容，其中有类似于airtest截图点击的东西。

本来是想使用pyautogui来实现获取图片坐标的功能，但是pyautogui对于小尺寸的图片识别不准确，或者说是识别不到，一番查找之下，发现另一个工具，做了封装如下。

1，使用pyaut

x, y=pyautogui.locateCenterOnScreen("img_path")
# 如果查找到值，会返回坐标的元组，找不到返回None。上面的写法会报错
print(x, y)
pyautogui.click(x,y)
# 点击操作

2，使用aircv

def matchImg(imgobj,confidence=0.7):
	"""
		imgobj:待查找的图片
		confidence:最低相似度
	"""
	# 截取桌面操作，写入内存中，不必每次都保存实体图片
    screenshotIm = screenshot(region=None)
    desktop = np.array(screenshotIm)
    imobj = ac.imread(imgobj)

   return ac.find_template(desktop ,imobj,confidence)
if __name__ == "__main__":
    imgobj = 'img_path'
    print(matchImg(imgsrc,imgobj,confidencevalue))

返回值包含桌面大小，中心点，和待查询图片的四角坐标。否则为None

读取图片区域坐标的方法记录

首先是导入需要使用的库：

import cv2
import time
import win32gui, win32ui, win32con
import os

1、然后是获取需要的图片或者无需获取，已有图片。（可通过直接截取图片）

'''1、窗口截图，直接获取当前最前面的全屏幕截图'''
def window_capture(filename,w=1920,h=1080):
    hwnd = 0  # 窗口的编号，0号表示当前活跃窗口
    # 根据窗口句柄获取窗口的设备上下文DC（Divice Context）
    hwndDC = win32gui.GetWindowDC(hwnd)
    # 根据窗口的DC获取mfcDC
    mfcDC = win32ui.CreateDCFromHandle(hwndDC)
    # mfcDC创建可兼容的DC
    saveDC = mfcDC.CreateCompatibleDC()
    # 创建bigmap准备保存图片
    saveBitMap = win32ui.CreateBitmap()
    # 为bitmap开辟空间
    saveBitMap.CreateCompatibleBitmap(mfcDC, w, h)
    # 高度saveDC，将截图保存到saveBitmap中
    saveDC.SelectObject(saveBitMap)
    # 截取从左上角（0，0）长宽为（w，h）的图片
    saveDC.BitBlt((0, 0), (w, h), mfcDC, (0, 0), win32con.SRCCOPY)
    saveBitMap.SaveBitmapFile(saveDC, filename)
    return True

2、将获取的图片路径，传递给识别图片坐标的函数。

g_rectangle = [0, 0, 0, 0] #设置初始值坐标
clicked = False
g_startPoint = [0, 0]     #设置初始值获取的坐标
def startRoi(path):
    cv2.namedWindow("IMG_Show", 0)            # 创建画布
    cv2.resizeWindow("IMG_Show", 1920, 1080)  # 设置长和宽
    cv2.setMouseCallback("IMG_Show", onMouse) # 连接鼠标
    # 按"Esc"退出
    print("如果想要退出窗口，点击按钮 ESC,退出窗口...")
    while cv2.waitKey(30) != 27:             #监听事件
        global frame
        frame = cv2.imread(path,cv2.IMREAD_COLOR)  #读取图片数据
        # 画矩形
        '''
        由（x_min，x_max）组成，为绘制的边框的左上角；
        (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]):设置为绘制的边框的左上角和绘制的边框的右下角
        (0, 0, 255):指定边框的颜色，由（B,G,R）组成，当为（255,0，0）时为绿色，可以自由设定；
        1:线条的粗细值，为正值时代表线条的粗细（以像素为单位）
        '''
        cv2.rectangle(frame, (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]), (0, 0, 255), 2)
        cv2.imshow("IMG_Show", frame)
    # cv2.destroyWindow("IMG_Show")

'''
event:当前发生的鼠标事件类型
x和y:发生鼠标事件时鼠标在图像位置的x，y坐标
flags:  cv2_EVENT_FLAG_* (MouseEventFlags)类型的变量
param: 自定义的传递给 setMouseCallback 函数调用的参数
'''
# x和y： 发生鼠标事件时鼠标在图像位置的x，y坐标
def onMouse(event, x, y, flags, param):
    global clicked
    global g_rectangle
    global g_startPoint

    if event == cv2.EVENT_MOUSEMOVE:  # 滑动
        if clicked == True:
            #当鼠标点击时，打印一下信息
            g_rectangle[0] = g_startPoint[0]
            g_rectangle[1] = g_startPoint[1]
            #实时获取，对应变化后的x，y坐标
            g_rectangle[2] =  x
            g_rectangle[3] =  y
            print("坐标:%s" % g_rectangle)
    # 左键按下事件
    if event == cv2.EVENT_LBUTTONDOWN: # 左键点击
        #获取鼠标第一时间点击的坐标
        g_startPoint[0] = x
        g_startPoint[1] = y
        clicked = True
    # 左键弹起事件
    if event == cv2.EVENT_LBUTTONUP:   # 左键放开
        print("====================选中框的坐标：===========================")
        print("矩形框左上角坐标：")
        print(g_rectangle[0], g_rectangle[1])
        print("矩形框右下角坐标：")
        print(g_rectangle[2], g_rectangle[3])
        print("矩形框宽度：")
        print(g_rectangle[2]-g_rectangle[0])
        print("矩形框高度：")
        print(g_rectangle[3]-g_rectangle[1])
        clicked = False

3、通过画布显示，在上面可以进行画框，自动识别出图片区域的坐标。（如下图）

4、全部代码展示：

'''
读取图片的坐标
'''
import cv2
import time
import win32gui, win32ui, win32con
import os

'''1、窗口截图'''
def window_capture(filename,w=1920,h=1080):
    hwnd = 0  # 窗口的编号，0号表示当前活跃窗口
    # 根据窗口句柄获取窗口的设备上下文DC（Divice Context）
    hwndDC = win32gui.GetWindowDC(hwnd)
    # 根据窗口的DC获取mfcDC
    mfcDC = win32ui.CreateDCFromHandle(hwndDC)
    # mfcDC创建可兼容的DC
    saveDC = mfcDC.CreateCompatibleDC()
    # 创建bigmap准备保存图片
    saveBitMap = win32ui.CreateBitmap()
    # 为bitmap开辟空间
    saveBitMap.CreateCompatibleBitmap(mfcDC, w, h)
    # 高度saveDC，将截图保存到saveBitmap中
    saveDC.SelectObject(saveBitMap)
    # 截取从左上角（0，0）长宽为（w，h）的图片
    saveDC.BitBlt((0, 0), (w, h), mfcDC, (0, 0), win32con.SRCCOPY)
    saveBitMap.SaveBitmapFile(saveDC, filename)
    return True

g_rectangle = [0, 0, 0, 0] #设置初始值坐标
clicked = False
g_startPoint = [0, 0]
def startRoi(path):
    cv2.namedWindow("IMG_Show", 0)            # 创建画布
    cv2.resizeWindow("IMG_Show", 1920, 1080)  # 设置长和宽
    cv2.setMouseCallback("IMG_Show", onMouse) # 连接鼠标
    # 按"Esc"退出
    print("如果想要退出窗口，点击按钮 ESC,退出窗口...")
    while cv2.waitKey(30) != 27:             #监听事件
        global frame
        frame = cv2.imread(path,cv2.IMREAD_COLOR)  #读取图片数据
        # 画矩形
        '''
        由（x_min，x_max）组成，为绘制的边框的左上角；
        (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]):设置为绘制的边框的左上角和绘制的边框的右下角
        (0, 0, 255):指定边框的颜色，由（B,G,R）组成，当为（255,0，0）时为绿色，可以自由设定；
        1:线条的粗细值，为正值时代表线条的粗细（以像素为单位）
        '''
        cv2.rectangle(frame, (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]), (0, 0, 255), 2)
        cv2.imshow("IMG_Show", frame)
    # cv2.destroyWindow("IMG_Show")

'''
event:当前发生的鼠标事件类型
x和y:发生鼠标事件时鼠标在图像位置的x，y坐标
flags:  cv2_EVENT_FLAG_* (MouseEventFlags)类型的变量
param: 自定义的传递给 setMouseCallback 函数调用的参数
'''
# x和y： 发生鼠标事件时鼠标在图像位置的x，y坐标
def onMouse(event, x, y, flags, param):
    global clicked
    global g_rectangle
    global g_startPoint

    if event == cv2.EVENT_MOUSEMOVE:  # 滑动
        if clicked == True:
            #当鼠标点击时，打印一下信息
            g_rectangle[0] = g_startPoint[0]
            g_rectangle[1] = g_startPoint[1]
            #实时获取，对应变化后的x，y坐标
            g_rectangle[2] =  x
            g_rectangle[3] =  y
            print("坐标:%s" % g_rectangle)
    # 左键按下事件
    if event == cv2.EVENT_LBUTTONDOWN: # 左键点击
        #获取鼠标第一时间点击的坐标
        g_startPoint[0] = x
        g_startPoint[1] = y
        clicked = True
    # 左键弹起事件
    if event == cv2.EVENT_LBUTTONUP:   # 左键放开
        print("====================选中框的坐标：===========================")
        print("矩形框左上角坐标：")
        print(g_rectangle[0], g_rectangle[1])
        print("矩形框右下角坐标：")
        print(g_rectangle[2], g_rectangle[3])
        print("矩形框宽度：")
        print(g_rectangle[2]-g_rectangle[0])
        print("矩形框高度：")
        print(g_rectangle[3]-g_rectangle[1])
        clicked = False

if __name__ == '__main__':
    path = r"./save_img/jietu.jpg"
    if not os.path.isdir:
        os.mkdir(path)
    ret =  window_capture(filename=path)
    time.sleep(0.2)
    if ret == True:
        startRoi(path)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持我们。

python提取照片坐标信息的实例代码

python提取照片坐标信息的代码如下所示: from PIL import Image from PIL.ExifTags import TAGS import os output="Z://result.csv" out=open(output,'a') out.write('lat,lon\n') fpath="Z://iphonephoto" for item in os.walk(fpath): ob=item[2] for i in ob: name=f
使用Python实现图像标记点的坐标输出功能

Sometimes we have need to interact with an application,for example by marking points in an image,or you need to annotation some training data.PyLab comes with a simple function ginput() the let's you do just that .Here's a short example. from PIL im
Python获取图像中像素点坐标实例代码

在图片处理过程中,有时候我们想要确定图片中某一像素的坐标,可以通过下面方法得到.点击运行程序,用鼠标点击我们想要获取坐标的区域,即可获得其坐标.结束方式是,敲击键盘“q”,回车,即可结束程序. # -*- coding: utf-8 -*- """ Created on Mon Jan 10 13:58:57 2022 @author: 2540817538(有问题联系此QQ) """ import cv2 img=cv2.imread('C:/
python如何查找图片按钮的坐标位置

目录 python查找图片按钮的坐标位置读取图片区域坐标的方法记录 python查找图片按钮的坐标位置因为业务需求,了解到一些python自动化的内容,其中有类似于airtest截图点击的东西. 本来是想使用pyautogui来实现获取图片坐标的功能,但是pyautogui对于小尺寸的图片识别不准确,或者说是识别不到,一番查找之下,发现另一个工具,做了封装如下. 1,使用pyaut x, y=pyautogui.locateCenterOnScreen("img_path") #
使用python list 查找所有匹配元素的位置实例

如下所示: import re word = "test" s = "test abcdas test 1234 testcase testsuite" w = [m.start() for m in re.finditer(word, s)] print(w) 以上这篇使用python list 查找所有匹配元素的位置实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
利用OpenCV和Python实现查找图片差异

使用OpenCV和Python查找图片差异 flyfish 方法1 均方误差的算法(Mean Squared Error , MSE) 下面的一些表达与<TensorFlow - 协方差矩阵>式子表达式一样的拟合误差平方和( sum of squared errors) residual sum of squares (RSS), also known as the sum of squared residuals (SSR) or the sum of squared errors of
python如何查找列表中元素的位置

目录如何查找列表中元素的位置问题描述输入格式 python中list()查找方法 list五种查找方式函数EXA 如何查找列表中元素的位置问题描述给出一个包含n个整数的数列,问整数a在数列中的第一次出现是第几个. 输入格式第一行包含一个整数n. 第二行包含n个非负整数,为给定的数列,数列中的每个数都不大于10000. 第三行包含一个整数a,为待查找的数. 样例输入 61 9 4 8 3 99 样例输出 2 n = int(input()) x = list(map(int,inpu
Python一键查找iOS项目中未使用的图片、音频、视频资源

前言在iOS项目开发的过程中,如果版本迭代开发的时间比较长,那么在很多版本开发以后或者说有多人开发参与以后,工程中难免有一些垃圾资源,未被使用却占据着api包的大小! 这里我通过Python脚本来查找项目中未被使用的图片.音频.视频资源,然后删除掉:以达到减小APP包大小的目的! 代码先查找项目中所以的资源文件存到你数组里面 def searchAllResName(file_dir): global _resNameMap fs = os.listdir(file_dir) for dir
通过Java 程序获取Word中指定图片的坐标位置

之前给大家介绍过Java解析word,获取文档中图片位置的方法,感兴趣的朋友点击查看下,今天给大家介绍如何通过Java 程序获取Word中指定图片的坐标位置,感兴趣的朋友一起看看吧! 程序运行环境: Word测试文档:.docx 2013 Free Spire.doc.jar 3.9.0 IntelliJ IDEA JDK 1.8.0 方法步骤: 1. 指定文件路径,本次测试代码路径为项目文件夹路径.即在IDEA项目文件下存入用于测试的Word文档,如:C:\Users\Administrato
C#实现获取Excel中图片所在坐标位置

目录本文以C#和vb.net代码示例展示如何来获取Excel工作表中图片的坐标位置.这里的坐标位置是指图片左上角顶点所在的单元格行和列位置,横坐标即顶点所在的第几列.纵坐标即顶点所在的第几行.下面是获取图片位置的详细方法及步骤. [程序环境] 按照如下方法来引用Spire.Xls.dll 版本:12.2 方法1:将 Free Spire.XLS for .NET 包下载到本地,解压,安装到指定路径.完成安装后,在安装路径下找到BIN文件夹下的Spire.Xls.dll文件:然后在Visual
Java获取Excel中图片所在的行和列坐标位置

目录前言获取图片所在行.列位置前言本文以Java代码示例展示如何来获取Excel工作表中图片的坐标位置.这里的坐标位置是指图片左上角顶点所在的单元格行和列位置,横坐标即顶点所在的第几列.纵坐标即顶点所在的第几行.下面是获取图片位置的详细方法及步骤. 程序环境: 按照如下方法来引用Spire.Xls.jar 版本:5.1.0 方法1:将Free Spire.XLS for Java包下载到本地,解压,找到lib文件夹下的Spire.Xls.jar文件.然后在IDEA中打开“Project
Python +Selenium解决图片验证码登录或注册问题(推荐)

1. 解决思路首先要获得这张验证码的图片,但是该图片一般都是用的js写的,不能够通过url进行下载. 解决方案:截图然后根据该图片的定位和长高,使用工具进行裁剪裁剪完毕之后,使用工具解析该图片. 2. 代码实现 2.1 裁剪出验证码图片裁剪图片需要使用 Pillow 库,进入pip包路径后输入安装命令pip install Pillow: 之前安装的时候忘记了截图,只能够截一张安装后的图片了 ╰(:з╰∠)_ 安装完成后,代码实现方式如下: #coding=utf-8 from selen
Python+opencv 实现图片文字的分割的方法示例

实现步骤: 1.通过水平投影对图形进行水平分割,获取每一行的图像: 2.通过垂直投影对分割的每一行图像进行垂直分割,最终确定每一个字符的坐标位置,分割出每一个字符: 先简单介绍一下投影法:分别在水平和垂直方向对预处理(二值化)的图像某一种像素进行统计,对于二值化图像非黑即白,我们通过对其中的白点或者黑点进行统计,根据统计结果就可以判断出每一行的上下边界以及每一列的左右边界,从而实现分割的目的. 下面通过Python+opencv来实现该功能首先来实现水平投影: import cv2 impor

python如何查找图片按钮的坐标位置

目录

python查找图片按钮的坐标位置

读取图片区域坐标的方法记录

相关推荐

随机推荐