Python实现带GUI界面的手写数字识别

2025-02-19 06:38:52

1.效果图

有点low，轻喷

点击选择图片会优先从当前目录查找

2.数据集

这部分我是对MNIST数据集进行处理保存

对应代码：

import tensorflow as tf
import matplotlib.pyplot as plt
import cv2
from PIL import Image
import numpy as np
from scipy import misc
(x_train_all,y_train_all),(x_test,y_test) = tf.keras.datasets.mnist.load_data()
x_valid,x_train = x_train_all[:5000],x_train_all[5000:]
y_valid,y_train = y_train_all[:5000],y_train_all[5000:]
print(x_valid.shape,y_valid.shape)
print(x_train.shape,y_train.shape)
print(x_test.shape,y_test.shape)
#读取单张图片
def show_single_img(img_arr,len=100,path='/Users/zhangcaihui/Desktop/case/jpg/'):
    for i in range(len):#我这种写法会进行覆盖，只能保存10张照片，想保存更多的数据自己看着改
        new_im = Image.fromarray(img_arr[i])  # 调用Image库，数组归一化
        #new_im.show()
        #plt.imshow(img_arr)  # 显示新图片
        label=y_train[i]
        new_im.save(path+str(label)+'.jpg')  # 保存图片到本地

#显示多张图片
def show_imgs(n_rows,n_cols,x_data,y_data):
    assert len(x_data) == len(y_data)
    assert n_rows * n_cols < len(x_data)
    plt.figure(figsize=(n_cols*1.4,n_rows*1.6))
    for row in range(n_rows):
        for col in range(n_cols):
            index = n_cols * row + col
            plt.subplot(n_rows,n_cols,index+1)
            plt.imshow(x_data[index],cmap="binary",interpolation="nearest")
            plt.axis("off")
    plt.show()
#show_imgs(2,2,x_train,y_train)
show_single_img(x_train)

3.关于模型

我保存了了之前训练好的模型，用来加载预测

关于tensorflow下训练神经网络模型：手把手教你，MNIST手写数字识别

训练好的模型model.save(path)即可

4.关于GUI设计

1）排版

#ui_openimage.py
# -*- coding: utf-8 -*-
# from PyQt5 import QtCore, QtGui, QtWidgets
# from PyQt5.QtCore import Qt
import sys,time
from PyQt5 import QtGui, QtCore, QtWidgets
from PyQt5.QtWidgets import *
from PyQt5.QtCore import *
from PyQt5.QtGui import *

class Ui_Form(object):
    def setupUi(self, Form):
        Form.setObjectName("Form")
        Form.resize(1144, 750)
        self.label_1 = QtWidgets.QLabel(Form)
        self.label_1.setGeometry(QtCore.QRect(170, 130, 351, 251))
        self.label_1.setObjectName("label_1")
        self.label_2 = QtWidgets.QLabel(Form)
        self.label_2.setGeometry(QtCore.QRect(680, 140, 351, 251))
        self.label_2.setObjectName("label_2")
        self.btn_image = QtWidgets.QPushButton(Form)
        self.btn_image.setGeometry(QtCore.QRect(270, 560, 93, 28))
        self.btn_image.setObjectName("btn_image")
        self.btn_recognition = QtWidgets.QPushButton(Form)
        self.btn_recognition.setGeometry(QtCore.QRect(680,560,93,28))
        self.btn_recognition.setObjectName("bnt_recognition")
        #显示时间按钮
        self.bnt_timeshow = QtWidgets.QPushButton(Form)
        self.bnt_timeshow.setGeometry(QtCore.QRect(900,0,200,50))
        self.bnt_timeshow.setObjectName("bnt_timeshow")
        self.retranslateUi(Form)
        self.btn_image.clicked.connect(self.slot_open_image)
        self.btn_recognition.clicked.connect(self.slot_output_digital)
        self.bnt_timeshow.clicked.connect(self.buttonClicked)
        self.center()
        QtCore.QMetaObject.connectSlotsByName(Form)

    def retranslateUi(self, Form): #设置文本填充label、button
        _translate = QtCore.QCoreApplication.translate
        Form.setWindowTitle(_translate("Form", "数字识别系统"))
        self.label_1.setText(_translate("Form", "点击下方按钮"))
        self.label_1.setStyleSheet('font:50px;')
        self.label_2.setText(_translate("Form", "0~9"))
        self.label_2.setStyleSheet('font:50px;')
        self.btn_image.setText(_translate("Form", "选择图片"))
        self.btn_recognition.setText(_translate("From","识别结果"))
        self.bnt_timeshow.setText(_translate("Form","当前时间"))

    # 状态条显示时间模块
    def buttonClicked(self):  # 动态显示时间
        timer = QTimer(self)
        timer.timeout.connect(self.showtime)
        timer.start()
    def showtime(self):
        datetime = QDateTime.currentDateTime()
        time_now = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime())
        #self.statusBar().showMessage(time_now)
        #self.bnt_timeshow.setFont(QtGui.QFont().setPointSize(100))
        self.bnt_timeshow.setText(time_now)

    def center(self):#窗口放置中央
        screen = QDesktopWidget().screenGeometry()
        size = self.geometry()
        self.move((screen.width() - size.width()) / 2,
                    (screen.height() - size.height()) / 2)

    def keyPressEvent(self, e):
        if e.key() == Qt.Key_Escape:
            self.close()

2）直接运行这个文件（调用1）

#ui_main.py
import random

from PyQt5.QtWidgets import QFileDialog
from PyQt5.QtGui import QPixmap
from ui_openimage import Ui_Form
import sys
from PyQt5 import QtWidgets, QtGui
from PyQt5.QtWidgets import QMainWindow, QTextEdit, QAction, QApplication
import os,sys
from PyQt5.QtCore import Qt

import tensorflow
from tensorflow.keras.models import load_model
from tensorflow.keras.datasets import mnist
from tensorflow.keras import models
from tensorflow.keras import layers
from tensorflow.keras.utils import to_categorical
import tensorflow.keras.preprocessing.image as image
import matplotlib.pyplot as plt
import numpy as np
import cv2
import warnings
warnings.filterwarnings("ignore")
class window(QtWidgets.QMainWindow,Ui_Form):
    def __init__(self):
        super(window, self).__init__()
        self.cwd = os.getcwd()
        self.setupUi(self)
        self.labels = self.label_1
        self.img=None
    def slot_open_image(self):
        file, filetype = QFileDialog.getOpenFileName(self, '打开多个图片', self.cwd, "*.jpg, *.png, *.JPG, *.JPEG, All Files(*)")
        jpg = QtGui.QPixmap(file).scaled(self.labels.width(), self.labels.height())
        self.labels.setPixmap(jpg)
        self.img=file

    def slot_output_digital(self):
    	'''path为之前保存的模型路径'''
        path='/Users/zhangcaihui/PycharmProjects/py38_tf/DL_book_keras/save_the_model.h5'
        model= load_model(path)
        #防止不上传数字照片而直接点击识别
        if self.img==None:
            self.label_2.setText('请上传照片！')
            return
        img = image.load_img(self.img, target_size=(28, 28))
        img = img.convert('L')#转灰度图像
        x = image.img_to_array(img)
        #x = abs(255 - x)
        x = np.expand_dims(x, axis=0)
        print(x.shape)
        x = x / 255.0
        prediction = model.predict(x)
        print(prediction)
        output = np.argmax(prediction, axis=1)
        print("手写数字识别为：" + str(output[0]))
        self.label_2.setText(str(output[0]))

if __name__ == "__main__":
  app = QtWidgets.QApplication(sys.argv)
  my = window()
  my.show()
  sys.exit(app.exec_())

5.缺点

界面low

只能识别单个数字

其实可以将多数字图片进行裁剪分割，这就涉及到制作数据集了

6.遗留问题

我自己手写的数据照片处理成28281送入网络预测，识别结果紊乱。

反思：自己写的数据是RGB，且一张几KB，图片预处理后，按28*28读入失真太严重了，谁有好的方法可以联系我！！！

其他的水果识别系统，手势识别系统啊，改改直接套！

到此这篇关于Python实现带GUI界面的手写数字识别的文章就介绍到这了,更多相关Python手写数字识别内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python神经网络编程实现手写数字识别

本文实例为大家分享了python实现手写数字识别的具体代码,供大家参考,具体内容如下 import numpy import scipy.special #import matplotlib.pyplot class neuralNetwork: def __init__(self,inputnodes,hiddennodes,outputnodes,learningrate): self.inodes=inputnodes self.hnodes=hiddennodes self.onodes
Python利用 SVM 算法实现识别手写数字

目录前言使用 SVM 进行手写数字识别参数 C 和 γ 对识别手写数字精确度的影响完整代码前言支持向量机 (Support Vector Machine, SVM) 是一种监督学习技术,它通过根据指定的类对训练数据进行最佳分离,从而在高维空间中构建一个或一组超平面.在博文<OpenCV-Python实战(13)--OpenCV与机器学习的碰撞>中,我们已经学习了如何在 OpenCV 中实现和训练 SVM 算法,同时通过简单的示例了解了如何使用 SVM 算法.在本文中,我们将学习如何
python神经网络编程之手写数字识别

写在之前首先是写在之前的一些建议: 首先是关于这本书,我真的认为他是将神经网络里非常棒的一本书,但你也需要注意,如果你真的想自己动手去实现,那么你一定需要有一定的python基础,并且还需要有一些python数据科学处理能力然后希望大家在看这边博客的时候对于神经网络已经有一些了解了,知道什么是输入层,什么是输出层,并且明白他们的一些理论,在这篇博客中我们仅仅是展开一下代码: 然后介绍一下本篇博客的环境等: 语言:Python3.8.5 环境:jupyter 库文件: numpy | matp
Python实战小项目之Mnist手写数字识别

目录程序流程分析图: 传播过程: 代码展示: 创建环境准备数据集下载数据集下载测试集绘制图像搭建神经网络训练模型测试模型保存训练模型运行结果展示: 程序流程分析图: 传播过程: 代码展示: 创建环境使用<pip install+包名>来下载torch,torchvision包准备数据集设置一次训练所选取的样本数Batch_Sized的值为512,训练此时Epochs的值为8 BATCH_SIZE = 512 EPOCHS = 8 device = torch.devi
Python-OpenCV实战：利用 KNN 算法识别手写数字

目录前言手写数字数据集 MNIST 介绍基准模型--利用 KNN 算法识别手写数字改进模型1--参数 K 对识别手写数字精确度的影响改进模型2--训练数据量对识别手写数字精确度的影响改进模型3--预处理对识别手写数字精确度的影响改进模型4--使用高级描述符作为图像特征提高 KNN 算法准确率完整代码相关链接前言 K-最近邻 (k-nearest neighbours, KNN) 是监督学习中最简单的算法之一,KNN 可用于分类和回归问题,在博文<Python OpenCV实战
Python神经网络TensorFlow基于CNN卷积识别手写数字

目录基础理论一.训练CNN卷积神经网络 1.载入数据 2.改变数据维度 3.归一化 4.独热编码 5.搭建CNN卷积神经网络 5-1.第一层:第一个卷积层 5-2.第二层:第二个卷积层 5-3.扁平化 5-4.第三层:第一个全连接层 5-5.第四层:第二个全连接层(输出层) 6.编译 7.训练 8.保存模型代码二.识别自己的手写数字(图像) 1.载入数据 2.载入训练好的模型 3.载入自己写的数字图片并设置大小 4.转灰度图 5.转黑底白字.数据归一化 6.转四维数据 7.预测 8.显示
Python实现带GUI界面的手写数字识别

目录 1.效果图 2.数据集 3.关于模型 4.关于GUI设计 5.缺点 6.遗留问题 1.效果图有点low,轻喷点击选择图片会优先从当前目录查找 2.数据集这部分我是对MNIST数据集进行处理保存对应代码: import tensorflow as tf import matplotlib.pyplot as plt import cv2 from PIL import Image import numpy as np from scipy import misc (x_train_a
使用python svm实现直接可用的手写数字识别

目录 python svm实现手写数字识别--直接可用 1.训练 1.1.训练数据集下载--已转化成csv文件 1.2 .训练源码 2.预测单张图片 2.1.待预测图像 2.2.预测源码 2.3.预测结果 python svm实现手写数字识别--直接可用最近在做个围棋识别的项目,需要识别下面的数字,如下图: 我发现现在网上很多代码是良莠不齐,-真是一言难尽,于是记录一下,能够运行成功并识别成功的一个源码. 1.训练 1.1.训练数据集下载--已转化成csv文件下载地址 1.2 .训练源码 t
Python(TensorFlow框架)实现手写数字识别系统的方法

手写数字识别算法的设计与实现本文使用python基于TensorFlow设计手写数字识别算法,并编程实现GUI界面,构建手写数字识别系统.这是本人的本科毕业论文课题,当然,这个也是机器学习的基本问题.本博文不会以论文的形式展现,而是以编程实战完成机器学习项目的角度去描述. 项目要求:本文主要解决的问题是手写数字识别,最终要完成一个识别系统. 设计识别率高的算法,实现快速识别的系统. 1 LeNet-5模型的介绍本文实现手写数字识别,使用的是卷积神经网络,建模思想来自LeNet-5,如下图所示
Python利用逻辑回归模型解决MNIST手写数字识别问题详解

本文实例讲述了Python利用逻辑回归模型解决MNIST手写数字识别问题.分享给大家供大家参考,具体如下: 1.MNIST手写识别问题 MNIST手写数字识别问题:输入黑白的手写阿拉伯数字,通过机器学习判断输入的是几.可以通过TensorFLow下载MNIST手写数据集,通过import引入MNIST数据集并进行读取,会自动从网上下载所需文件. %matplotlib inline import tensorflow as tf import tensorflow.examples.tutori
python实现基于SVM手写数字识别功能

本文实例为大家分享了SVM手写数字识别功能的具体代码,供大家参考,具体内容如下 1.SVM手写数字识别识别步骤: (1)样本图像的准备. (2)图像尺寸标准化:将图像大小都标准化为8*8大小. (3)读取未知样本图像,提取图像特征,生成图像特征组. (4)将未知测试样本图像特征组送入SVM进行测试,将测试的结果输出. 识别代码: #!/usr/bin/env python import numpy as np import mlpy import cv2 print 'loading ...'
Python使用gluon/mxnet模块实现的mnist手写数字识别功能完整示例

本文实例讲述了Python使用gluon/mxnet模块实现的mnist手写数字识别功能.分享给大家供大家参考,具体如下: import gluonbook as gb from mxnet import autograd,nd,init,gluon from mxnet.gluon import loss as gloss,data as gdata,nn,utils as gutils import mxnet as mx net = nn.Sequential() with net.nam
Python tensorflow实现mnist手写数字识别示例【非卷积与卷积实现】

本文实例讲述了Python tensorflow实现mnist手写数字识别.分享给大家供大家参考,具体如下: 非卷积实现 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data data_path = 'F:\CNN\data\mnist' mnist_data = input_data.read_data_sets(data_path,one_hot=True) #offline da