Windows下Java调用OCR进行图片识别

使用Java语言,通过Tesseract-OCR对图片进行识别。

1.Tesseract-OCR

下载windows版本并安装。

2.程序如下:

a.ImageIOHelper类

package OCR;

import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import java.util.Iterator;
import java.util.Locale;

import javax.imageio.IIOImage;
import javax.imageio.ImageIO;
import javax.imageio.ImageReader;
import javax.imageio.ImageWriteParam;
import javax.imageio.ImageWriter;
import javax.imageio.metadata.IIOMetadata;
import javax.imageio.stream.ImageInputStream;
import javax.imageio.stream.ImageOutputStream;

import com.sun.media.imageio.plugins.tiff.TIFFImageWriteParam;

public class ImageIOHelper {
 /**
 * 图片文件转换为tif格式
 * @param imageFile 文件路径
 * @param imageFormat 文件扩展名
 * @return
 */
 public static File createImage(File imageFile, String imageFormat) {
 File tempFile = null;
 try {
  Iterator<ImageReader> readers = ImageIO.getImageReadersByFormatName(imageFormat);
  ImageReader reader = readers.next();

  ImageInputStream iis = ImageIO.createImageInputStream(imageFile);
  reader.setInput(iis);
  //Read the stream metadata
  IIOMetadata streamMetadata = reader.getStreamMetadata();

  //Set up the writeParam
  TIFFImageWriteParam tiffWriteParam = new TIFFImageWriteParam(Locale.CHINESE);
  tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED);

  //Get tif writer and set output to file
  Iterator<ImageWriter> writers = ImageIO.getImageWritersByFormatName("tiff");
  ImageWriter writer = writers.next();

  BufferedImage bi = reader.read(0);
  IIOImage image = new IIOImage(bi,null,reader.getImageMetadata(0));
  tempFile = tempImageFile(imageFile);
  ImageOutputStream ios = ImageIO.createImageOutputStream(tempFile);
  writer.setOutput(ios);
  writer.write(streamMetadata, image, tiffWriteParam);
  ios.close();

  writer.dispose();
  reader.dispose();

 } catch (IOException e) {
  e.printStackTrace();
 }
 return tempFile;
 }

 private static File tempImageFile(File imageFile) {
 String path = imageFile.getPath();
 StringBuffer strB = new StringBuffer(path);
 strB.insert(path.lastIndexOf('.'),0);
 return new File(strB.toString().replaceFirst("(?<=//.)(//w+)$", "tif"));
 }

}

b.OCR核心类

package OCR;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;

import org.jdesktop.swingx.util.OS;

public class OCR {
 private final String LANG_OPTION = "-l"; //英文字母小写l,并非数字1
 private final String EOL = System.getProperty("line.separator");
 private String tessPath = "C://Program Files//Tesseract-OCR";
 //private String tessPath = new File("tesseract").getAbsolutePath();

 public String recognizeText(File imageFile,String imageFormat)throws Exception{
 File tempImage = ImageIOHelper.createImage(imageFile,imageFormat);
 File outputFile = new File(imageFile.getParentFile(),"output");
 StringBuffer strB = new StringBuffer();
 List<String> cmd = new ArrayList<String>();
 if(OS.isWindowsXP()){
  cmd.add(tessPath+"//tesseract");
 }else if(OS.isLinux()){
  cmd.add("tesseract");
 }else{
  cmd.add(tessPath+"//tesseract");
 }
 cmd.add("");
 cmd.add(outputFile.getName());
 //cmd.add(LANG_OPTION);
 //cmd.add("chi_sim");
 //cmd.add("eng");

 ProcessBuilder pb = new ProcessBuilder();
 pb.directory(imageFile.getParentFile());

 cmd.set(1, tempImage.getName());
 pb.command(cmd);
 pb.redirectErrorStream(true);

 Process process = pb.start();
 //tesseract.exe 1.jpg 1 -l chi_sim
 int w = process.waitFor();

 //删除临时正在工作文件
 tempImage.delete();

 if(w==0){
  BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(outputFile.getAbsolutePath()+".txt"),"UTF-8"));

  String str;
  while((str = in.readLine())!=null){
  strB.append(str).append(EOL);
  }
  in.close();
 }else{
  String msg;
  switch(w){
  case 1:
   msg = "Errors accessing files.There may be spaces in your image's filename.";
   break;
  case 29:
   msg = "Cannot recongnize the image or its selected region.";
   break;
  case 31:
   msg = "Unsupported image format.";
   break;
  default:
   msg = "Errors occurred.";
  }
  tempImage.delete();
  //throw new RuntimeException(msg);
 }
 new File(outputFile.getAbsolutePath()+".txt").delete();
 return strB.toString();
 }
}

c.main

package OCR;
import java.io.File;
import java.io.IOException;

public class TestOcr {

 /**
 * @param args
 */
 public static void main(String[] args) {
 //输入图片地址
 String path = "d://test//test.bmp";
    try {
      String valCode = new OCR().recognizeText(new File(path), "bmp");
      System.out.println(valCode);
    } catch (IOException e) {
      e.printStackTrace();
    } catch (Exception e) {
  e.printStackTrace();
 }
 }

}

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • java实现腾讯ocr图片识别接口调用

    最近开发了一个拍车牌识别车牌号的功能,主要调用了腾讯的ocr车牌识别接口,直接上代码: 首先生成签名以及读取配置的工具类: package com.weaver.formmodel.integration.ocr; import java.util.Random; import javax.crypto.Mac; import javax.crypto.spec.SecretKeySpec; import weaver.general.Base64; public class SignUtil

  • Java使用OCR技术识别验证码实现自动化登陆方法

    如论实施敏捷的团队,或者实施 DevOps 的团队,通过自动化测试提高测试效率和软件质量都是其共同的选择.UI 自动化测试是自动化化测试当中的重要环节,在 UI 自动化测试中验证码识别一直是令自动化测试人员头疼的问题.今年来随着 OCR 技术.人工智能计算机视觉(AI Computer Vision)技术的成熟与使用大大提高了验证码的识别成功率.从而使得自动识别验证码自动化登陆目标系统成为可能. 本Chat 主要内容包括: OCR 技术与人工智能计算机视觉(AI Computer Vision)

  • Java OCR tesseract 图像智能文字字符识别技术实例代码

    接着上一篇OCR所说的,上一篇给大家介绍了tesseract 在命令行的简单用法,当然了要继承到我们的程序中,还是需要代码实现的,下面给大家分享下Java实现的例子. 拿代码扫描上面的图片,然后输出结果.主要思想就是利用Java调用系统任务. 下面是核心代码: package com.zhy.test; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.i

  • java实现图片文字识别ocr

    最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为java使用的demo 在此之前,使用这个工具需要在本地安装OCR工具: 下面一个是一定要安装的离线包,建议默认安装 上面一个是中文的语言包,如果网络可以FQ的童鞋可以在安装的时候就选择语言包在线安装,有多种语言可供选择,默认只有英文的 exe安装好之后,把上面一个文件拷到安装目录下tessdata文件夹下 如C:\Program Files (x86)\Tesseract-OCR\tessd

  • java实现百度云OCR文字识别 高精度OCR识别身份证信息

    本文为大家分享了java实现百度云OCR识别的具体代码,高精度OCR识别身份证信息,供大家参考,具体内容如下 1.通用OCR文字识别 这种OCR只能按照识别图片中的文字,且是按照行识别返回结果,精度较低. 首先引入依赖包: <dependency> <groupId>com.baidu.aip</groupId> <artifactId>java-sdk</artifactId> <version>4.6.0</version&

  • Windows下Java调用OCR进行图片识别

    使用Java语言,通过Tesseract-OCR对图片进行识别. 1.Tesseract-OCR 下载windows版本并安装. 2.程序如下: a.ImageIOHelper类 package OCR; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import java.util.Iterator; import java.util.Locale; import ja

  • Windows下Java调用可执行文件代码实例

    这篇文章主要介绍了Windows下Java调用可执行文件代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 缘起: 由于没有找到java转换文件的接口,因此使用java调用exe文件进行文件转换 public void convertFile(){ Runtime rn = Runtime.getRuntime(); Process p =null; try{ p = rn.exec("D:/convert/Convert.exe D:/c

  • Windows下Java环境变量配置详解

    前言 在Windows下JAVA用到的环境变量主要有3个,JAVA_HOME.CLASSPATH.PATH,下面来详细的介绍. JAVA_HOME 指向的是JDK的安装路径,如C:\jdk1.5.0_06,在这路径下你应该能够找到bin.lib等目录. ( 今晚使用新系统配置,不知道怎么的需要加bin才可以在CMD运行,JAVA_HOME=C:\jdk1.5.0_06\bin; 下面是网上整理实践可使用贴上的,注意JDK和Eclipse必须同位数Bit才可以使用,不能是不同位数的程序,已实践,不

  • windows下java -jar 后台运行以及杀死后台进程的操作

    在你的jar文件当前目录中建立一个bat文件: 内容是:注意文件名要对应 @echo off START "commandServer" javaw -jar command-0.0.1-SNAPSHOT.jar 之后双击bat文件就能后台启动jar包啦 杀死后台进程 首先执行命令 (你要知道你运行的jar文件的端口号) netstat -aon | findstr "9998" 可以看到PID为6452 然后在执行: tasklist|findstr "

  • windows下java环境变量的设置方法

    windows xp下配置JDK环境变量:1.安装JDK,安装过程中可以自定义安装目录等信息,例如我们选择安装目录为D:/java/jdk1.5.0_08: 2.安装完成后,右击"我的电脑",点击"属性": 3.选择"高级"选项卡,点击"环境变量": 4.在"系统变量"中,设置3项属性,JAVA_HOME,PATH,CLASSPATH(大小写无所谓),若已存在则点击"编辑",不存在则点击

  • Windows下java、javaw、javaws以及jvm.dll等进程的区别

    java  ,javaw   和  javaws 的区别: 首先,所有的这些都是java的启动装置,java.exe经常使用,当使用命令行输出到window的时候,会有java.exe进程,通过任务管理器可以看到.通常 我们执行一些小的java程序的时候会有 java.exe进程在运行.javaw.exe对于我们也比较特殊,我们也能够通过任务管理器看到javaw.exe进程的运行.javaws通常web开启的时候的进程. jvm.dll jvm.dll是一个java虚拟机在windows平台环境

  • Windows下Java+MyBatis框架+MySQL的开发环境搭建教程

    MyBatis是一个Java持久化框架,它通过XML描述符或注解把对象与存储过程或SQL语句关联起来. MyBatis是在Apache许可证 2.0下分发的自由软件,是iBATIS 3.0的分支版本.其维护团队也包含iBATIS的初创成员. 与其他的对象关系映射框架不同,MyBatis并没有将Java对象与数据库表关联起来,而是将Java方法与SQL语句关联.MyBatis允许用户充分利用数据库的各种功能,例如存储过程.视图.各种复杂的查询以及某数据库的专有特性.如果要对遗留数据库.不规范的数据

  • windows系统下C++调用matlab程序的方法详解

    前言 之前已经跟大家介绍了在ubuntu系统下C++调用matlab程序的方法,需要的朋友们可以参考这篇文章,本文将给大家介绍关于windows下C++调用matlab程序的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 实验平台: matlab R2016b   VS2013 思路: 1. 设置matlab的编译器,使用外部的VC或者gcc等编译器. 2. 编译m文件成dll 3. 设置VS的Include路径和lib链接库的路径 4. 编写C++调用dll 步骤:

  • java调用FFmpeg实现视屏压缩功能的详细步骤

    目录 前言 实现步骤 一.在windows系统中下载对应的FFmpeg 二.FFmpeg压缩视屏命令 三.java实现FFmpeg命令调用 注意事项 1.文件名 2.视屏参数 前言 最近做人脸识别,对于过大的视屏(10M)以上,识别失败的几率比较大.找了下相关的视屏压缩资料.首先使用的是jave进行视屏压缩,但是踩坑失败,jave中有转码的过程,虽然压缩成功,各种压缩参数也调整了一大堆,但是在识别时,几乎都不会成功,但是只是压缩观看的话,还是可以使用jave的.继续踩坑,直接使用原生的FFmpe

  • Python调用百度OCR实现图片文字识别的示例代码

    百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '******' API_KEY = '************' SECRET_KEY = '**************' 下面就是百度API包的安装,在终端cmd输入如下语句直接pip方式安装,注意是 baidu-api 哦! pip install --user baidu-aip 接下来上py

随机推荐