Android中使用orc实现文字识别实例

一、什么是orc?

引用百度百科的介绍,指利用光学字符识别(ORC全称:Optical Character Recognition)技术,将图片、照片上的文字内容,直接转换为可编辑文本,支持JPG、PNG、GIF、BMP、DOC等图片格式。简单一句话,就是可以把图片上的文字识别出来。应用的场景有很多,比如说:身份证号码识别,银行卡号识别等等。

二、效果展示

这里笔者实现的仅仅是一个效果,实际使用可能需要对它进行训练以提高识别率,第一次做gif图片,效果不是很好

三、开始集成

Github上面已经提供了android端的工具api,Github地址:https://github.com/rmtheis/tess-two

集成流2

1.下载中文简体语言包

2.导入依赖

3.API的使用,获取TessBaseAPI mBaseAPI = new TessBaseAPI();实例

4.API的使用,初始化TessBaseAPI设置,设置识别的语言和语言包所在文件路径 mBaseAPI.init(path + File.separator, "chi_sim");

5.API的使用,设置Bitmap,mBaseAPI.setImage(bitmap);

6.API的使用,从Bitmap获取文字信息,mBaseAPI.getUTF8Text();

1.下载中文简体语言包

语言包下载地址

找到tessdata——>chi_sim.traineddata

下载好了之后,需要放到sd卡中,目录不限,但是必须要放在tessdata目录里面,如果没有tessdata目录需要手动创建,例如我是Demo中是放在sd卡根目录中,就直接在sd卡根目录创建tessdata目录,然后把下载好的chi_sim.traineddata语言包丢进去,实际项目中,在识别时候最好坐下语言包是否复制到位的检查,以免出现异常。Demo中仅仅是检查了是否创建tessdata目录,这里实际上仍然存在风险的。

2.导入依赖

Gradle方式添加:https://github.com/rmtheis/tess-two

3.MainActivity代码

public class MainActivity extends AppCompatActivity implements View.OnClickListener {

private TextView mTvInfo;
private TessBaseAPI mBaseAPI;
private ProgressBar mProbar;
private String path;
private RadioGroup mRadioGroup;
private RadioButton mRbtnIdCard;
private RadioButton mRbtnBankNumber;
private RadioButton mRbtnTxt;

@Override
protected void onCreate(Bundle savedInstanceState) {
  super.onCreate(savedInstanceState);
  setContentView(R.layout.activity_main);
  findViewById(R.id.btn_start).setOnClickListener(this);
  mProbar = (ProgressBar) findViewById(R.id.pb);
  mTvInfo = (TextView) findViewById(R.id.tv_info);
  mRadioGroup = (RadioGroup) findViewById(R.id.rg);
  mRbtnIdCard = (RadioButton) findViewById(R.id.rb_idCard);
  mRbtnBankNumber = (RadioButton) findViewById(R.id.rb_bankNumber);
  mRbtnTxt = (RadioButton) findViewById(R.id.rb_txt);
  mRadioGroup.check(0);

  path = Environment.getExternalStorageDirectory().getAbsoluteFile().getAbsolutePath();
}

@Override
public void onClick(View v) {
  mTvInfo.setText("");
  switch (v.getId()) {
    case R.id.btn_start:
      if (Build.VERSION.SDK_INT >= 23) {
        if (ActivityCompat.checkSelfPermission(this, Manifest.permission.WRITE_EXTERNAL_STORAGE) != PackageManager.PERMISSION_GRANTED) {
          // 没有权限
          if(ActivityCompat.shouldShowRequestPermissionRationale(this, Manifest.permission.CALL_PHONE)){
            //如果没勾选“不再询问”,向用户发起权限请求
            ActivityCompat.requestPermissions(this, new String[]{Manifest.permission.CALL_PHONE}, 0);
          }else{
            Toast.makeText(this,"请前往设置——>存储卡权限——>允许",Toast.LENGTH_SHORT).show();
          }
        } else {
          // 有权限,接着你要干的活
          startReadText();
        }
      }else{
        startReadText();
      }
      break;
  }
}

private Handler mHandler = new Handler() {
  @Override
  public void handleMessage(Message msg) {
    switch (msg.what) {
      case 0:
        String s = (String) msg.obj;
        if (!TextUtils.isEmpty(s)) {
          mProbar.setVisibility(View.GONE);
          mTvInfo.setText(s);
          //释放bitmap
          mBaseAPI.clear();
        } else {
          mProbar.setVisibility(View.GONE);
          Toast.makeText(MainActivity.this, "识别图片内容失败", Toast.LENGTH_SHORT).show();
        }

        break;
      case 1:
        Toast.makeText(MainActivity.this, "读取图片失败", Toast.LENGTH_SHORT).show();
        break;
    }
  }
};

private Bitmap getBitmap(int id) {
  Bitmap bitmap = null;
  try {
    bitmap = BitmapFactory.decodeResource(getResources(), id);
  } catch (Exception e) {
    return null;
  }
  return bitmap;
}

/**
 * 开始识别文字
 */
private void startReadText() {

  File f = new File(path+"/tessdata") ;
  if(!f.exists()){
    Toast.makeText(this,"请先下载好语言包置于sd/tessdata目录",Toast.LENGTH_SHORT).show();
    return;
  }

  final int btnId = mRadioGroup.getCheckedRadioButtonId();
  final int resId ;
  if(R.id.rb_idCard==btnId){
    resId = R.drawable.idcard;
  }else if(R.id.rb_bankNumber==btnId){
    resId = R.drawable.bank_number;
  }else{
    resId = R.drawable.tet_info;
  }

  mProbar.setVisibility(View.VISIBLE);
  new Thread() {
    @Override
    public void run() {
      mBaseAPI = new TessBaseAPI();//初始化需要耗时,可以启动时程序时,预初始化
      mBaseAPI.init(path + File.separator, "chi_sim");
      Bitmap bitmap = getBitmap(resId);
      if (bitmap == null) {
        mHandler.sendEmptyMessage(1);
      } else {
        mBaseAPI.setImage(bitmap);
        //根据Init的语言,获得ocr后的字符串
        String t = mBaseAPI.getUTF8Text();//耗时操作
        Message obtain = Message.obtain();
        obtain.what = 0;
        obtain.obj = t;
        mHandler.sendMessage(obtain);
      }
    }
  }.start();
}
}

4.activity_main.xml代码

<LinearLayout
xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:tools="http://schemas.android.com/tools"
android:id="@+id/activity_main"
android:layout_width="match_parent"
android:layout_height="match_parent"
android:orientation="vertical"
android:paddingBottom="@dimen/activity_vertical_margin"
android:paddingLeft="@dimen/activity_horizontal_margin"
android:paddingRight="@dimen/activity_horizontal_margin"
android:paddingTop="@dimen/activity_vertical_margin"
tools:context="com.demo.orc.MainActivity">

<RadioGroup
  android:id="@+id/rg"
  android:orientation="horizontal"
  android:layout_width="match_parent"
  android:layout_height="wrap_content">

  <RadioButton
    android:checked="true"
    android:id="@+id/rb_idCard"
    android:text="身份证"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content" />
  <RadioButton
    android:id="@+id/rb_bankNumber"
    android:text="银行卡"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content" />
  <RadioButton
    android:id="@+id/rb_txt"
    android:text="文字"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content" />

</RadioGroup>

<Button
  android:id="@+id/btn_start"
  android:layout_width="wrap_content"
  android:layout_height="wrap_content"
  android:text="开始识别"/>

<TextView
  android:text="识别结果展示区:"
  android:layout_width="match_parent"
  android:layout_height="wrap_content" />

<FrameLayout
  android:layout_width="match_parent"
  android:layout_height="match_parent">

  <ProgressBar
    android:id="@+id/pb"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content"
    android:layout_gravity="center"
    android:visibility="gone"/>

  <TextView
    android:id="@+id/tv_info"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    android:text=""/>

</FrameLayout>
</LinearLayout>

四、提高识别率

Demo识别率其实不是很理想,比如把数字0识别成了字母O等,这是因为我们的根本没有进行样本训练。关于样本的训练,我目前还没实际操作过,因为公司的识别需求更为复杂,这个框架难以达到效果,公司买了第三方的一个识别框架。不过仅仅是实现身份证号,银行卡号,和一些简单的文字信息,用这个框架足以实现。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • Android中使用orc实现文字识别实例

    一.什么是orc? 引用百度百科的介绍,指利用光学字符识别(ORC全称:Optical Character Recognition)技术,将图片.照片上的文字内容,直接转换为可编辑文本,支持JPG.PNG.GIF.BMP.DOC等图片格式.简单一句话,就是可以把图片上的文字识别出来.应用的场景有很多,比如说:身份证号码识别,银行卡号识别等等. 二.效果展示 这里笔者实现的仅仅是一个效果,实际使用可能需要对它进行训练以提高识别率,第一次做gif图片,效果不是很好 三.开始集成 Github上面已经

  • Android 中CheckBox的isChecked的使用实例详解

    Android 中CheckBox的isChecked的使用实例详解 范例说明 所有的网络服务在User使用之前,都需要签署同意条款,在手机应用程序.手机游戏的设计经验中,常看见CheckBox在同意条款情境的运用,其选取的状态有两种即isChecked=true与isChecked=false. 以下范例将设计一个TextView放入条款文字,在下方配置一个CheckBox Widget作为选取项,通过Button.onClickListener按钮事件处理,取得User同意条款的状态. 当C

  • Android 中隐藏虚拟按键的方法实例代码

    下面通过一段代码给大家讲解android 隐藏虚拟按键的方法,废话不多说了,大家多多看看代码和注释吧,具体代码如下所示: /** * 隐藏虚拟按键,并且全屏 */ protected void hideBottomUIMenu() { //隐藏虚拟按键,并且全屏 if (Build.VERSION.SDK_INT > 11 && Build.VERSION.SDK_INT < 19) { // lower api View v = this.getWindow().getDec

  • Android 中Seekbar详解及简单实例

    Android 中Seekbar详解及简单实例 做到音频播放和音乐播放时,大多数都要用到Seekbar.现在我先简单介绍下Seekbar的几个重要属性. android:max 设置值的大小 . android:thumb="@drawable/" 显示的那个可拖动图标,如果没有设置该参数则为系统默认,如果自己需要重新定义,则将自己需要的图标存放在资源目录 /res/drawable下,然后调用即可. android:thumbOffset 拖动图标的偏量值,可以让拖动图标超过bar的

  • Android 中ViewPager重排序与更新实例详解

    Android 中ViewPager重排序与更新实例详解 最近的项目中有栏目订阅功能,在更改栏目顺序以后需要更新ViewPager.类似于网易新闻的频道管理. 在重新排序之后调用了PagerAdapter的notifyDataSetChanged方法,发现ViewPager并没有更新,于是我开始跟踪源码,在调用PagerAdapter的notifyDataSetChanged方法后,会触发Viewpager的dataSetChanged方法. void dataSetChanged() { //

  • 详解Android中图片的三级缓存及实例

    详解Android中图片的三级缓存及实例 为什么要使用三级缓存 如今的 Android App 经常会需要网络交互,通过网络获取图片是再正常不过的事了 假如每次启动的时候都从网络拉取图片的话,势必会消耗很多流量.在当前的状况下,对于非wifi用户来说,流量还是很贵的,一个很耗流量的应用,其用户数量级肯定要受到影响 特别是,当我们想要重复浏览一些图片时,如果每一次浏览都需要通过网络获取,流量的浪费可想而知 所以提出三级缓存策略,通过网络.本地.内存三级缓存图片,来减少不必要的网络交互,避免浪费流量

  • Android中Handler与Message的简单实例

    Android中Handler与Message的简单实例 前言: 虽然笔者已经学习了Android的AsyncTask来实现一部消息的处理.但是在android的学习中,经常会在一些demo中看到Handler与Message的一些使用,所以Handler与Message的学习也是有必要了.至于学多少,笔者还是比较坚持自己的看法,"用多少,学多少",毕竟已经有了AsyncTask如此方便的东西,Handler与Message也不是那么必不可缺了.(如此文的简单了解一下还是不需要花太多时

  • Android中AsyncTask异步任务使用详细实例(一)

    AsyncTask是Android提供的轻量级的异步类,可以直接继承AsyncTask,在类中实现异步操作,并提供接口反馈当前异步执行的程度(可以通过接口实现UI进度更新),最后反馈执行的结果给UI主线程. 使用AsyncTask最少要重写以下两个方法: 1.doInBackground(Params-) 后台执行,比较耗时的操作都可以放在这里.注意这里不能直接操作UI.此方法在后台线程执行,完成任务的主要工作,通常需要较长的时间.在执行过程中可以调用publicProgress(Progres

  • Android中文件的压缩和解压缩实例代码

    使用场景 当我们在应用的Assets目录中需要加入文件时,可以直接将源文件放入,但这样会造成打包后的apk整体过大,此时就需要将放入的文件进行压缩.又如当我们需要从服务器中下载文件时,如果下载源文件耗时又消耗流量,较大文件需要压缩,可以使得传输效率大大提高.下面我们就学习下基本的文件压缩和解压缩.Java中提供了压缩和解压缩的输入输出流 public static void zip(String src,String dest) throwsIOException { //定义压缩输出流 Zip

  • Android中悬浮窗口的实现原理实例分析

    本文实例讲述了Android中悬浮窗口的实现原理.分享给大家供大家参考.具体如下: 用了我一个周末的时间,个中愤懑就不说了,就这个问题,我翻遍全球网络没有一篇像样的资料,现在将实现原理简单叙述如下: 调用WindowManager,并设置WindowManager.LayoutParams的相关属性,通过WindowManager的addView方法创建View,这样产生出来的View根据WindowManager.LayoutParams属性不同,效果也就不同了.比如创建系统顶级窗口,实现悬浮

随机推荐