Java实现在线语音识别

2025-02-14 10:37:50

本文为大家分享了Java实现在线语音识别的具体方法，供大家参考，具体内容如下

利用讯飞开发平台作为第三方库

首先需要在讯飞开发平台下载SDK,网址为，讯飞开发平台，这些SDK 下载都是免费的，当然你需要先注册。在SDK 中不仅包含相应的jar包，还有一些相应的demo，可以供你参考学习

在我们下载下来第一个SDK 之后就可以进行开发了，讯飞的SDK 给我们提供了详尽而强大的函数支持，下面我就从代码的角度来进行一些解释。

代码

package myVoice;
import java.awt.Button;
import java.awt.Font;
import java.awt.Frame;
import java.awt.GridLayout;
import java.awt.Panel;
import java.awt.TextArea;
import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java.lang.reflect.Parameter;
import java.util.ArrayList;
import javax.swing.ImageIcon;
import javax.swing.JFrame;
import javax.swing.JLabel;
import com.iflytek.cloud.speech.RecognizerListener;
import com.iflytek.cloud.speech.RecognizerResult;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechRecognizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.util.DebugLog;
import com.iflytek.util.JsonParser;
import com.iflytek.util.Version;

public class VoiceSpeech extends Frame implements ActionListener {
Button startBtn;
Button stopBtn;
TextArea textArea;

// 语音听写对象

SpeechRecognizer speechRecognize;
private static final String DEF_FONT_NAME = "宋体";
private static final int DEF_FONT_STYLE = Font.BOLD;
private static final int DEF_FONT_SIZE = 30;
private static final int TEXT_COUNT = 100;

public VoiceSpeech() {
// 初始化听写对象
speechRecognize = SpeechRecognizer.createRecognizer();
// 设置组件
startBtn = new Button("start");
stopBtn = new Button("stop");
textArea = new TextArea();
Panel btnPanel = new Panel();
Panel textPanel = new Panel();
// Button startBtn = new Button("开始");

//添加监听器
startBtn.addActionListener(this);
stopBtn.addActionListener(this);
btnPanel.add(startBtn);
btnPanel.add(stopBtn);
textPanel.add(textArea);
add(btnPanel);
add(textPanel);

// 设置窗体
setLayout(new GridLayout(2, 1));
setSize(400, 300);
setTitle("语音识别");
setLocation(200, 200);
setVisible(true);

}

public void actionPerformed(ActionEvent e) {
if (e.getSource() == startBtn) {
textArea.setText("*************你说的是：");
if (!speechRecognize.isListening())
speechRecognize.startListening(recognizerListener);

else

speechRecognize.stopListening();
} else if (e.getSource() == stopBtn) {
speechRecognize.stopListening();

}

}

/**
* 听写监听器
*/

private RecognizerListener recognizerListener = new RecognizerListener() {
public void onBeginOfSpeech() {

// DebugLog.Log( "onBeginOfSpeech enter" );
// ((JLabel) jbtnRecognizer.getComponent(0)).setText("听写中...");
// jbtnRecognizer.setEnabled(false);

}

public void onEndOfSpeech() {
DebugLog.Log("onEndOfSpeech enter");

}

/**
* 获取听写结果. 获取RecognizerResult类型的识别结果，并对结果进行累加，显示到Area里
*/

public void onResult(RecognizerResult results, boolean islast) {
DebugLog.Log("onResult enter");

// 如果要解析json结果，请考本项目示例的 com.iflytek.util.JsonParser类
String text =

JsonParser.parseIatResult(results.getResultString());

// String text = results.getResultString();
// JsonParser json = new JsonParser();
//  String newTest = json.parseIatResult(text);
//  textArea.setText(newTest);

textArea.append(text);
text = textArea.getText();
if (null != text) {
int n = text.length() / TEXT_COUNT + 1;
int fontSize = Math.max(10, DEF_FONT_SIZE - 2 * n);
DebugLog.Log("onResult new font size=" + fontSize);
int style = n > 1 ? Font.PLAIN : DEF_FONT_SIZE;
Font newFont = new Font(DEF_FONT_NAME, style, fontSize);
textArea.setFont(newFont);

}

if (islast) {

iatSpeechInitUI();

}

}

public void onVolumeChanged(int volume) {
DebugLog.Log("onVolumeChanged enter");

if (volume == 0)
volume = 1;
else if (volume >= 6)
volume = 6;

// labelWav.setIcon(new ImageIcon("res/mic_0" + volume + ".png"));

}

public void onError(SpeechError error) {
DebugLog.Log("onError enter");
if (null != error) {
DebugLog.Log("onError Code：" + error.getErrorCode());
textArea.setText(error.getErrorDescription(true));
iatSpeechInitUI();

}

}

public void onEvent(int eventType, int arg1, int agr2, String msg) {
DebugLog.Log("onEvent enter");

}

};

/**
* 听写结束，恢复初始状态
*/

public void iatSpeechInitUI() {

// labelWav.setIcon(new ImageIcon("res/mic_01.png"));
// jbtnRecognizer.setEnabled(true);
// ((JLabel) jbtnRecognizer.getComponent(0)).setText("开始听写");

}

public static void main(String[] args) {

// 初始化
StringBuffer param = new StringBuffer();
param.append( "appid=" + Version.getAppid() );
// param.append( ","+SpeechConstant.LIB_NAME_32+"=myMscName" );
SpeechUtility.createUtility( param.toString() );
VoiceSpeech t = new VoiceSpeech();

}

}

代码解析

1.SpeechRecognizer类，语音识别类，语音识别，包括听写、语法识别功能。本类使用单例，调用者使用本类的对象，只需要通过createRecognizer()创建一次对象后，便可一直使用该对象，直到通过调用destroy()进行单例对象销毁。调用者可通过getRecognizer()获取当前已经创建的单例。我们在一开始导包，把相应的类导入，然后声明语音识别类，然后在VoiceSpeech类的构造器中初始化。

2.在SpeechRecognizer类中有很多有关语音识别的方法，

（1）startListening方法，开始进行语音识别，其方法的参数是一个回调函数，这个方法是另一个类RecognizerListener声明的实例，在其匿名内部类中重写关键的方法，借此到底我们想要的结果，我们在onResult方法中重写，把识别的结果通过json解析之后（识别的结果默认是json格式），把它依次添加到文本栏上面，之后我们对文本栏的内容进行文字字体大小等的设定

（2）stopListening方法，等录音结束之后，调用该方法，把录音结果通过网络传输给讯飞远程识别平台进行解析，解析完成之后，把解析结果传送过来

3.在main方法中先要进行SpeechUtility.createUtility，这是讯飞SDK的初始化，相当于远程连接讯飞识别平台，因为Java现在还不支持离线识别，所以在进行识别方法调用之前，必须连接讯飞开发平台，这个方法的作用正是如此，其参数就是不同的识别版本

4.因为很多方法都是讯飞提供的，所以我们需要导入相应的包

具体如下

import com.iflytek.cloud.speech.RecognizerListener;
import com.iflytek.cloud.speech.RecognizerResult;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechRecognizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.util.DebugLog;
import com.iflytek.util.JsonParser;//json解析类
import com.iflytek.util.Version;//版本类

这些在SDK 中都有

最终的结果

ps:因为只是注重识别功能，所以界面很丑。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

java文字转语音播报功能的实现方法

前言本文主要给大家分享了关于java文字转语音播报的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧方法如下一.pom.xml引入jar包依赖  <dependency> <groupId>com.hynnet</groupId> <artifactId>jacob</artifac
Java实现的百度语音识别功能示例

本文实例讲述了Java实现的百度语音识别功能.分享给大家供大家参考,具体如下: SDK以及示例代码下载地址: http://yuyin.baidu.com/sdk 最近一直在搞java,就选择了java工程.将代码拷过去.同时复制文件"test.pcm"到工程目录下.就基本上可以了. 注:test.pcm是语音文件,可以用audacity软件打开,选择文件->导入->裸数据. 设置采样率为8000Hz.点击播放就能听见声音了. 这个时候程序跑起来还有问题,需要将apiKe
java微信企业号开发之发送消息（文本、图片、语音）

上篇文章介绍了开启回调模式,开始回调模式后我们就要实现聊天功能了.平时使用微信聊天可以发送文本消息.语音.图片.视频等,这里只实现了其中的一些功能和大家分享. 一.与微信企业号建立连接 1.企业应用调用企业号提供的接口,管理或查询企业号后台所管理的资源.或给成员发送消息等,以下称主动调用模式. 2.企业号把用户发送的消息或用户触发的事件推送给企业应用,由企业应用处理,以下称回调模式. 3.用户在微信中阅读企业应用下发的H5页面,该页面可以调用微信提供的原生接口,使用微信开放的终端能力,以下称JS
java简单实现用语音读txt文档方法总结

最近比较无聊,随便翻着博客,无意中看到了有的人用VBS读文本内容,也就是读几句中文,emmm,挺有趣的,实现也很简单,都不需要安装什么环境,直接新建txt文件,输入一些简单的vbs读文本的代码,然后将新建的文件后缀改为.vbs,然后双击一下就可以有效果了.... 于是我就想啊,java行不行呢?查了一些资料,还真的行,我就将我试验的过程说一下,就当作娱乐娱乐! 1.依赖随便新建一个maven项目,导入依赖 <dependency> <groupId>com.hynnet</
Java实现在线语音识别

本文为大家分享了Java实现在线语音识别的具体方法,供大家参考,具体内容如下利用讯飞开发平台作为第三方库首先需要在讯飞开发平台下载SDK,网址为,讯飞开发平台,这些SDK 下载都是免费的,当然你需要先注册.在SDK 中不仅包含相应的jar包,还有一些相应的demo,可以供你参考学习在我们下载下来第一个SDK 之后就可以进行开发了,讯飞的SDK 给我们提供了详尽而强大的函数支持,下面我就从代码的角度来进行一些解释. 代码 package myVoice; import java.awt.Bu
java实现在线预览--poi实现word、excel、ppt转html的方法

java实现在线预览 - -之poi实现word.excel.ppt转html,具体内容如下所示: ###简介 java实现在线预览功能是一个大家在工作中也许会遇到的需求,如果公司有钱,直接使用付费的第三方软件或者云在线预览服务就可以了,例如永中office.office web 365(http://www.officeweb365.com/)他们都有云在线预览服务,就是要钱0.0 如果想要免费的,可以用openoffice,还需要借助其他的工具(例如swfTools.FlexPaper等)才
Java实现在线考试系统与设计（学生功能）

学生模块功能比较少,就是进行考试和查看自己成绩两个大的功能. 学生进行考试的功能比较复杂(首先做了校验,不在考试时间范围内,不能进行考试) 考试试题是数据库根据发布考试时的条件随机产生的一套试题.因为每次考试题型题量都是不同的,因此我们继续采用JSON的格式去保存数据,当状态为1:表示正在考试:状态为2:表示已经考试结束:状态为3:表示老师已经阅完试卷 (1)当考试考试的时候,会给考上随机产生一套试题,并存储到数据库中,如果考试中电脑突然坏了可以保证重新打开还是之前的试题 (2)考试时间结束会自
Java实战在线选课系统的实现流程

一.项目简述功能: 系统分为三个角色.最高权限管理员,学生,教师,包括学生管理,教师管理,课程管理,选课,退课,成绩查询.,教学课程,查看选课名单等等功能完全齐备. 二.项目运行环境配置: Jdk1.8 + Tomcat8.5 + Mysql + Eclispe (IntelliJ IDEA,Eclispe,MyEclispe,Sts 都支持) 项目技术: JSP +Spring + SpringMVC + MyBatis + Bootstrap4+ css + JavaScript +
手把手教你使用Java实现在线生成pdf文档

目录一.介绍二.案例实现 2.1添加iText依赖包 2.2简单实现 2.3复杂实现 2.4变量替换方式三.总结一.介绍在实际的业务开发的时候,研发人员往往会碰到很多这样的一些场景,需要提供相关的电子凭证信息给用户,例如网银/支付宝/微信购物支付的电子发票.订单的库存打印单.各种电子签署合同等等,以方便用户查看.打印或者下载. 例如下图的电子发票! 熟悉这块业务的童鞋,一定特别清楚,目前最常用的解决方案是:把相关的数据信息,通过一些技术手段生成对应的 PDF 文件,然后返回给用户,以便
Java实现在线聊天功能

本文实例为大家分享了Java实现在线聊天功能的具体代码,供大家参考,具体内容如下效果关键代码创建Client.java import java.io.IOException; import java.net.Socket; import java.net.UnknownHostException; /** * @author Lete * @乐特的程序永无BUG * @createDate 2020- 07-04 22:13 * * 1. SendThread 发送消息线程 *
java实现在线聊天系统

本文实例为大家分享了java实现在线聊天系统的具体代码,供大家参考,具体内容如下本博客是博主在观看相关视频后写下的代码,希望能够帮助大家掌握java socket的相关知识. 原理介绍代码展示原理介绍一.搭建服务器端 a).创建ServerSocket对象绑定监听端口.b).通过accept()方法监听客户端的请求.c).建立连接后,通过输入输出流读取客户端发送的请求信息.d).通过输出流向客户端发送请求信息.e).关闭相关资源. 二.搭建客户器端 a).创建Socket对象,指明需要连
Java实现在线聊天室(层层递进）

本文实例为大家分享了Java实现在线聊天室的具体代码,供大家参考,具体内容如下 - 本文讲述了从实现单个多个客户的收发信息(基础简易版),到各种实现代码的封装(oop版),实现群聊(群聊过渡版),到最后实现私聊(终极版)的过程- 本文内容是在初步学习网络编程时,练习强化记忆时的学习总结- 主要利用了TCP网络编程和多线程- 如有问题,欢迎指出综合案例:在线聊天室需求:使用TCP的Socket实现一个聊天室服务器端:一个线程专门发送消息,一个线程专门接收消息客户端:一个线程专门发送消息,一
Java实现在线预览的示例代码(openOffice实现)

简介之前有写了poi实现在线预览的文章,里面也说到了使用openOffice也可以做到,这里就详细介绍一下. 我的实现逻辑有两种: 一.利用jodconverter(基于OpenOffice服务)将文件(.doc..docx..xls..ppt)转化为html格式. 二.利用jodconverter(基于OpenOffice服务)将文件(.doc..docx..xls..ppt)转化为pdf格式. 转换成html格式大家都能理解,这样就可以直接在浏览器上查看了,也就实现了在线预览的功能:转换成
Java实现在线SQL编程最新完整版

目录难度分析项目回顾(在线编写SQL查询) 最终效果演示技术选型: 需求分析项目搭建 ① 引入项目所需要的相关Maven依赖 ② 编写配置文件 ③ 创建Controller前端控制器 ④ 探究 JDBC中ResultSet中的方法 ⑤ 获取所有的数据源 ⑥ 实现执行查询逻辑 ⑦ Vue前端引入monaco-editor组件进行编写SQL语句项目总结前言: 由于前段时间,项目组长分配的任务是要完成一个在线编写SQL并要实现查询功能的需求,最终需要将查询到的数据以JSON格

Java实现在线语音识别

相关推荐

随机推荐