基于树莓派的语音机器人

2025-04-01 22:05:28

近年来语音识别发展迅速也带动了人工智能的发展。曾经渴望自己做一个机器人，但是无奈，心有余而力不足，经过多年的积累，小白的我也能用站着巨人的肩膀上玩下机器人了。

准备工作：树莓派，音频模块，stm32单片机，百度语音识别接口，喇叭。

整体思路：

1. 由于树莓派没有ADC模块，所以这里借助于stm32的ADC模块来实现将语音信号转换成数字信号，然后通过串口传输到树莓派你中，树莓派你将数据组装成wave文件，便于语音识别。

2. 通过http协议将组装的语音文件上传到百度语音识别平台进行识别。文档说明（免费调用）

3. 根据识别结果做出相应的处理。

4. 对于需要播放语音时，根据百度语音合成接口合成语音然后使用mplayer播放出来。mplayer安装参考博客

部分代码：

将音频转换成wave文件

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <wiringPi.h>
#include <wiringSerial.h>

#include <unistd.h>
#include <fcntl.h>
#include <sys/types.h>
#include <sys/ioctl.h>
#include "listen.h"
//gcc -o uart uart.c -lwiringPi
typedef struct WAV_Format WAVHEADER;

#define MAX_LISTEN_SIZES 1024*70 //定义接收数据的大小
#define bty 460800//串口的波特率
struct listen*listenUart()
{
 int fd,file;
 char buff,buff2;
 struct listen*liste=(struct listen*)malloc(sizeof(struct listen));

 unsigned short size;
 unsigned short*music,temp=0;
 unsigned short max=0,min=0;
 char*result=NULL;//存储最后的返回值
 int index=0,i=0;
 char stop=1;
 WAVHEADER wavHead;
 music=(unsigned short*)malloc(MAX_LISTEN_SIZES*2);
 result=(char*)malloc(MAX_LISTEN_SIZES*2+sizeof(WAVHEADER));
 if(wiringPiSetup() < 0)return NULL;
 if((fd = serialOpen ("/dev/ttyAMA0",bty))<0)
 {
 return NULL;
  printf("serial err\n");
 }
 //file=open("abc.wav", O_RDWR|O_CREAT);
 printf("oepn success\n");
 //serialPrintf(fd,"Hello World!!!");

 //需要对音频信号作出处理，当大于或者阈值时开始统计,知道录制完成
 int countTotal=0;
 int countNumber= 1000;//统计个数
 int countMax=2860;//最大值
 int countMin=2840;//最小值
 int startCount=1;
 while(1)
 {
  if(index==MAX_LISTEN_SIZES)
  {
  break;
  }
  buff=serialGetchar(fd);
  buff2=serialGetchar(fd);
  if((buff2&0x0F0)!=0)
  {
   buff2=serialGetchar(fd);
  }
  else
  {
   size=buff2;
   size=size<<8;
   size=(size&0xFF00)|(buff&0xFF);
   music[index]=size;
   if(startCount==1)
   {
   countTotal=countTotal+size;
   if(index>=countNumber)
   {
    int temp=countTotal/(countNumber+1);
    if(temp>countMax||temp<countMin)
    {
    startCount=0;
    //开始录音
    printf(":::::%d\n",temp);
    index++;
    }
    else
    {
    printf("temp:%d\n",temp);
    index=0;
    }
    countTotal=0;
   }
   else
   {
    index++;
   }
   }
   else
   {
    index++;
   }
  }
 }
 serialClose(fd);
 printf("end\n");
 //对音频进行放大处理
 max=music[0];
 min=music[0];
 for(i=i;i<MAX_LISTEN_SIZES;i++){
  temp=music[i];
  if(temp>max)
  {
  max=temp;
  }
  if(temp<min)
  {
  min=temp;
  }
 }

 size=max-min;

 for(i=0;i<MAX_LISTEN_SIZES;i++)
 {
  music[i]=(unsigned short)((music[i]-min)*1.0*6000/size);
 }
 wavHead.ChunkID=0x46464952; /* "RIFF" */
 wavHead.ChunkSize=sizeof(wavHead)+MAX_LISTEN_SIZES*2 -8; /* 36 + Subchunk2Size */
 wavHead.Format=0x45564157; /* "WAVE" */
 wavHead.Subchunk1ID=0x20746D66; /* "fmt " */
 wavHead.Subchunk1Size=0x10; /* 16 for PCM */
 wavHead.AudioFormat=0x01; /* PCM = 1*/
 wavHead.NumChannels=0x01; /* Mono = 1, Stereo = 2, etc. */
 wavHead.SampleRate=0x3E80; /* 8000, 44100, etc. */
 wavHead.ByteRate=0x7D00; /* = SampleRate * NumChannels * BitsPerSample/8 */
 wavHead.BlockAlign=0x02; /* = NumChannels * BitsPerSample/8 */
 wavHead.BitsPerSample=0x10; /* 8bits, 16bits, etc. */
 wavHead.Subchunk2ID=0x61746164; /* "data" */
 wavHead.Subchunk2Size=MAX_LISTEN_SIZES*2; /* data size */
 //返回数据赋值
 memcpy(result,(char*)&wavHead,sizeof(WAVHEADER));
 memcpy(result+sizeof(WAVHEADER),(char*)music,MAX_LISTEN_SIZES*2);
 liste->length=sizeof(WAVHEADER)+MAX_LISTEN_SIZES*2;
 liste->data=result;
 return liste;
}

将音频识别成文字

#include "convertText.h"
static Buffer *listen_buff2=NULL;
size_t listen_getData2(void *ptr, size_t size, size_t nmemb, void *stream)
{
 appendBuffer(listen_buff2,ptr,nmemb);
 return nmemb;
}
int listenText(char*result2)
{
 listen_buff2=initBuffer();
 struct listen*lsn=listenUart();
 char*base;
 int fileLength=lsn->length;
 int result=1;
 int baseSize=(lsn->length/3)*4+(lsn->length%3)*2+1;
 base=(char*)malloc(baseSize);
 base64_encode(lsn->data,lsn->length,base);
 //发送请求
 free(lsn->data);
 free(lsn);
 int code=initToken();
 if(code==1)
 {
 char*token=getToken();
 ///开始创建json字符串
 cJSON * root = cJSON_CreateObject();
 cJSON_AddItemToObject(root, "format", cJSON_CreateString("wav"));
 cJSON_AddItemToObject(root, "rate", cJSON_CreateString("16000"));
 cJSON_AddItemToObject(root, "channel", cJSON_CreateString("1"));
 cJSON_AddItemToObject(root, "cuid", cJSON_CreateString("34-68-95-91-77-43"));
 cJSON_AddItemToObject(root, "token", cJSON_CreateString(token));
 cJSON_AddItemToObject(root, "dev_pid", cJSON_CreateString("1537"));
 cJSON_AddItemToObject(root, "speech", cJSON_CreateString(base));
 cJSON_AddItemToObject(root, "len", cJSON_CreateNumber(fileLength));
 char*jsonParam=cJSON_PrintUnformatted(root);
  char*apiurl="http://vop.baidu.com/server_api";
  CURL* curl;
 CURLcode res;
  // ptr = curl_easy_escape(NULL, (char *)a, asize);
  curl = curl_easy_init();
 struct curl_slist* headers = NULL;
 headers = curl_slist_append(headers, "Content-Type:application/json");
 curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);
 curl_easy_setopt(curl, CURLOPT_URL, apiurl);
 curl_easy_setopt(curl, CURLOPT_TIMEOUT, 60);
  curl_easy_setopt(curl, CURLOPT_POST, 1);
  //http://vop.baidu.com/server_api
  //CURLOPT_POSTFIELDS,CURLOPT_POSTFIELDSIZE
  curl_easy_setopt(curl, CURLOPT_POSTFIELDS, jsonParam);
  curl_easy_setopt(curl, CURLOPT_POSTFIELDSIZE, strlen(jsonParam));
 curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, listen_getData2);
 curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1);
 res = curl_easy_perform(curl);

 curl_easy_cleanup(curl);
 cJSON_Delete(root);
  curl_slist_free_all(headers);
 free(token);
 free(jsonParam);
 if (res == CURLE_OK)
  {
 char*chars;
 char*tempresult=(char*)malloc(listen_buff2->length+1);
 memcpy(tempresult,listen_buff2->buff,listen_buff2->length);
 tempresult[listen_buff2->length]=0;
 cJSON *json;
 cJSON * item = NULL;
 cJSON*errCode;
   json=cJSON_Parse(tempresult);
   item=cJSON_GetObjectItem(json, "result");
 errCode=cJSON_GetObjectItem(json, "err_no");
 if(errCode->valueint!=0)
 {
  return -3;
 }
 chars=cJSON_GetArrayItem(item,0)->valuestring;
 strcpy(result2,chars);
 free(tempresult);
 cJSON_Delete(json);
 return 0;
  }
 else
 {
 return -3;
 }

 }
 else
 {
 return -2;
 }
 return -1;
}

主程序

#include<stdio.h>
#include<string.h>
#include "convertText.h"
#include "mp3.h"
#include "led.h"
#include "say.h"

//gcc -o robot robot.o mp3.o Buffer.o base64.o token.o cJSON.o listen.o convertText.o led.o say.o -lcurl -lm -lwiringPi -lmad

void sayChina(char*china)
{
 int resp=initSay(china);
 printf("resp:%d\n",resp);
 if(resp==1)
 {
 int tte=playData("temp.mp3");
 printf("tte:%d\n",tte);
 }
}
int main()
{
 char text[100]={0};
 sayChina("你好，我是小志，有什么可以为你服务");
 while(1)
 {
 printf(";;;;;;;;");
 int code= listenText(text);
 if(code==0)
 {
 printf("result:%s\n",text);
 if(strstr(text,"播放音乐，")!=NULL||strstr(text,"打开音乐，")!=NULL)
 {
 sayChina("正在为你打开音乐");
 musicPlayFile("mu.mp3");
 }
 if(strstr(text,"打开灯，")!=NULL||strstr(text,"打开，")!=NULL)
 {
 sayChina("好的");
 printf("正在打开");
 ledOn();
 }
 if(strstr(text,"关闭灯，")!=NULL||strstr(text,"关闭，")!=NULL||strstr(text,"完毕，")!=NULL)
 {
 sayChina("好的");
 printf("正在关闭");
 ledOff();
 }
 if(strstr(text,"你叫什么")!=NULL||strstr(text,"你叫什么名字")!=NULL||strstr(text,"名字")!=NULL)
 {
 sayChina("我叫小志");
 }
 if(strstr(text,"今天天气咋样")!=NULL||strstr(text,"天气")!=NULL)
 {
 sayChina("外面在下雨，有点冷");
 }
 if(strstr(text,"中午好")!=NULL||strstr(text,"中午")!=NULL)
 {
 sayChina("好什么啊，我还没吃饭呢");
 }
 if(strstr(text,"你多大了")!=NULL||strstr(text,"今年几岁")!=NULL||strstr(text,"几岁")!=NULL)
 {
 sayChina("我才出生，还没满月");
 }
 }
 else
 {
 printf("error\n");
 }
 }
 return 0;
}

这里只是贴出来部分程序，所有代码请查看链接希望能和大家一起交流下心得。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

教你用Python创建微信聊天机器人

最近研究微信API,发现个非常好用的python库:wxpy.wxpy基于itchat,使用了 Web 微信的通讯协议,实现了微信登录.收发消息.搜索好友.数据统计等功能. 这里我们就来介绍一下这个库,并在最后实现一个聊天机器人. 有没有很兴奋?有没有很期待? 好了,接下来,开始我们的正题. 准备工作安装非常简单,从官方源下载安装 pip install -U wxpy 或者从豆瓣源安装 pip install -U wxpy -i "https://pypi.doubanio.com/sim
使用图灵api创建微信聊天机器人

需要准备的资源: 图灵机器人账号微信公共账号点击访问图灵机器人官网,快快注册,拥有自己的聊天机器人,可以在这里先体验一下今天主要简述微信公共平台聊天机器人的搭建,首先需要注册微信公共账号,之后在图灵机器人网站上登录你的图灵账号,可以看到如截图所示的界面,在"机器人设定"界面可以进行机器人昵称.年龄.性别等信息的设定,在"机器人调教"界面可以教你的机器人回答特定问题,"知识库"可以导入知识库,增加你的机器人的能力~~~ 红色圈起来的部分是需
基于Python如何使用AIML搭建聊天机器人

借助 Python 的 AIML 包,我们很容易实现人工智能聊天机器人.AIML,全名为Artificial Intelligence Markup Language(人工智能标记语言),是一种创建自然语言软件代理的XML语言,是由Richard Wallace和世界各地的自由软件社区在1995年至2002年发明的. AIML 是什么? AIML由Richard Wallace发明.他设计了一个名为 A.L.I.C.E. (Artificial Linguistics Internet Comp
python基于itchat实现微信群消息同步机器人

最近全栈数据工程师养成攻略的微信群已经将近500人,开了二群之后为了打通不同微信群之间的消息,花了点时间做了个消息同步机器人,在任意群收到消息时同步到其他群,并且将聊天内容上传至数据库,以供进一步分析.统计和展示. 基本思路是,用 Python 模拟微信登陆,接收到群里消息后,对文本.图片.分享等各类消息类型分别处理,并转发至其他群. 前期准备首先得有一个微信号,用于代码模拟登陆.由于我的微信号得自己留着用,现阶段注册微信又必须要手机号,于是只好特意办了个电信号,用来申请了一个新的微信,微
python使用itchat库实现微信机器人(好友聊天、群聊天)

itchat是一个开源的微信个人号接口,可以使用该库进行微信网页版中的所有操作,比如:所有好友.添加好友.拉好友群聊.微信机器人等等.详细用户请看文档介绍,在这里. 本文主要使用该库完成一个能够处理微信消息的的图灵机器人,包括好友聊天.群聊天. 1.itchat库的安装 pip install itchat 安装完成后运行以下代码,会出现出现一张二维码,扫码登陆之后将会登陆微信网页. 2.登陆 import itchat # 登陆 itchat.auto_login() # 可设置hotRelo
采用python实现简单QQ单用户机器人的方法

采用python实现简单QQ单用户机器人的方法如下: 一.首先我们查看一下关于3GQQ的相关协议: 对此,打开一个支持WAP的浏览器,可以使用Firefox的wmlbrowser插件,打开FF后,访问地址 https://addons.mozilla.org/zh-CN/firefox/search/?q=wmlbrowser&cat=all&x=17&y=11 二.进入3GQQ的进行协议分析 3GQQ的地址是:http://pt.3g.qq.com/s?ai
基于树莓派的语音机器人

近年来语音识别发展迅速也带动了人工智能的发展.曾经渴望自己做一个机器人,但是无奈,心有余而力不足,经过多年的积累,小白的我也能用站着巨人的肩膀上玩下机器人了. 准备工作:树莓派,音频模块,stm32单片机,百度语音识别接口,喇叭. 整体思路: 1. 由于树莓派没有ADC模块,所以这里借助于stm32的ADC模块来实现将语音信号转换成数字信号,然后通过串口传输到树莓派你中,树莓派你将数据组装成wave文件,便于语音识别. 2. 通过http协议将组装的语音文件上传到百度语音识别平台进行识别.文
基于树莓派的语音对话机器人

本文实例为大家分享了基于树莓派的语音对话机器人,供大家参考,具体内容如下第一部分代码 arecord -D "plughw:1" -f S16_LE -r 16000 -d 3 /home/pi/Desktop/voice.wav 第二部分代码 # coding: utf-8 import sys import json import urllib2 import base64 import requests reload(sys) sys.setdefaultencoding(&q
基于Ajax的聊天机器人功能的实现

🤖️ 哈喽!大家好呀.如果无聊就和机器人聊聊天吧在初步进入Ajax学习就忍不住给大家分享今天的劳动成果啦先来看看效果图: 功能实现: 点击发送按钮事件将用户输入的内容渲染到页面中点击回车键将表单的内容渲染到页面中获取机器人的内容渲染到页面中播放机器人的内容先来看看项目的总体结构引入相关的文件: html框架比较简单 <div class="wrap">  <div class="header"> <h3>小思同学</h3> <img src="img/person01.png" alt="icon" /> </div>  <div class="main"> <ul class="talk_list" style="top: 0px;" id="talk_list"> <li class="l
基于Python 的语音重采样函数解析

因为工作中会经常遇到不同采样率的声音文件的问题,特意写了一下重采样的程序. 原理就是把采样点转换到时间刻度之后再进行插值,经过测试,是没有问题的. #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 17-7-21 下午2:32 # @Author : Lei.Jinggui # @Site : http://blog.csdn.net/lccever # @File : Resample.py # @Software: PyCharm
半小时实现基于ChatGPT搭建微信机器人

目录 ChatGPT刷屏了流程注册运行机器人程序思考 ChatGPT刷屏了相信大家最近被 ChatGPT 刷屏了,其实在差不多一个月前就火过一次,不会那会好像只在程序员的圈子里面火起来了,并没有被大众认知到,不知道最近是因为什么又火起来了,而且这次搞的人尽皆知. 想着这么火的 AI 完全可以好好玩一玩呀,于是就尝试着将 ChatGPT 接入到了个人微信中,实现在微信中调戏 AI. 先看几个聊天截图还可以拉入到一个群,进行群聊,可以看到 ChatGPT 的训练数据相当还是比较旧的,有些
基于vue2框架的机器人自动回复mini-project实例代码

这是一个mini-project,主要是基于vue2.0的一个移动端的机器自动回复小项目,下面是我的一个回顾总结https://github.com/xuweikang/rebotChat 1. 项目搭建在开始该项目之前,使用vue-cli脚手架搭建整个projec //安装vue-cli npm install vue-cli //初始化项目 rebotChat是我的项目名称 vue init webpack-simple rebotChat 这样我的项目结构就出来了,如下: 2. 模拟数据
基于Ajax的聊天机器人

🤖️ 哈喽!大家好呀.如果无聊就和机器人聊聊天吧在初步进入Ajax学习就忍不住给大家分享今天的劳动成果啦先来看看效果图: 功能实现: 点击发送按钮事件将用户输入的内容渲染到页面中点击回车键将表单的内容渲染到页面中获取机器人的内容渲染到页面中播放机器人的内容先来看看项目的总体结构引入相关的文件: html框架比较简单 <div class="wrap">  <div class="header"> <h3>小思同学</h3> <img src="img/person01.png" alt="icon" /> </div>  <div class="main"> <ul class="talk_list" style="top: 0px;" id="talk_list"> <li class="left
Android基于讯飞语音SDK实现语音识别

一.准备工作 1.你需要android手机应用开发基础 2.科大讯飞语音识别SDK android版 3.科大讯飞语音识别开发API文档 4.android手机关于科大讯飞SDK及API文档,请到科大语音官网下载:http://www.xfyun.cn/ 当然SDK和API有多个版本可选,按照你的需要下载,其次,下载需要填写资料申请注册,申请通过或可获得Appid 如下图,申请一个APPID,就可以了. 二.语音识别流程 1.创建识别控件函数原型 Public RecognizerDialo
基于树莓派实现播放MP3音乐

本文实例为大家分享了树莓派实现播放MP3音乐的具体代码,供大家参考,具体内容如下说明使用树莓派3来播放音乐,将音响连接到树莓派的AV输出接口即可听到音乐介绍如何更改树莓派音频输出接口以及调节音量. 准备条件树莓派3 3.5mm耳机或者音响一个步骤 1.安装MPlayer, MPlayer 是一款开源的多媒体播放器,树莓派上安装mplayer即可播放音乐或者其他音频信息. sudo apt-get update sudo apt-get install mplayer2 2.下载音乐到树
基于python实现语音录入识别代码实例

这篇文章主要介绍了如何通过python实现语音录入识别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下一.介绍 1.第一步录音存入本地 2.调用百度语音识别sdk 注意点:百度语音识别对声音源有要求,比特率必须是256kbps 二.代码 #安装必要库 pip install baidu-aip #百度sdk pip install pyaudio import wave import pyaudio from aip import AipSpe

基于树莓派的语音机器人

相关推荐

随机推荐