python实现播放音频和录音功能示例代码

2025-02-23 11:36:34

音频预处理

这一讲主要介绍些音频基本处理方式，为接下来的语音识别打基础。

三种播放音频的方式

使用 python 播放音频有以下几种方式：

os.system()

os.system(file) 调用系统应用来打开文件，file 可为图片或者音频文件。

缺点：要打开具体的应用，不能在后台播放音频。

pyaudio

安装：pip install pyaudio

官方提供了播放音频与录音的 api ，使用十分方便，只要把Filename更改为你的音频文件的文字，就可以播放音频了。

"""PyAudio Example: Play a WAVE file."""

import pyaudio
import wave

CHUNK = 1024
FILENAME = '你的音频文件'

def play(filename = FILENAME):
 wf = wave.open(filename, 'rb')

 p = pyaudio.PyAudio()

 stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
   channels=wf.getnchannels(),
   rate=wf.getframerate(),
   output=True)

 data = wf.readframes(CHUNK)

 while data != b'':
 stream.write(data)
 data = wf.readframes(CHUNK)

 stream.stop_stream()
 stream.close()

 p.terminate()

jupyter notebook

在 jupyer notebook 中播放音频可以使用以下函数：

import IPython.display as ipd
ipd.Audio(文件名)

几种读取音频的方式

python 有很多读取音频文件的方法，内置的库 wave ，科学计算库 scipy, 和方便易用的语音处理库 librosa。
下面将介绍分别使用这几种库读取音频文件：

安装：

wave 是内置库直接导入即可。
scipy: pip install scipy
librosa: pip install librosa

使用：

wave.open:

参数 path 为文件名，mode 为打开方式

以'rb'方式打开文件返回一个 Wave_read 对象，而以'wb'方式打开文件返回一个 Wave_write 对象。

scipy.io.wavfile:

参数 path 为文件名

返回 rate : 采样率（每秒采样点的个数），data : 音频数据

librosa.load:

参数 path 为文件名

返回 y 为音频数据，sr 为采样率

# read wav file from path
from scipy.io import wavfile
import librosa
import pyaudio

# wave
file = wave.open(path,'rb')
# wavfile
rate, data = wavfile.read(path)
# librosa
y, sr = librosa.load(path)

下面演示一个使用 wavfile 读取音频文件并且画出波形的例子：

首先要计算音频到底持续了多长时间，wave 的 shape 就是总的采样点个数，除以采样频率可以得到持续的总时间（秒），乘1000得到总持续时间（毫秒）。接着通过 np.linsapce 产生时间的序列，最后使用 matplotlib 画出图像。

from scipy.io import wavfile
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

# 一秒采样数
sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')
sample_number = wave.shape[0]
total_time = int(sample_number / sr * 1000)
time_series = np.linspace(0,total_time,sample_number)
fig, ax = plt.subplots(1, 1)
ax.plot(time_series, wave)
ax.set_title('Time*Amplitude')
ax.set_xlabel('Time/ms')
ax.set_ylabel('Amplitude/dB')

最后再借用 pyaudio 的 api 我们可以实现连续录音功能：

python 实现录音功能

其中，函数 multi_record每结束一次录音会询问 “是否进行下一次录音？”，按回车就可以进行下一次录音了。

import wave
import pyaudio
import matplotlib.pyplot as plt
import time

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5

def record(filename='output.wav'):
 """官方录音教程
 """

 p = pyaudio.PyAudio()

 stream = p.open(format=FORMAT,
   channels=CHANNELS,
   rate=RATE,
   input=True,
   frames_per_buffer=CHUNK)

 print("* recording")

 frames = []

 for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
 data = stream.read(CHUNK)
 frames.append(data)

 print("* done recording")

 stream.stop_stream()
 stream.close()
 p.terminate()

 wf = wave.open(filename, 'wb')
 wf.setnchannels(CHANNELS)
 wf.setsampwidth(p.get_sample_size(FORMAT))
 wf.setframerate(RATE)
 wf.writeframes(b''.join(frames))
 wf.close()

def multi_record(num=3):
 """implement 多次录音"""
 for i in range(1,num+1):
 print('第{}次录音准备'.format(i))
 filename = 'record_{}.wav'.format(i)
 record(filename)
 time.sleep(second)
 _ = input('进行下一次录音？')

def main():
 multi_record()

if __name__ == '__main__':
 main()

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对我们的支持。

Python+树莓派+YOLO打造一款人工智能照相机

不久之前,亚马逊刚刚推出了DeepLens.这是一款专门面向开发人员的全球首个支持深度学习的摄像机,它所使用的机器学习算法不仅可以检测物体活动和面部表情,而且还可以检测类似弹吉他等复杂的活动.虽然DeepLens还未正式上市,但智能摄像机的概念已经诞生了. 今天,我们将自己动手打造出一款基于深度学习的照相机,当小鸟出现在摄像头画面中时,它将能检测到小鸟并自动进行拍照.最终成品所拍摄的画面如下所示: 相机不傻,它可以很机智我们不打算将一个深度学习模块整合到相机中,相反,我们准备将树莓派"挂钩&q
解读! Python在人工智能中的作用

人工智能是一种未来性的技术,目前正在致力于研究自己的一套工具.一系列的进展在过去的几年中发生了:无事故驾驶超过300000英里并在三个州合法行驶迎来了自动驾驶的一个里程碑:IBM Waston击败了Jeopardy两届冠军;统计学习技术从对消费者兴趣到以万亿记的图像的复杂数据集进行模式识别. 这些发展必然提高了科学家和巨匠们对人工智能的兴趣,这也使得开发者们了解创建人工智能应用的真实本质.开发这些需要注意的第一件事是: 哪一种编程语言适合人工智能? 你所熟练掌握的每一种编程语言都可以是人工智能的
python实现录音小程序

本文为大家分享了python实现录音小程序的具体代码,供大家参考,具体内容如下学习目标:掌握python的pyaudio扩展包和Wave模块录制语音的方法 Wav音频:声道数,采样频率,量化位数 python Wav包是自带的,pyaudio需要下载 pip3 install pyaudio python读Wav文件: fp=wave.open('','rb') nf=fp.getnframes()#获取文件的采样点数量 print('sampwidth:',fp.getsampwidth()
AI人工智能 Python实现人机对话

在人工智能进展的如火如荼的今天,我们如果不尝试去接触新鲜事物,马上就要被世界淘汰啦~ 本文拟使用Python开发语言实现类似于WIndows平台的"小娜",或者是IOS下的"Siri".最终达到人机对话的效果. [实现功能] 这篇文章将要介绍的主要内容如下: 1.搭建人工智能--人机对话服务端平台 2.实现调用服务端平台进行人机对话交互 [实现思路] AIML AIML由Richard Wallace发明.他设计了一个名为 A.L.I.C.E. (Artificia
Python人工智能之路之PyAudio 实现录音自动化交互实现问答

Python 很强大其原因就是因为它庞大的三方库 , 资源是非常的丰富 , 当然也不会缺少关于音频的库关于音频, PyAudio 这个库, 可以实现开启麦克风录音, 可以播放音频文件等等,此刻我们不去了解其他的功能,只了解一下它如何实现录音的首先要先 pip 一个 PyAudio pip install pyaudio 一.PyAudio 实现麦克风录音然后建立一个py文件,复制如下代码 import pyaudio import wave CHUNK = 1024 FORMAT = py
python、java等哪一门编程语言适合人工智能？

谷歌的AI击败了一位围棋大师,是一种衡量人工智能突然的快速发展的方式,也揭示了这些技术如何发展而来和将来可以如何发展. 人工智能是一种未来性的技术,目前正在致力于研究自己的一套工具.一系列的进展在过去的几年中发生了:无事故驾驶超过300000英里并在三个州合法行驶迎来了自动驾驶的一个里程碑:IBM Waston击败了Jeopardy两届冠军;统计学习技术从对消费者兴趣到以万亿记的图像的复杂数据集进行模式识别.这些发展必然提高了科学家和巨匠们对人工智能的兴趣,这也使得开发者们了解创建人工智能应用的
python 通过麦克风录音生成wav文件的方法

如下所示: #!/usr/bin/env python # -*- coding: utf-8 -*- ######################################################################## # # Copyright (c) 2017 aibot.me, Inc. All Rights Reserved # ###############################################################
python实现播放音频和录音功能示例代码

音频预处理这一讲主要介绍些音频基本处理方式,为接下来的语音识别打基础. 三种播放音频的方式使用 python 播放音频有以下几种方式: os.system() os.system(file) 调用系统应用来打开文件,file 可为图片或者音频文件. 缺点:要打开具体的应用,不能在后台播放音频. pyaudio 安装:pip install pyaudio 官方提供了播放音频与录音的 api ,使用十分方便,只要把Filename更改为你的音频文件的文字,就可以播放音频了. ""&q
python爬取音频下载的示例代码

抓取"xmly"鬼故事音频 import json # 在这个url,音频链接为JSON动态生成,所以用到了json模块 import requests headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36" } # 请求网页
基于Python实现音乐播放器的实现示例代码

目录一.环境设置二.播放功能三.停止功能四.暂停与恢复五.关闭六.完整代码七.改进一.环境设置第一步引入必须的各类包 import os import tkinter import tkinter.filedialog import random import time import threading import pygame 特别是pygame需要手动安装 pip install pygame 二.播放功能首先选择音乐目录,然后创建播放现成,播放音乐. # 播放按钮 d
Unity常用音频操作类示例代码

下面通过代码给大家介绍Unity常用音频操作类,具体代码如下所示: using UnityEngine; using System.Collections; public class AudioPlay : MonoBehaviour { public static AudioPlay Instance; public AudioClip[] FuChuAudio; public AudioSource FCAudio; // public AudioSource BabyAudio; // U
Python实现视频画质增强的示例代码

目录前言原理实现步骤拆分处理合成效果总结前言前面通过文章几行代码,实现Python捕获.播放和保存摄像头视频!给大家介绍了如何读取.播放和保存视频,后面又通过文章 Python美图技术也就几行代码!给大家介绍了如何对图像的亮度.对比度.色度或者锐度进行调整,从而达到基本的图像处理操作. 其实,那两篇文章都是铺垫,都是为了给大家介绍如何对视频进行画质增强.本文将结合前面两篇文章的内容,来讲讲如何对视频画质进行增强. 想要直接看效果的,可以拉到文末. 原理不知道大家小时候有没
Python常用工具类之adbtool示例代码

1.adb常用命令关闭adb服务:adb kill-server 启动adb服务 adb start-server 查询当前运行的所有设备 adb devices 可能在adb中存在多个虚拟设备运行可以指定虚拟设备运行 -s 虚拟设备名称重启设备 adb reboot --指定虚拟设备 adb -s 设备名称 reboot 查看日志 adb logcat 清除日志 adb logcat -c 进入linux shell下 adb shell 其中常用的linux命令 c
Python实现交通数据可视化的示例代码

目录 1.TransBigData简介 2.数据预处理 3.数据栅格化 4.订单起讫点OD提取与聚合集计 5.交互可视化 1.TransBigData简介 TransBigData是一个为交通时空大数据处理.分析和可视化而开发的Python包.TransBigData为处理常见的交通时空大数据(如出租车GPS数据.共享单车数据和公交车GPS数据等)提供了快速而简洁的方法.TransBigData为交通时空大数据分析的各个阶段提供了多种处理方法,代码简洁.高效.灵活.易用,可以用简洁的代码实现复杂
Go/Python/Erlang编程语言对比分析及示例代码

本文主要是介绍Go,从语言对比分析的角度切入.之所以选择与Python.Erlang对比,是因为做为高级语言,它们语言特性上有较大的相似性,不过最主要的原因是这几个我比较熟悉. Go的很多语言特性借鉴与它的三个祖先:C,Pascal和CSP.Go的语法.数据类型.控制流等继承于C,Go的包.面对对象等思想来源于Pascal分支,而Go最大的语言特色,基于管道通信的协程并发模型,则借鉴于CSP分支. Go/Python/Erlang语言特性对比如<编程语言与范式>一文所说,不管语言如何层出不穷
python tkinter实现界面切换的示例代码

跳转实现思路主程序相当于桌子: import tkinter as tk root = tk.Tk() 而不同的Frame相当于不同的桌布: face1 = tk.Frame(root) face2 = tk.Frame(root) ... 每个界面采用类的方式定义各自的控件和函数,每个界面都建立在一个各自定义的Frame上,那么在实现跳转界面的效果时, 只需要调用tkinter.destroy()方法销毁旧界面,同时生成新界面的对象,即可实现切换. 而对于切换的过程中改变背景颜色和大小,可以
python实现网站微信登录的示例代码

最近微信登录开放公测,为了方便微信用户使用,我们的产品也决定加上微信登录功能,然后就有了这篇笔记. 根据需求选择相应的登录方式 python实现网站微信登录的示例代码微信现在提供两种登录接入方式移动应用微信登录网站应用微信登录这里我们使用的是网站应用微信登录按照官方流程 1 注册并通过开放平台开发者资质认证注册微信开放平台帐号后,在帐号中心中填写开发者资质认证申请,并等待认证通过. 2 创建网站应用通过填写网站应用名称.简介和图标,以及各平台下载地址等资料,创建网站应用 3 接入

python实现播放音频和录音功能示例代码

相关推荐

随机推荐