python 录制系统声音的示例

环境准备

python

  • wave
  • pyaudio

wave 可以通过pip直接install,在安装pyaudio时,通过正常的pip install 直接安装一直处于报错阶段,后来想到可以通过轮子直接安装。

在pypi提供的安装包中有对应的安装包,注意,不仅仅是python2和python3的区别,python3的小版本也有点差别。可杯具的是,小主电脑里装的是python3.8,后来想到还有一个网站可以安装pythonlibs,找到对应的版本后,下载下来。直接在文件所在目录,或者在安装中指定文件目录中执行安装

pip install /c/Users/root/Downloads/PyAudio-0.2.11-cp38-cp38-win_amd64.whl

代码和运行

def audio_record(out_file, rec_time):
  CHUNK = 1024
  FORMAT = pyaudio.paInt16 # 16bit编码格式
  CHANNELS = 1 # 单声道
  RATE = 16000 # 16000采样频率
  p = pyaudio.PyAudio()
  # 创建音频流
  dev_idx = findInternalRecordingDevice(p)
  stream = p.open(format=FORMAT, # 音频流wav格式
          channels=CHANNELS, # 单声道
          rate=RATE, # 采样率16000
          input=True,
          input_device_index=dev_idx, # 指定内录设备的id,可以不写,使用win的默认录音设备
          frames_per_buffer=CHUNK)
  print("Start Recording...")
  frames = [] # 录制的音频流
  # 录制音频数据
  for i in range(0, int(RATE / CHUNK * rec_time)): # 控制录音时间
    data = stream.read(CHUNK)
    frames.append(data)
  # 录制完成
  stream.stop_stream()
  stream.close()
  p.terminate()
  print("Recording Done...")
  # 保存音频文件
  wf = wave.open(out_file, 'wb')
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  wf.writeframes(b''.join(frames))
  wf.close()

在使用默认录音设备时,发现是话筒录音,效果并不是太理想,所以就去查查能不能直接录系统的声音。

def findInternalRecordingDevice(p):
  # 要找查的设备名称中的关键字
  target = '立体声混音'
  # 逐一查找声音设备
  for i in range(p.get_device_count()):
    devInfo = p.get_device_info_by_index(i)
    print(devInfo)
    if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
      # print('已找到内录设备,序号是 ',i)
      return i
  print('无法找到内录设备!')
  return -1

可以使用p.get_device_info_by_index()去查看系统有关声音的设备,通过设置为立体声混音就可以录制系统声音。

保存声音

def save(fileName):
  # 创建pyAudio对象
  p = pyaudio.PyAudio()
  # 打开用于保存数据的文件
  wf = wave.open(fileName, 'wb')
  # 设置音频参数
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  # 写入数据
  wf.writeframes(b''.join(_frames))
  # 关闭文件
  wf.close()
  # 结束pyaudio
  p.terminate()

保存声音是通过上述代码进行保存,此处的_frames是个list,是通过每录一个chunk(数据流块),就把这一块的数据添加进去

然后只需要重新创建PyAudio对象,把这个list转为字节串保存到文件中就可以了

问题

上述一般可以录到系统声音,但在执行的时候发现,并不能。

原因是:win的输入设备中没有配置立体声混音

设置步骤:

  • 在win的声音调节出,右击打开声音设置
  • 找到管理声音设备
  • 在输入设备处启用立体声混音

就此,就完成了录制系统声音的需求

注意

上述操作,可以外放,可以插入3.5mm耳机,但系统静音和tpye-c耳机插入的时候不能录到声音

完整代码

import os
import pyaudio
import threading
import wave
import time
from datetime import datetime

# 需要系统打开立体声混音

# 录音类
class Recorder():
  def __init__(self, chunk=1024, channels=2, rate=44100):
    self.CHUNK = chunk
    self.FORMAT = pyaudio.paInt16
    self.CHANNELS = channels
    self.RATE = rate
    self._running = True
    self._frames = []

  # 获取内录设备序号,在windows操作系统上测试通过,hostAPI = 0 表明是MME设备
  def findInternalRecordingDevice(self, p):
    # 要找查的设备名称中的关键字
    target = '立体声混音'
    # 逐一查找声音设备
    for i in range(p.get_device_count()):
      devInfo = p.get_device_info_by_index(i)
      # print(devInfo)
      if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
        # print('已找到内录设备,序号是 ',i)
        return i
    print('无法找到内录设备!')
    return -1

  # 开始录音,开启一个新线程进行录音操作
  def start(self):
    threading._start_new_thread(self.__record, ())

  # 执行录音的线程函数
  def __record(self):
    self._running = True
    self._frames = []

    p = pyaudio.PyAudio()
    # 查找内录设备
    dev_idx = self.findInternalRecordingDevice(p)
    if dev_idx < 0:
      return
    # 在打开输入流时指定输入设备
    stream = p.open(input_device_index=dev_idx,
            format=self.FORMAT,
            channels=self.CHANNELS,
            rate=self.RATE,
            input=True,
            frames_per_buffer=self.CHUNK)
    # 循环读取输入流
    while (self._running):
      data = stream.read(self.CHUNK)
      self._frames.append(data)

    # 停止读取输入流
    stream.stop_stream()
    # 关闭输入流
    stream.close()
    # 结束pyaudio
    p.terminate()
    return

  # 停止录音
  def stop(self):
    self._running = False

  # 保存到文件
  def save(self, fileName):
    # 创建pyAudio对象
    p = pyaudio.PyAudio()
    # 打开用于保存数据的文件
    wf = wave.open(fileName, 'wb')
    # 设置音频参数
    wf.setnchannels(self.CHANNELS)
    wf.setsampwidth(p.get_sample_size(self.FORMAT))
    wf.setframerate(self.RATE)
    # 写入数据
    wf.writeframes(b''.join(self._frames))
    # 关闭文件
    wf.close()
    # 结束pyaudio
    p.terminate()

if __name__ == "__main__":

  # 检测当前目录下是否有record子目录
  if not os.path.exists('record'):
    os.makedirs('record')

  print("\npython 录音机 ....\n")
  print("提示:按 r 键并回车 开始录音\n")

  i = input('请输入操作码:')
  if i == 'r':
    rec = Recorder()
    begin = time.time()

    print("\n开始录音,按 s 键并回车 停止录音,自动保存到 record 子目录\n")
    rec.start()

    running = True
    while running:
      i = input("请输入操作码:")
      if i == 's':
        running = False
        print("录音已停止")
        rec.stop()
        t = time.time() - begin
        print('录音时间为%ds' % t)
        # 以当前时间为关键字保存wav文件
        rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")

以上就是python 录制系统声音的示例的详细内容,更多关于python 录制系统声音的资料请关注我们其它相关文章!

(0)

相关推荐

  • python 偷懒技巧——使用 keyboard 录制键盘事件

    之前在某本书上看到一个程序,可以通过 Python 记录下全局范围内的键盘事件,使用的是 ctypes 库. 后来几经尝试,始终不能成功运行.原来它只支持 Python2 和 32 位的 Windows 系统...Excuse me? 于是在网上查找可行的替代方案,比如 pyHook .呃,不合胃口.安装比较繁琐(有依赖库且不能通过 pip 命令安装),只支持 Windows 系统,况且又是十年前就没再更新的项目...看了下函数调用也算不上简洁直观. 后来又多番搜索,终于找到了一个名为keybo

  • Python+opencv+pyaudio实现带声音屏幕录制

    基于个人的爱好和现实的需求,决定用Python做一个屏幕录制的脚本.因为要看一些加密的视频,每次都要登录,特别麻烦,遂决定用自己写的脚本,将加密视频的播放过程全程录制下来,这样以后看自己的录播就好了.结合近期自己学习的内容,正好用Python来练练手,巩固自己的学习效果. 经过多番搜索,决定采用Python+opencv+pyaudio来实现屏幕录制.网上搜索到的录屏,基本都是不带声音的,而我要实现的是带声音的屏幕录制.下面就开始一步一步的实现吧. 声音录制 import pyaudio imp

  • python调用pyaudio使用麦克风录制wav声音文件的教程

    python的pyaudio可以进行录音,播放,生成wav文件等等,WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为WAV,数据本身的格式为PCM或压缩型,属于无损音乐格式的一种.在我们研究语音识别,自然语言处理的过程中,常常会使用到它,比如我们调用百度语音识别所以我们首先研究一下pyaudio库的安装与使用. 安装: pip install pyaudio 调用pyaudio使用麦克风录制声音: python中的pyaudio库可以直接通过麦克风录制声音,我们可以通过调用该库,

  • Python实现播放和录制声音的功能

    Python语言已经无所不能了,今天就来分享一下,如何使用Python来录制和播放音频文件. 下面是一些可以播放和录制音频的Python第三方库: playsound,支持MP3和WAV,目前只支持简单的回放. simpleaudio,支持WAV,提供检查文件是否仍在播放的功能. winsound,支持WAV,只支持windows. python-sounddevice和pyaudio为PortAudio库提供绑定,以便跨平台回放WAV文件. pydub,需要pyaudio来播放音频,但是安装了

  • python利用ffmpeg进行录制屏幕的方法

    前几天下载了几个视频,但是有两集是一个视频的,偶尔找到了ffmpeg处理视频的方法,它的功能非常强大.因此,分享一下,一起学习. import subprocess,sys,os import re class CutSplicingVdeio(object): def __init__(self): pass #dercription CutSplicingVdeio this class function def instructions(self): dercription="vdeio

  • python 实现屏幕录制示例

    PIL 即pollow 的安装命令如下: pip install pillow 其中cv2的安装是下面这条命令 pip install opencv-python 代码实现: # coding: utf-8 from PIL import ImageGrab import numpy as np import cv2 fps = 20 start = 3 # 延时录制 end = 15 # 自动结束时间 curScreen = ImageGrab.grab() # 获取屏幕对象 height,

  • Python+OpenCV+pyQt5录制双目摄像头视频的实例

    起因 说起来录制视频,我们可能有很多的软件,但是比较坑的是,好像很少的软件支持能够同时录制两个摄像头的视频,于是我们用python自己写一个.要是OpenCV+python.貌似很简单就能OK的事情,但是,我们的项目不是一般要展示给老师看嘛.谁愿意看一个没有界面的录制过程是吧~,最后会附上源代码~ 依赖的包 在这里,我直接把import的包写出来了各位可以进行对号入座,然后就能知道需要安装哪个包啦! import cv2 import numpy as np from PyQt5.QtWidge

  • Python实现屏幕录制功能的代码

    前段时间做视频时需要演示电脑端的操作,因此要用到屏幕录制,下载了个迅捷屏幕录制,但是没有vip录制的视频有水印且只能录制二分钟,于是鄙人想了下能不能通过万能的python来实现呢?经过一晚上的尝试发现这条路是可以走的通的.分享一下自己的想法,整体思路是PIL模块中的ImageGrab不停的获得当前屏幕,利用opencv写入视频流话不多说,直接上代码,有什么更好的建议,欢迎大家交流! """python + opencv 实现屏幕录制_by-_Zjh_""&

  • 使用Python来做一个屏幕录制工具的操作代码

    一.写在前面 作为一名测试,有时候经常会遇到需要录屏记录自己操作,方便后续开发同学定位.以前都是用ScreenToGif来录屏制作成动态图,偶尔的机会看到python也能实现.那就赶紧学习下. 二.效果展示 三.知识串讲 这次要讲的东西可能比较多了,涉及到pyqt5 GUI软件的制作.QThread多线程的使用.Sikuli库的图形操作.win32库的模拟键盘操作.cv2库的写视频文件等.下面我们一点点来蚕食我这次写的代码. 1.GUI界面制作 这次我用的是现成的Pyqt5界面布局类,QVBox

  • python 录制系统声音的示例

    环境准备 python wave pyaudio wave 可以通过pip直接install,在安装pyaudio时,通过正常的pip install 直接安装一直处于报错阶段,后来想到可以通过轮子直接安装. 在pypi提供的安装包中有对应的安装包,注意,不仅仅是python2和python3的区别,python3的小版本也有点差别.可杯具的是,小主电脑里装的是python3.8,后来想到还有一个网站可以安装pythonlibs,找到对应的版本后,下载下来.直接在文件所在目录,或者在安装中指定文

  • Python做屏幕录制工具的实现示例

    目录 思路 实现 录制 监听键盘事件 主体控制 视频信息 女朋友是一个软件测试人员,在工作中经常会遇到需要录屏记录自己操作,方便后续开发同学定位.因为录屏软件动不动就开始收费,所以她经常更换录屏软件.闲暇之余,我就觉得手痒,感觉可以用万能的 Python 来解决她的烦恼. 思路 我上网搜寻了一下相关知识,录制视频基本上都用的图像处理库 PIL 的 ImageGrab 模块.这个模块可以用于将当前屏幕的内容或者剪贴板上的内容拷贝到 PIL 图像内存.既然这个模块可以获取当前屏幕上的内容,那么我一直

  • Python获取系统所有进程PID及进程名称的方法示例

    本文实例讲述了Python获取系统所有进程PID及进程名称的方法.分享给大家供大家参考,具体如下: psutil模块中提供了进程管理方法,引用其中的几个方法就能够获得进程的相关信息.简单写个小脚本测试一下,顺便看看本机Windows7系统中到底运行着多少个进程,进程都是什么. 代码: # -*- coding: utf-8 -*- #! python2 #!/usr/bin/python import psutil pids = psutil.pids() for pid in pids: p

  • selenium+python实现基本自动化测试的示例代码

    安装selenium 打开命令控制符输入:pip install -U selenium 火狐浏览器安装firebug:www.firebug.com,调试所有网站语言,调试功能 Selenium IDE 是嵌入到Firefox 浏览器中的一个插件,实现简单的浏览器操 作的录制与回放功能,IDE 录制的脚本可以可以转换成多种语言,从而帮助我们快速的开发脚本,下载地址:https://addons.mozilla.org/en-US/firefox/addon/selenium-ide/ 如何使用

  • Python实现登录接口的示例代码

    之前写了Python实现登录接口的示例代码,最近需要回顾,就顺便发到随笔上了 要求: 1.输入用户名和密码 2.认证成功,显示欢迎信息 3.用户名3次输入错误后,退出程序 4.密码3次输入错误后,锁定用户名 Readme: 1.UserList.txt 是存放用户名和密码的文件,格式为:username: password,每行存放一条用户信息 2.LockList.txt 是存放已被锁定用户名的文件,默认为空 3.用户输入用户名,程序首先查询锁定名单 LockList.txt,如果用户名在里面

  • Python中字符串与编码示例代码

    在最新的Python 3版本中,字符串是以Unicode编码的,即Python的字符串支持多语言 编码和解码 字符串在内存中以Unicode表示,在操作字符串时,经常需要str和bytes互相转换   如果在网络上传输或保存到磁盘上,则从内存读到的数据就是str,要把str变为以字节为单位的bytes,称为编码   如果从网络或磁盘上读取字节流,则从网络或磁盘上读到的数据就是bytes,要把bytes变为str,称为解码   为避免乱码问题,应当始终坚持使用UTF-8编码对str和bytes进行

  • Python 多线程共享变量的实现示例

    多线程-共享全局变量 #coding=utf-8 from threading import Thread import time g_num = 100 def work1(): global g_num for i in range(3): g_num += 1 print("----in work1, g_num is %d---"%g_num) def work2(): global g_num print("----in work2, g_num is %d---&

  • Python实现ElGamal加密算法的示例代码

    在密码学中,ElGamal加密算法是一个基于迪菲-赫尔曼密钥交换的非对称加密算法.它在1985年由塔希尔·盖莫尔提出.GnuPG和PGP等很多密码学系统中都应用到了ElGamal算法. ElGamal加密算法可以定义在任何循环群G上.它的安全性取决于G上的离散对数难题. 使用Python实现ElGamal加密算法,完成加密解密过程,明文使用的是125位数字(1000比特). 代码如下: import random from math import pow a = random.randint(2

  • Django用户登录与注册系统的实现示例

    1.1.创建项目和app django-admin startproject mysite_login python manage.py startapp login 1.2.设置时区和语言 Django默认使用美国时间和英语,在项目的settings文件中,如下所示: LANGUAGE_CODE = 'en-us' TIME_ZONE = 'UTC' USE_I18N = True USE_L10N = True USE_TZ = True 我们把它改为亚洲/上海时间和中文 LANGUAGE_

随机推荐