iOS的音频文件的格式转换示例

背景

因为我的公司需要设计到app与硬件的通信,所以去年深入的研究了一下音频各种格式的转换,曾写过一篇简书,现在搬过来丰富下自己的blog。

首先介绍一下常用的音频文件格式

  • .amr:体积很小,1秒到约为1kb,所以音质缩水也很厉害,一般用于手机铃声或彩信
  • .mp3:比较流行的,有损音频,某些部分失真,,音质随码率的提高,越高越好
  • .wav:为无损音频
  • .pcm:无损的wav文件中音频数据的一种编码方式

由于App是通过AVAudioRecorder录制音频,默认格式为pcm,文件比较大,所以不适合用于聊天通信的文件格式,所以最优的选择是转换成amr格式

音频格式转换方式

.pcm-->.wav-->.amr

a)将pcm转成wav

什么是WAV和PCM?

WAV:wav是一种无损的音频文件格式,WAV符合 PIFF(Resource Interchange File Format)规范。所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。

PCM:PCM(Pulse Code Modulation----脉码调制录音)。所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录。PCM信号是由[1]、[0]等符号构成的数字信号,而未经过任何编码和压缩处理。与模拟信号比,它不易受传送系统的杂波及失真的影响。动态范围宽,可得到音质相当好的影响效果。

简单来说:wav是一种无损的音频文件格式,pcm是没有压缩的编码方式。

WAV和PCM的关系

WAV可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。

简单来说:pcm是无损wav文件中音频数据的一种编码方式,但wav还可以用其它方式编码。

这里详细写了pcm和wav的区别,我简单概括成pcm少了一个wav头描述信息。为此我从讯飞语音的sdk中移植出填写wav头的函数并修改了一下

// 为pcm文件写入wav头
+ (NSData*) writeWavHead:(NSData *)audioData {
 long sampleRate = [[self GetAudioRecorderSettingDict][AVSampleRateKey] longValue];
 long numOfChannelsKey = [[self GetAudioRecorderSettingDict][AVNumberOfChannelsKey] longValue];
 Byte waveHead[44];
 waveHead[0] = 'R';
 waveHead[1] = 'I';
 waveHead[2] = 'F';
 waveHead[3] = 'F';

 long totalDatalength = [audioData length] + 44;
 waveHead[4] = (Byte)(totalDatalength & 0xff);
 waveHead[5] = (Byte)((totalDatalength >> 8) & 0xff);
 waveHead[6] = (Byte)((totalDatalength >> 16) & 0xff);
 waveHead[7] = (Byte)((totalDatalength >> 24) & 0xff);

 waveHead[8] = 'W';
 waveHead[9] = 'A';
 waveHead[10] = 'V';
 waveHead[11] = 'E';

 waveHead[12] = 'f';
 waveHead[13] = 'm';
 waveHead[14] = 't';
 waveHead[15] = ' ';

 waveHead[16] = 16; //size of 'fmt '
 waveHead[17] = 0;
 waveHead[18] = 0;
 waveHead[19] = 0;

 waveHead[20] = 1; //format
 waveHead[21] = 0;

 waveHead[22] = numOfChannelsKey; //chanel
 waveHead[23] = 0;

 waveHead[24] = (Byte)(sampleRate & 0xff);
 waveHead[25] = (Byte)((sampleRate >> 8) & 0xff);
 waveHead[26] = (Byte)((sampleRate >> 16) & 0xff);
 waveHead[27] = (Byte)((sampleRate >> 24) & 0xff);

 long byteRate = sampleRate * 2 * (16 >> 3);;
 waveHead[28] = (Byte)(byteRate & 0xff);
 waveHead[29] = (Byte)((byteRate >> 8) & 0xff);
 waveHead[30] = (Byte)((byteRate >> 16) & 0xff);
 waveHead[31] = (Byte)((byteRate >> 24) & 0xff);

 waveHead[32] = 2*(16 >> 3);
 waveHead[33] = 0;

 waveHead[34] = 16;
 waveHead[35] = 0;

 waveHead[36] = 'd';
 waveHead[37] = 'a';
 waveHead[38] = 't';
 waveHead[39] = 'a';

 long totalAudiolength = [audioData length];

 waveHead[40] = (Byte)(totalAudiolength & 0xff);
 waveHead[41] = (Byte)((totalAudiolength >> 8) & 0xff);
 waveHead[42] = (Byte)((totalAudiolength >> 16) & 0xff);
 waveHead[43] = (Byte)((totalAudiolength >> 24) & 0xff);

 NSMutableData *pcmData = [[NSMutableData alloc]initWithBytes:&waveHead length:sizeof(waveHead)];
 [pcmData appendData:audioData];

 return pcmData;
 // [pcmData writeToFile:kVoiceWav atomically:true];

}

同时还需把关键的属性抽取出来(如:采样率,通道数…)

//录音格式的设置
+ (NSDictionary*)GetAudioRecorderSettingDict{
 NSDictionary *recordSetting = [[NSDictionary alloc] initWithObjectsAndKeys:
         [NSNumber numberWithFloat: 8000],AVSampleRateKey, //采样率
         [NSNumber numberWithInt: kAudioFormatLinearPCM],AVFormatIDKey,
         [NSNumber numberWithInt:16],AVLinearPCMBitDepthKey,//采样位数 默认 16
         [NSNumber numberWithInt: 2], AVNumberOfChannelsKey,//通道的数目
         nil];
 return recordSetting;
}

b)将wav转成amr

使用VoiceConvert(by:Tang Xiaoping)库能将wav转成amr,后来发现环信的EaseUI框架中也使用了这个

反过来转换也是差不多的

pcm<--->mp3

这个就很简单了,用lame的框架进行转换,这个框架网上资料一大堆

本人为此花了不少时间整理了一下这些文件格式的转换方法

/**
 * 转换wav到amr
 *
 * @param wavPath wav文件路径
 * @param isDelete 转换成功后是否删除源文件
 *
 * @return NO 失败 YES成功
 */
+ (BOOL) wav2Amr:(NSString *)wavPath isDeleteSourchFile:(BOOL)isDelete;

/**
 * 转换amr到wav
 *
 * @param amrPath amr文件路径
 * @param isDelete 转换成功后是否删除源文件
 *
 * @return NO 失败 YES成功
 */
+ (BOOL) amr2Wav:(NSString *)amrPath isDeleteSourchFile:(BOOL)isDelete;

/**
 * 转换pcm到mp3
 *
 * @param pcmPath pcm文件路径
 * @param isDelete 转换成功后是否删除源文件
 *
 * @return NO 失败 YES成功
 */
+ (BOOL) pcm2Mp3: (NSString *)pcmPath isDeleteSourchFile:(BOOL)isDelete;
/**
 * 转换pcm到wav
 *
 * @param pcmPath pcm文件路径
 * @param isDelete 转换成功后是否删除源文件
 *
 * @return NO 失败 YES成功
 */
+ (BOOL) pcm2Wav: (NSString *)pcmPath isDeleteSourchFile:(BOOL)isDelete;

/**
 * 转换pcm到amr
 *
 * @param pcmPath pcm文件路径
 * @param isDelete 转换成功后是否删除源文件
 *
 * @return NO 失败 YES成功
 */
+ (BOOL) pcm2Amr:(NSString *)pcmPath isDeleteSourchFile:(BOOL)isDelete;

/**
 * 为pcm文件写入wav头
 */
+ (NSData*) writeWavHead:(NSData *)audioData;
void conventToMp3(NSString *pcmFile,NSString *mp3File);

/**
 录音格式设置,转换的时候需要获取.(如:采样率、采样位数、通道的数目)
 建议使用此设置,如有修改,则转换amr时也要对应修改参数,比较麻烦

 @returns 录音设置
 */
+ (NSDictionary*)GetAudioRecorderSettingDict;

demo的下载地址https://github.com/qq631192328/PFAudio.git,如果觉得好麻烦点下星,如果有什么问题欢迎指正

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • 实例解析iOS app开发中音频文件播放工具类的封装

    一.简单说明 1.关于音乐播放的简单说明 (1)音乐播放用到一个叫做AVAudioPlayer的类 (2)AVAudioPlayer常用方法 加载音乐文件 复制代码 代码如下: - (id)initWithContentsOfURL:(NSURL *)url error:(NSError **)outError; - (id)initWithData:(NSData *)data error:(NSError **)outError; 准备播放(缓冲,提高播放的流畅性) - (BOOL)prep

  • 详解iOS App中调用AVAudioPlayer播放音频文件的用法

    要给工程中添加音频,首先要导入音频的框架 AVFoundation.framework 然后新建一个类继承于UIViewController, 我这里就叫FirstVC. 首先在 AppDelegate.m中初始化根视图 复制代码 代码如下: #import "AppDelegate.h" #import "FirstVC.h" @implementation AppDelegate - (void)dealloc {     [_window release];

  • IOS中微信小程序播放缓存的音频文件的方法

    很多时候我们都想把数据预先缓存到本地,节省带宽.但是最近在处理微信小程序播放缓存到本地的音频文件的时候,遇到一些小问题,然后对于安卓和IOS需要采用不同的播放策略. 首先,如果哪怕用audio标签来播放在线的音频文件,假如服务端没有实现断点续传,IOS是无法播放的,这个需要注意. 对于缓存在小程序的音频(wx.saveFile(OBJECT)保存的音频),IOS只能通过播放背景音乐的接口播放,其它播放方法都没有成功实践,而对于安卓,内部 audio 上下文 innerAudioContext 对

  • iOS获取本地音频文件(属性/信息)

    本文实例为大家分享了iOS获取本地音频文件的具体代码,供大家参考,具体内容如下 获取本地音频文件地址: NSString *songsDirectory=MUSIC_FILE_ALL;//沙盒地址 NSBundle *songBundle=[NSBundle bundleWithPath:songsDirectory]; NSString *bundlePath=[songBundle resourcePath]; NSArray *arrMp3=[NSBundle pathsForResour

  • iOS的音频文件的格式转换示例

    背景 因为我的公司需要设计到app与硬件的通信,所以去年深入的研究了一下音频各种格式的转换,曾写过一篇简书,现在搬过来丰富下自己的blog. 首先介绍一下常用的音频文件格式 .amr:体积很小,1秒到约为1kb,所以音质缩水也很厉害,一般用于手机铃声或彩信 .mp3:比较流行的,有损音频,某些部分失真,,音质随码率的提高,越高越好 .wav:为无损音频 .pcm:无损的wav文件中音频数据的一种编码方式 由于App是通过AVAudioRecorder录制音频,默认格式为pcm,文件比较大,所以不

  • 基于Python实现RLE格式分割标注文件的格式转换

    目录 1.Airbus Ship Detection Challenge 2.数据展示 2.1 标注数据 2.2 图象文件 3.格式转换 4.转换结果 1.Airbus Ship Detection Challenge url: https://www.kaggle.com/competitions/airbus-ship-detection Find ships on satellite images as quickly as possible Data Description In thi

  • Java实现时间日期格式转换示例

    Java时间格式转换大全 import java.text.*; import java.util.Calendar; public class VeDate { /** * 获取现在时间 * * @return 返回时间类型 yyyy-MM-dd HH:mm:ss */ public static Date getNowDate() { Date currentTime = new Date(); SimpleDateFormat formatter = new SimpleDateForma

  • ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码

    安装 官网下载 http://ffmpeg.org/ 选择需要的版本 在这个网址下载ffmpeg,https://github.com/BtbN/FFmpeg-Builds/releases 将解压后得到的以下几个文件放置在E:\FFmpeg下 环境变量 此电脑--属性--高级系统设置--环境变量 在系统变量(也就是下面那一半)处找到新建,按如下所示的方法填写 再将%FFMPEG_HOME%以及%FFMPEG_HOME%\bin写入系统变量的Path中 然后一路确定即可 验证 win+R,cmd

  • linux命令实现音频格式转换和拼接的方法

    安装FFmpeg flac eric@ray:~$ sudo apt install FFmpeg flac 安装lame faac eric@ray:~$ sudo apt install lame faac 将一个后缀为.ape格式的视频转换成m4a(mp4)格式 1.首先用ffmpeg命令或者flac 命令将它转换成mav格式,再用lame将wav转换成mp4格式 eric@ray:~/Music$ ffmpeg -i Gracie-Theme.ape Gracie-Theme.wav #

  • Python中xml和dict格式转换的示例代码

    在做接口自动化的时候,请求数据之前都是JSON格式的,Python有自带的包来解决.最近在做APP的接口,遇到XML格式的请求数据,费了很大劲来解决,解决方式是:接口文档拿到的是XML,在线转化为json格式(目的是拿到xml数据的模板),存放到json文件中,根据接口名去提取. github原文介绍:使用XML的Python模块感觉就像您在使用JSON 链接:https://github.com/martinblech/xmltodict 下载xmltodict(pip install xml

  • 使用ffmpeg 合并aac格式音频文件的方法

    FFmpeg简介 FFmpeg是一套可以用来记录.转换数字音频.视频,并能将其转化为流的开源计算机程序.采用LGPL或GPL许可证.它提供了录制.转换以及流化音视频的完整解决方案.它包含了非常先进的音频/视频编解码库libavcodec,为了保证高可移植性和编解码质量,libavcodec里很多code都是从头开发的. FFmpeg在Linux平台下开发,但它同样也可以在其它操作系统环境中编译运行,包括Windows.Mac OS X等.这个项目最早由Fabrice Bellard发起,2004

  • python利用tkinter实现图片格式转换的示例

    代码 import os from PIL import Image import tkinter import tkinter.filedialog import tkinter.messagebox class Window(): def __init__(self): self.root = root = tkinter.Tk() self.menu = tkinter.Menu(root) self.submenu = tkinter.Menu(self.menu, tearoff=0)

  • PHP将amr音频文件转换为mp3格式的操作细节

    说下整体思路 1.服务器安装ffmpeg 2.使用ffmpeg -i 指令来转换amr为mp3格式(这个到时候写在PHP代码中,使用exec函数执行即可) 3.在网页端使用HTML5的audio标签来播放mp3文件 下面是操作细节: 一.服务器安装ffmpeg以centos为例 此处参考:http://my.oschina.NET/ethan09/blog/372435 需要特别注意的是,在下面的方法中,amrnb和amrwb的安装到make环节会请求3gp的一个网址,一般是请求不到的,可以用c

随机推荐