Python语音合成之第三方库gTTs/pyttsx3/speech横评(内附使用方法)

目录
  • Python文字转语音(调研&成品函数)
  • 什么是语音合成技术?
  • 如何用代码实现?
    • gTTS库
    • pyttsx3库
    • speech库
  • 总结

Python文字转语音(调研&成品函数)

由于项目需要, 我需要将文字转换为语音, 那么第一步就要进行调研

什么是语音合成技术?

语音合成(text to speech),简称TTS。是将文字转化为语音的一种技术,是让计算机模拟人类的嘴巴,通过不同的音色说出想表达的内容, 是人机对话的一部分。
TTS可以通过神经网络的设计,把文字智能地转化为自然语音流。极大的方便了视障患者的使用, 也提升了文本的可读性。TTS应用包括语音驱动的硬件以及声音敏感系统,并常与声音识别程序一起使用。

现在许多厂家都推出了自己的语音合成服务或API, 大家也可以去自行查看, 本文仅做了python环境下语音合成第三方库的调研

如何用代码实现?

如前文所述, 虽然市面上产品繁多, 但是作为一个开发者, 我想要一款免费的, 可代码调试的工具, 经过查找材料, 我找到了gTTs库、pyttsx3库、speech库都能满足我的需求, 来做个横向对比, 可以让大家少走弯路。

第三方库名称 需要联网 支持中英文 支持日语 可调节语速 像人声程度
ggts X 很像导航
pyttsx3 X X 适合读小说
speech X X X 很像快一点的导航

gTTS库

gTTS库 (Google Text-to-Speech) : 用于与 Google Translate 的文本转语音 API 进行交互。将语音mp3数据写入文件
优点 : 支持包括中英日文在内的多种语言, 有谷歌翻译API的加持, 人声蛮好听
缺点 : 不支持语速调节, 每次使用必须科学上网, 不能单机使用

在语音播放功能, 我们选用了两种方法

  • 第一种是playsound库自动播放音频(不可调播放进度)
  • 第二种是os库调用系统自带播放器(可调节进度)

请看playsound库播放 & GTTS库转文字函数

# 函数功能: 用gtts库阅读文本,保存为.mp3文件后, 用系统内置的浏览器阅读出来, 打开mp3文件, 函数执行结束(播放方式为os库)
def gtts_os_debug(text,mp3_filepath,language):#参数说明:参数1是朗读的文字,参数2是保存路径,参数3是数字{0英文,1中文,2日语}
    #大成功,可惜的是os调用自带播放器, 实际上只执行了"打开mp3"的操作, 它并不会在音频播报完后再进行下一条语句
    from gtts import gTTS
    import os
    # 已知zh-tw版本违和感较高,所以我们用zh-CN来进行后续工作
    if int(language) ==0 :
        s = gTTS(text=text, lang='en', tld='com')
        # s = gTTS(text=text, lang='en', tld='co.uk')#我比较喜欢美音,但是如果你喜欢英国口音可以尝试这个
    elif int(language) ==1 :
        s = gTTS(text=text, lang='zh-CN')
    elif int(language) ==2 :
        s = gTTS(text=text, lang='ja')
    try:
        s.save(mp3_filepath)
    except:
        os.remove(mp3_filepath)
        print(mp3_filepath,"文件已经存在,但是没有关系!已经删掉了")
        s.save(mp3_filepath)
    print(mp3_filepath,"保存成功")
    os.system(mp3_filepath)#调用系统自带的播放器播放MP3
gtts_os_debug(text="I'm gtts library,from google Artificial Intelligence & Google Translate.",mp3_filepath="gtts英文测试.mp3",language=0)
gtts_os_debug(text="我是gtts库, 你想听听我的声音吗",mp3_filepath="gtts中文测试.mp3",language=1)
gtts_os_debug(text="真実はいつもひとつ" ,mp3_filepath="gtts日语测试.mp3",language=2)

请看os库播放 & GTTS库转文字函数

# 函数功能: 用gtts库阅读文本,保存为.mp3文件后, 用playsound库阅读出来, 阅读完毕, 函数执行结束
def gtts_debug(text,mp3_filepath,language):#参数说明:参数1是朗读的文字,参数2是保存路径,参数3是数字{0英文,1中文,2日语}
    #大成功,已经实现了定制化文字转语音,但是播放的playsound需要改进(playsound库本身可能会出现bug...)
    from gtts import gTTS
    from playsound import playsound
    import os
    if int(language) ==0 :
        s = gTTS(text=text, lang='en', tld='com')
        # s = gTTS(text=text, lang='en', tld='co.uk')#我比较喜欢美音,但是如果你喜欢英国口音可以尝试这个
    elif int(language) ==1 :
        s = gTTS(text=text, lang='zh-CN')
    elif int(language) ==2 :
        s = gTTS(text=text, lang='ja')
    try:
        s.save(mp3_filepath)
    except:
        os.remove(mp3_filepath)
        print(mp3_filepath,"文件已经存在,但是没有关系!已经删掉了")
        s.save(mp3_filepath)
    print(mp3_filepath,"保存成功")
    playsound(mp3_filepath)
gtts_debug(text="I'm gtts library,from google Artificial Intelligence & Google Translate.",mp3_filepath="gtts英文测试.mp3",language=0)
gtts_debug(text="我是gtts库, 你想听听我的声音吗",mp3_filepath="gtts中文测试.mp3",language=1)
gtts_debug(text="真実はいつもひとつ" ,mp3_filepath="gtts日语测试.mp3",language=2)

pyttsx3库

pyttsx3库 : 是Python中的文本到语音转换库, 它可以脱机工作
优点 : 可以脱机工作, 支持将语音直接朗读, 可调节音量和速度
缺点 : 初始只有英语(女)和中文(女)的语音包, 其他语言的语音包需要另外下载

请看pyttsx3库转文字&自朗读函数

def pyttsx3_debug(text,language,rate,volume,filename,sayit=0):
    #参数说明: 六个重要参数,阅读的文字,语言(0-英文/1-中文),语速,音量(0-1),保存的文件名(以.mp3收尾),是否发言(0否1是)
    import pyttsx3
    engine = pyttsx3.init()  # 初始化语音引擎
    engine.setProperty('rate', rate)  # 设置语速
    #速度调试结果:50戏剧化的慢,200正常,350用心听小说,500敷衍了事
    engine.setProperty('volume', volume)  # 设置音量
    voices = engine.getProperty('voices')  # 获取当前语音的详细信息
    if int(language)==0:
        engine.setProperty('voice', voices[0].id)  # 设置第一个语音合成器 #改变索引,改变声音。0中文,1英文(只有这两个选择)
    elif int(language)==1:
        engine.setProperty('voice', voices[1].id)
    if int(sayit)==1:
        engine.say(text)  # pyttsx3->将结果念出来
    elif int(sayit)==0:
        print("那我就不念了哈")
    engine.save_to_file(text, filename) # 保存音频文件
    print(filename,"保存成功")
    engine.runAndWait() # pyttsx3结束语句(必须加)
    engine.stop() # pyttsx3结束语句(必须加)
pyttsx3_debug(text="我是pyttsx3, 初次见面, 给您拜个早年",language=0,rate=200,volume=0.9,filename="ptttsx3中文测试.mp3",sayit=1)
pyttsx3_debug(text="I'm fake Siri, your smart voice Manager",language=1,rate=200,volume=0.9,filename="ptttsx3英文测试.mp3",sayit=1)

speech库

speech : 基于Windows的语音合成模块, 一行代码即可实现朗读
优点 : 依靠windows系统, 安装使用究极简单 , 超级方便。
适合在代码调试过程中, 让冰冷的AI语言来骂醒写bug的我QAQ
缺点 : 只有系统语言(中文&英文), 不支持语速调节和音频导出

请看speech转文字函数

import speech
speech.say("甘霖娘,又出bug了")
speech.say("Don't ask me .I have no idea why bug exist again")
# 如你所见, 代码编译究极简单, 而且单机, 但是!每次使用都会呼出微软语音助手...

恭喜你, 你已经学会了Python文字转语音的全部内容了

可惜的是, 本博文没有收录诸如百度API/讯飞API等...商务的文字转语音方式

总结

到此这篇关于Python语音合成之第三方库gTTs/pyttsx3/speech横评的文章就介绍到这了,更多相关Python语音合成gTTs/pyttsx3/speech内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 通过Python的gtts库将文字转为音频的操作方法

    目录 前言 一.背景 二.TTS名词解释 三.GTTS名词解释 四.实现方式 gTTS 1.引入库 2.定义需要转换的文本 3.设置中文发音 4.将文本转换为语音 5.保存语音文件 五.语音效果 前言 大家好,我是空空star,本篇给大家分享一下使用python将文字转成音频. 一.背景 文字转音频可以帮助视觉障碍者通过听取声音来获取信息:也可以帮助人们方便地听取一些长篇文章或学习资料,节省阅读时间和疲劳.同时,对于一些语言学习者,文字转音频也可以帮助其更好地学习语音语调,提高语言表达能力. 二

  • 通过Python的speech_recognition库将音频文件转为文字

    目录 前言 一.音频准备 二.音频声音 三.格式转换 四.音频转文字 1.引入库 2.定义音频路径 3.创建一个Recognizer对象 4.打开音频文件,将音频文件读入Recognizer对象 5.尝试使用Google Web API将语音转换为文字 6.转换结果 总结 前言 大家好,我是空空star,本篇给大家分享一下通过Python的speech_recognition库将音频文件转为文字.上一篇已经介绍了相关的库speech_recognition. Python-语音转文字相关库介绍

  • 如何通过Python的pyttsx3库将文字转为音频

    目录 前言 一.pyttsx3是什么? 二.安装pyttsx3 三.查看pyttsx3版本 四.pyttsx3的使用 1.引入库 2.定义需要转换的文本 3.初始化pyttsx3引擎 4.设置声音 5.设置语速 6.设置音量 7.播放语音 8.保存语音 9.等待完成语言转换 五.语音效果 总结 前言 大家好,我是空空star,本篇给大家分享一下通过Python的pyttsx3库将文字转为音频. 一.pyttsx3是什么? pyttsx3是一个开源的Python文本转语音库,可以将文本转换为自然的

  • Python第三方库h5py_读取mat文件并显示值的方法

    mat数据格式是Matlab默认保存的数据格式.在Python中,我们可以使用h5py库来读取mat文件. >>> import h5py >>> data = h5py.File("**.mat") >>> test = data["digitStruct/name"] #<HDF5 dataset "name": shape (13068, 1), type "|O&quo

  • 使用豆瓣源来安装python中的第三方库方法

    这里以安装简单的nonebot库为例子 欧克,简明扼要,拿走点赞哟: 大家想要的豆瓣源如下: 因为有几个,但在这里还是建议使用国内的豆瓣源,本人感觉好用. pip3 install nonebot -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 解释一下啊:nonebot 这个是你自己要安装的第三方库的名字,自己想要装的第三方库就这改就行了. 下面这些是对于不会安装第三方库的同学们而写,如果会的话可以忽略下面,那就

  • Python自动安装第三方库的小技巧(pip使用详解)

    大家好,我是才哥. 最近周末也加班了,害- 有刚接触python的粉丝同学在运行此前<>的完整代码遇到以下问题,然后- 好吧,今天我们就专门介绍一下Python安装第三方库的一些小技巧,其中还包含自动安装的方法哈. 1. pip在线安装 在cmd命令行模式下,通过pip install 第三方库名称的形式,直接进行第三方库的安装. 我们以安装plotly为例,安装表现如下: pip install plotly 如果需要安装的第三方库已经存在,我们执行安装命令的时候会提示其存在且展示库安装的位

  • Python使用sqlite3第三方库读写SQLite数据库的方法步骤

    目录 1 数据概览 2 任务定义 3 实现步骤 3.1 利用pandas读取学生信息 3.2 利用sqlite3创建数据库和学生表 3.3 利用sqlite3将学生信息存入数据库 3.4 将李四数学成绩70录入SQLite数据库 3.5 将数据库中的王五数学成绩改为85 3.5 计算学生的各科平均分,并给出总分排名 4 小小的总结 1 数据概览 学生课程成绩:studentID.name.english.chinese.math,存在一定缺失值 2 任务定义 基于学生课程成绩文件,使用panda

  • Python pip安装第三方库的攻略分享

    目录 简介 常用命令 安装后缀whl文件 常用的国内镜像 简介 pip 是 Python 的包安装程序.其实,pip 就是 Python 标准库(The Python Standard Library)中的一个包,只是这个包比较特殊,用它可以来管理 Python 标准库(The Python Standard Library)中其他的包.pip 支持从 PyPI,版本控制,本地项目以及直接从分发文件进行安装.pip 是一个命令行程序.安装 pip 后,会向系统添加一个 pip 命令,该命令可以从

  • Python中使用第三方库xlrd来写入Excel文件示例

    继上一篇文章使用xlrd来读Excel之后,这一篇文章就来介绍下,如何来写Excel,写Excel我们需要使用第三方库xlwt,和xlrd一样,xlrd表示read xls,xlwt表示write xls,同样目前版本只支持97-03版本的Excel.xlwt下载:xlwt 0.7.4 安装xlwt 安装方式一样是python setup.py install就可以了,或者直接解压到你的工程目录中. API介绍 获取一个xls实例 复制代码 代码如下: xls = ExcelWrite.Work

  • Python使用到第三方库PyMuPDF图片与pdf相互转换

    使用 Python 进行图片和pdf之间的相互转换 使用到第三方库 PyMuPDF 在 python 环境下对 PDF 文件的操作. PDF 转为图片 需新建文件夹 pdf2png import fitz import glob def rightinput(desc): flag=True while(flag): instr = input(desc) try: intnum = eval(instr) if type(intnum)==int: flag = False except: p

  • Python pip安装第三方库实现过程解析

    对于Python开发用户来讲,安装第三方库是家常便饭,下面提供两种安装方式 pycharm软件安装 1.打开file>setting 2.点击+号 查询第三方库名,点击安装即可 pip安装 打开dos窗口,输入pip install 第三方库名 即可 注意:由于国外的源下载速度有时候太慢,浪费时间.而且经常出现下载后安装出错问题.所以把PIP安装源替换成国内镜像,可以大幅提升下载速度,还可以提高安装成功率. 国内源: 清华:https://pypi.tuna.tsinghua.edu.cn/si

  • Python中使用第三方库xlrd来读取Excel示例

    本篇文章介绍如何使用xlrd来读取Excel表格中的内容,xlrd是第三方库,所以在使用前我们需要安装xlrd.另外我们一般会使用xlwt来写Excel,所以下一篇文章我们会来介绍如何使用xlwt来写Excel.xlrd下载:xlrd 0.8.0 安装xlrd 安装xlrd,只需运行setup即可,另外你也可以直接解压缩到你的project中,也可以直接用 xlrd的API 获取Excel,这里称之为work book 复制代码 代码如下: open_workbook(file_name) 获取

  • Python中使用第三方库xlutils来追加写入Excel文件示例

    目前还没有更好的方法来追写Excel,lorinnn在网上搜索到以及之后用到的方法就是使用第三方库xlutils来实现了这个功能,主体思想就是先复制一份Sheet然后再次基础上追加并保存到一份新的Excel文档中去. 使用xlutils 代码实现如下: # -*- coding: utf-8 -*- ''' Created on 2012-12-17 @author: walfred @module: XLRDPkg.write_append @description: ''' import o

随机推荐