Python办公自动化PPT批量转换操作

2025-02-18 15:11:05

PPT 分为内容和格式，用 Python 操作 PPT，就是利用 Python 对 PPT 的内容进行获取和填充，修改 PPT 的格式并不是 Python 的强项。因此，当你有一堆 PPT 要做的时候，先做好一个带格式的 PPT，然后用 Python 复制这个 PPT 文件，然后再对其进行读写。

python-pptx 模块的安装

pip install python-pptx

读取 PPT

假如文件「测试.pptx」的内容如下：

那么以下代码可以读取其内容：

from pptx import Presentation
prs = Presentation("测试.pptx")
for index, slide in enumerate(prs.slides):
    print(f"第 {index+1} 页")
    for shape in slide.shapes:
        if shape.has_text_frame:
            text_frame = shape.text_frame
            # print(text_frame.text)
            # 如果分段读就用下面的代码
            for paragraph in text_frame.paragraphs:
                print(paragraph.text)

执行结果如下所示：

写入 PPT

先来个简单点的。

假如要生成如下图所示的 PPT 页

代码可以这样写：

from pptx import Presentation
prs = Presentation()
title_slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(title_slide_layout)
title = slide.shapes.title
subtitle = slide.placeholders[1]
title.text = "Hello, World!"
subtitle.text = "python-pptx was here!"
prs.save('test.pptx')

添加一张幻灯片

幻灯片都有板式，同样的，pptx 提供了 9 种版式让我们选择，分别是：

Title (presentation title slide)
Title and Content
Section Header (sometimes called Segue)
Two Content (side by side bullet textboxes)
Comparison (same but additional title for each side by side content box)
Title Only
Blank
Content with Caption
Picture with Caption

分别对应 PPT 的如下版式，我已经用数据一一标出：

比如现在要添加一张标题和内容的版式，就可以这样写代码：

from pptx import Presentation
prs = Presentation()
SLD_LAYOUT_TITLE_AND_CONTENT = 1  ##标题和内容版式的序号
slide_layout = prs.slide_layouts[SLD_LAYOUT_TITLE_AND_CONTENT]
slide = prs.slides.add_slide(slide_layout)

为幻灯片添加内容

添加内容之前先理解一下形状。从技术上讲，可以在幻灯片上放置 9 种类型的形状：

形状 - 带有填充和轮廓的自动形状
文本框 - 没有填充和轮廓的自动形状
占位符 - 可以出现在幻灯片布局或母版上的自动形状，并在使用该布局的幻灯片上继承，允许添加采用占位符格式的内容
线路/连接器
图片
表格 - 行和列的东西
图表 – 饼图、折线图等。
智能艺术 - 尚不支持，但如果存在则保留
媒体剪辑——视频或音频

每一个幻灯片都有由一个形状树来组织，之所以称为树，是因为它在一般情况下是分层的；形状树中的节点可以是一个组形状，它本身可以包含形状并具有与形状树相同的语义。对于大多数用途，形状树具有列表语义。

获取幻灯片中的形状：

shapes = slide.shapes

自动形状是规则形状。正方形、圆形、三角形、星星之类的。有 182 种不同的形状可供选择。其中 120 个具有调整“手柄”，您可以使用它来改变形状。

许多形状类型共享一组公共属性。我们将在此处介绍其中的许多形状，因为其中一些形状只是 AutoShape 的一种特殊形式。

添加自动形状

以下代码添加一个圆角矩形形状，一英寸见方，并放置在距幻灯片左上角一英寸处：

from pptx.enum.shapes import MSO_SHAPE
from pptx.util import Inches
shapes = slide.shapes
left = top = width = height = Inches(1.0)
shape = shapes.add_shape(
    MSO_SHAPE.ROUNDED_RECTANGLE, left, top, width, height
)
prs.save('新建幻灯片.pptx')

有关所有 182 种自动形状类型的列表，具体请参阅官方文档 MSO_AUTO_SHAPE_TYPE 枚举项。

占位符

占位符也是一种形状，有 18 种类型的占位符。标题、中心标题、副标题、正文，内容，图片，剪贴画，图表、表格、智能艺术，日期、页脚、幻灯片编号，媒体剪辑，标题，垂直正文、垂直对象、垂直标题。

幻灯片上的占位符可以为空或已填充。这在图片占位符中最为明显。未填充时，占位符会显示可自定义的提示文本。内容丰富的占位符在为空时也会显示一个或多个内容插入按钮。

纯文本占位符在输入文本的第一个字符时进入“填充”模式，并在删除文本的最后一个字符时返回“未填充”模式。内容丰富的占位符在插入图片等内容时进入填充模式，并在删除该内容时返回未填充模式。为了删除填充的占位符，形状必须被删除两次。第一次删除删除内容并将占位符恢复到未填充模式。额外的删除将删除占位符本身。可以通过重新应用布局来恢复已删除的占位符。

访问占位符

>>> prs = Presentation()
>>> slide = prs.slides.add_slide(prs.slide_layouts[8])
>>> for shape in slide.placeholders:
...     print('%d %s' % (shape.placeholder_format.idx, shape.name))
...
0  Title 1
1  Picture Placeholder 2
2  Text Placeholder 3

如果已经知道占位符的索引，也可通过索引来访问：

>>> slide.placeholders[1]
<pptx.parts.slide.PicturePlaceholder object at 0x10d094590>
>>> slide.placeholders[2].name
'Text Placeholder 3'

将内容插入占位符

>>> prs = Presentation()
>>> slide = prs.slides.add_slide(prs.slide_layouts[8])
>>> placeholder = slide.placeholders[1]  # idx key, not position
>>> placeholder.name
'Picture Placeholder 2'
>>> placeholder.placeholder_format.type
PICTURE (18)
>>> picture = placeholder.insert_picture('my-image.png')

如果要插入表格：

from pptx import Presentation
from pptx.util import Inches
prs = Presentation()
title_only_slide_layout = prs.slide_layouts[5]
slide = prs.slides.add_slide(title_only_slide_layout)
shapes = slide.shapes
shapes.title.text = 'Adding a Table'
rows = cols = 2
left = top = Inches(2.0)
width = Inches(6.0)
height = Inches(0.8)
table = shapes.add_table(rows, cols, left, top, width, height).table
# set column widths
table.columns[0].width = Inches(2.0)
table.columns[1].width = Inches(4.0)
# write column headings
table.cell(0, 0).text = 'Foo'
table.cell(0, 1).text = 'Bar'
# write body cells
table.cell(1, 0).text = 'Baz'
table.cell(1, 1).text = 'Qux'
prs.save('write_ppt_table.pptx')

如果要插入图表：

from pptx import Presentation
from pptx.chart.data import CategoryChartData
from pptx.enum.chart import XL_CHART_TYPE
from pptx.util import Inches
# create presentation with 1 slide ------
prs = Presentation()
slide = prs.slides.add_slide(prs.slide_layouts[5])
# define chart data ---------------------
chart_data = CategoryChartData()
chart_data.categories = ['East', 'West', 'Midwest']
chart_data.add_series('Series 1', (19.2, 21.4, 16.7))
# add chart to slide --------------------
x, y, cx, cy = Inches(2), Inches(2), Inches(6), Inches(4.5)
slide.shapes.add_chart(
    XL_CHART_TYPE.COLUMN_CLUSTERED, x, y, cx, cy, chart_data
)
prs.save('write_ppt_chart.pptx')

PPT 转 Pdf

以下方法仅适用于 windows

def PPTtoPDF2(inputFileName, outputFileName, formatType = 32):
    import comtypes.client
    powerpoint = comtypes.client.CreateObject("Powerpoint.Application")
    powerpoint.Visible = 1
    if outputFileName[-3:] != 'pdf':
        outputFileName = outputFileName + ".pdf"
    deck = powerpoint.Presentations.Open(inputFileName)
    deck.SaveAs(outputFileName, formatType) # formatType = 32 for ppt to pdf
    deck.Close()
    powerpoint.Quit()

最后的话

本文抛砖引玉，更多复杂的 PPT 操作，请移步至文末的官方文档。

参考文档：

https://python-pptx.readthedocs.io/en/latest/user/quickstart.html

以上就是Python办公自动化PPT批量转换操作的详细内容，更多关于Python办公自动化的资料请关注我们其它相关文章！

python实现的生成word文档功能示例

本文实例讲述了python实现的生成word文档功能.分享给大家供大家参考,具体如下: 每月1次的测试费用报销,需要做一个文档.干脆花点时间写个程序吧. # -*- coding: utf-8 -*- from tools import get_data from docx import Document def new_doc(fee_data,doc_path,fee):#新建一个word文档,写入汇总表的数据 document = Document() p_total = document
使用Python 自动生成 Word 文档的教程

当然要用第三方库啦 :) 使用以下命令安装: pip install python-docx 使用该库的基本步骤为: 1.建立一个文档对象(可自动使用默认模板建立,也可以使用已有文件). 2.设置文档的格式(默认字体.页面边距等). 3.在文档对象中加入段落文本.表格.图像等,并指定其样式. 4.保存文档. 注:本库仅支持生成Word2007以后版本的文档类型,即扩展名为.docx 的. 下面分步介绍其基本使用方法: 步骤一: from docx import Document doc = Do
使用Python自动化Microsoft Excel和Word的操作方法

将Excel与Word集成,无缝生成自动报告毫无疑问,微软的Excel和Word是公司和非公司领域使用最广泛的两款软件.它们实际上是"工作"的同义词.通常情况下,每一周我们都会将两者结合起来,并以某种方式发挥它们的优点.虽然一般的日常用途不会要求自动化,但有时自动化可能是必需的.也就是说,当您有大量的图表.图形.表格和报告要生成时,如果您选择手动方式,它可能会成为一项极其繁琐的工作.其实没必要这样.实际上,有一种方法可以在Python中创建一个管道,您可以将两者无缝集成,在Excel
基于python实现自动化办公学习笔记(CSV、word、Excel、PPT)

1.CSV (1)写csv文件 import csv def writecsv(path,data): with open(path, "w") as f: writer = csv.writer(f) for rowData in data: print("rowData=", rowData) writer.writerow(rowData) path = r"E:\\Python\\py17\\automatictext\\000001.csv&qu
Python办公自动化PPT批量转换操作

目录 python-pptx 模块的安装读取 PPT 写入 PPT 添加一张幻灯片为幻灯片添加内容获取幻灯片中的形状: 添加自动形状占位符访问占位符将内容插入占位符如果要插入表格: 如果要插入图表: PPT 转 Pdf 最后的话如果你有一堆 PPT 要做,他们的格式是一样的,只是填充的内容不一样,那你就可以使用 Python 来减轻你的负担. PPT 分为内容和格式,用 Python 操作 PPT,就是利用 Python 对 PPT 的内容进行获取和填充,修改 PPT 的格式并不
利用Python实现快速批量转换HEIC文件

目录 1. 前言 2. 准备 3. 实战 4.最后 1. 前言最近打算做一批日历给亲朋好友,但是从 iPhone 上导出的照片格式是 HEIC 格式,而商家的在线制作网站不支持这种图片格式 PS:HEIC 是苹果采用的新的默认图片格式,它能在不损失图片画质的情况下,减少图片大小有很多在线网站支持图片批量转换,但是安全隐私又没法得到保证:如果使用 PS 等软件去一张张转换,浪费时间的同时效率太低本篇文章将使用 Python 批量实现 HEIC 图片文件的格式转换 2. 准备首先,我们安装
Python时间和字符串转换操作实例分析

本文实例讲述了Python时间和字符串转换操作.分享给大家供大家参考,具体如下: 例子: #!/usr/bin/python # -*- coding: UTF-8 -*- import time # 格式化成2016-03-20 11:45:39形式 print time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) # 格式化成Sat Mar 28 22:24:24 2016形式 print time.strftime("
python办公自动化之excel的操作

准备使用 Python 操作 Excel 文件,常见的方式如下: xlrd / xlwt openpyxl Pandas xlsxwriter xlwings pywin32 xlrd 和 xlwt 是操作 Excel 文件最多的两个依赖库其中, xlrd 负责读取 Excel 文件,xlwt 可以写入数据到 Excel 文件我们安装这两个依赖库 # 安装依赖库 pip3 install xlrd pip3 install xlwt xlrd 读取 Excel 使用 xlrd 中的 o
Python 如何实现批量转换视频音频的采样率

目录前言环境依赖代码验证一下前言本文主要分享一个python代码,可以将多个视频中的音频转化为相同采样率的视频.对视频格式的校验没有做,也不是很关键. 环境依赖 ffmpeg环境安装 ffmpy安装: pip install ffmpy -i https://pypi.douban.com/simple 代码不废话,上代码. #!/user/bin/env python # coding=utf-8 """ @project : csdn @author : 剑
Python 如何实现批量转换视频音频的采样率

目录前言环境依赖代码验证一下前言本文主要分享一个python代码,可以将多个视频中的音频转化为相同采样率的视频.对视频格式的校验没有做,也不是很关键. 环境依赖 ffmpeg环境安装,具体安装可以参考在Windows上安装FFmpeg程序的图文方法 ffmpy安装: pip install ffmpy -i https://pypi.douban.com/simple 代码不废话,上代码. #!/user/bin/env python # coding=utf-8 ""&
Python 玩转图像格式转换操作

最近在做图片相关的工作,面对各种格式的图片转换,在OpenCV跟Pillow之间来回切换.觉得有必要把这些东西记录下来,以备不时之需. 首先介绍一下图片的常见三种存储格式. 1.图片的存储格式不同的场景,经常会使用不同存储格式的图片. 在给人们展示时,一般是采用文件的方式进行存储,常见的有jpg,png,jpeg等等文件格式,便于人们区分理解. 在计算机网络中传输时,一般是采用字节流的方式进行存储,常见的有base64编码的图片字节流,便于计算机网络传输. 在计算机对图片进行处理时,一般是采用
Python办公自动化解决world文件批量转换

目录 python-docx 库简介读取 Word 写入 Word Word 转 pdf 最后的话只要是简单重复的工作,就想办法用 Python 来帮你解决吧,人生苦短,你需要 Python. Word 是办公软件中使用频率非常高的软件之一了,假如你需要调整 100 个 Word 文档的格式保持统一,或者要把 100 个 Word 全部转换为 pdf,那么你就需要 Python 来帮忙了. python-docx 库简介 python-docx 是一个可以对 Word 进行读写操作的第三方库
Python办公自动化之教你用Python批量识别发票并录入到Excel表格中

一.场景描述这里有以四张发票为例(辰哥网上搜的),将发票图片放到pic文件夹下. 随便打开一张发票提取目标:金额.名称.纳税人识别号.开票人. 最后将每一张发票的这四个内容保存到excel中: 二.准备环境需要用到的库如下: from PIL import Image as PI import pyocr import pyocr.builders from cnocr import CnOcr 安装的命令如下: pip install pyocr pip install cnocr 发票
python实现pptx批量向PPT中插入图片

目录项目背景基础加亿点点细节最终代码项目结果图总结项目背景实验结果拍摄了一组图片,数量较大,想要按顺序组合排版,比较简单的方式是在PPT中插入图片进行排版.但是PPT批量插入图片后,顺序打乱且不显示图片名称,每个图片单独调整位置和大小费时费力,于是想到使用工具批量操作.过去了解过python自动化办公模块,相对来说python也是简单易用的语言,项目预计不会耗费太大精力,故尝试学习实践一番.(非专业学习笔记分享,望各位大佬不吝指导!) 数据为16组实验,每组实验重复两次,共32个