python办公之python编辑word

目录
  • 1 前言
  • 2 前提准备
    • 2.1 python-docx 的安装
    • 2.2 docx 文档的结构说明
  • 3 具体使用
    • 3.1 创建标题
    • 3.2 创建段落
    • 3.3 创建表格
    • 3.4 文档保存
    • 3.5 获取文档操作
    • 3.6 其它操作
  • 4 总结

1 前言

在工作中时常会有繁重的文案工作,接触了python 之后,就会觉得这个比较简单了,python 操作word 和 excel 是比较常用的操作,相对比较简单,在本文中,我们就以 python 操作 word 为例来介绍一些简单的操作。

2 前提准备

2.1 python-docx 的安装

需要操作的前提是下载 docx 相关的操作类库 python-docx ,操作的环境和 IDE 环境如下所示

#使用的python 版本 python3.7.6 IDE pycharm2019
# 安装命令
pip install python-docx
# 查看安装版本
pip list | grep python-docx

2.2 docx 文档的结构说明

事先声明一下,python 操作的word版本必须是 docx 的版本,doc 的文档暂不支持。另外 docx 文档也是一种 xml 的数据组织格式, 首先了解一下其格式情况,

在word文档中,其主要结构如下所述:

  • 1 每个document包含多个paragraph,每个paragraph有多个run,每个run包含有(text文本,font字体,color颜色,字号)
  • 2 每个document包含多个tables,table中有多个rows,每个row包含多个cells,每个cell中包含多个paragraph。对于写word表格不论是 head 还是paragraph 基本操作都是先添加对象,然后再添加run就好了
  • 3 word表格的结构包含head标题、normal 正文、Caption表

3 具体使用

3.1 创建标题

# 创建一个document
document = Document()
# 创建一个标题 默认是一级标题
head = document.add_heading(level=4)
run = head.add_run("这是一个四级标题 this is a title")
# font.name 只能设置西文字体
run.font.name = 'Times New Roman'
# 中文字体需要使用这种方式设置
run._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
# 设置大小为11磅
run.font.size = Pt(16)
# 段落字体颜色
run.font.color.rgb = RGBColor(128, 0, 128)
# 是否加粗
run.bold = False
# 是否斜体
run.italic = False

3.2 创建段落

# 创建一个段落
ph = document.add_paragraph()
# 添加段落 段落间距段落前13磅 段落后13磅 行间距固定值18磅
ph.paragraph_format.space_before = Pt(13)
ph.paragraph_format.space_after = Pt(13)
ph.paragraph_format.line_spacing = Pt(18)
# 设置2.5倍行间距
ph.paragraph_format.line_spacing = 2.5
# 段落缩进 段落左缩进0.5英寸 left_indent right_indent
# p.paragraph_format.left_indent = Inches(0.5)
# 首行缩进 首行缩进0.9cm
ph.paragraph_format.first_line_indent = Cm(0.9)
# 段落左对齐
ph.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT
run1 = ph.add_run("历史上第一个儿子当皇帝,老爹还活着的,当属刘太公,也就是刘邦的父亲。刘邦建立汉朝,称帝,"
                  "每天还去拜见刘太公,后来有大臣进言讲,虽然刘太公贵为皇帝父亲,但也为人臣,不应该由皇帝前去拜见。")
run1.font.size = Pt(12)
run1.font.color.rgb = RGBColor(128, 128, 128)
run1.font.name = 'Times New Roman'
run1._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')

3.3 创建表格

# 创建一个表格 3行四列 也可以不设置
table = document.add_table(rows=1, cols=3)
# 自动调整表格
table.autofit = True
# 设置表格样式
table.style = 'Table Grid'
# 表头
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
# 准备数据
records = (
    (3, '101', 'Spam'),
    (7, '422', 'Eggs'),
    (4, '631', 'Spam, spam, eggs, and spam')
)
# 添加内容
for qty, id, desc in records:
    row_cells = table.add_row().cells
    row_cells[0].text = str(qty)
    row_cells[1].text = id
    row_cells[2].text = desc

3.4 文档保存

# 保存文档 指定保存位置
document.save(r"demo_word.docx")

3.5 获取文档操作

#获取文档中所有段落的样式根据样式进行修改文档
docu = Document(r'D:/xxx.docx')
for p in docu.paragraphs:
    style_name = p.style.name
    print(style_name)
#获取文档中所有的表格
for tb in docu.tables:
    # tb.rows 文档中所有的行 tb.rows[0].cells 某一行的所有单元格
    # 循环单元格进行编辑样式操作

3.6 其它操作

# word表格单元格背景颜色
def set_cell_background_color(cell, color):
    # print(colorStr)
    shading_elm_1 = parse_xml(r'<w:shd {} w:fill="{color_value}"/>'.format(nsdecls('w'), color_value=color))
    cell._tc.get_or_add_tcPr().append(shading_elm_1)
    cells1[i].paragraphs[0].style = "表格体"
# 修改背景颜色为白色
set_cell_background_color(rows.cells[0], "#FFFFFF")

# 查看文档内所有的样式
for sts in document.styles:
    print(sts)
# 查看word文档结构
print(document._element.xml)

4 总结

最终产生的效果如下图所示:

在本章中,介绍了怎么使用python-docx创建wor文档,并举例说明了创建段落,表格,标题,图片等要点。

到此这篇关于python办公之python编辑word的文章就介绍到这了,更多相关python编辑word内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python实现Word的读写改操作

    目录 用 docx 模块读取 Word Word 调整样式 Word 写入操作 用 docx 模块读取 Word docx 安装 cmd 中输入pip install python-docx 即可安装 docx 模块 docx 常用函数 创建空白文档 from docx import Document document = Document() document.save("word.docx") # 生成空白 word print(document) 读取文档 from docx i

  • Python批量对word文档进行操作步骤

    目录 导读 应用 细节介绍 导读 前面几章我们以经介绍了怎么批量对excel和ppt操作今天我们说说对word文档的批量操作 应用 python-docx允许您创建新文档以及对现有文档进行更改.实际上,它只允许您对现有文档进行更改:只是如果您从一个没有任何内容的文档开始,一开始可能会觉得您是从头开始创建一个文档. 这个特性是一个强大的特性.文档的外观很大程度上取决于删除所有内容时留下的部分.样式.页眉和页脚等内容与主要内容分开包含,允许您在起始文档中进行大量自定义,然后出现在您生成的文档中. 让

  • Python 自动化处理Excel和Word实现自动办公

    今天我来分享一些Python办公自动化的方法,欢迎收藏学习,喜欢点赞支持,欢迎畅聊. Openpyxl Openpyxl 可以说是 Python 中最通用的工具模块了,它使与 Excel 交互pip install openpyxl pip install python-docx简直就像在公园里漫步一样. 有了它,你就可以读写所有当前和传统的 excel 格式,即 xlsx 和 xls. Openpyxl 允许填充行和列.执行公式.创建 2D 和 3D 图表.标记轴和标题,以及大量可以派上用场的

  • Python自动化办公实战案例详解(Word、Excel、Pdf、Email邮件)

    目录 背景 实现过程 1)替换Word模板生成对应邀请函 2)将Word邀请函转化为Pdf格式 4)自动发送邮件 5)完整代码 总结 背景 想象一下,现在你有一份Word邀请函模板,然后你有一份客户列表,上面有客户的姓名.联系方式.邮箱等基本信息,然后你的老板现在需要替换邀请函模板中的姓名,然后将Word邀请函模板生成Pdf格式,之后编辑统一的邀请话术(邮件正文),再依次发送邀请函附件到客户邮箱,你会怎么做? 正常情况下,我们肯定是复制粘贴Excel表格中的客户姓名,之后挨个Word文档进行替换

  • 一文教你如何用Python轻轻松松操作Excel,Word,CSV

    目录 Python操作Excel 常用工具 xlrd&xlwt&xlutils介绍 安装库 写入Excel 读取Excel 修改excel 格式转换操作 Python操作Word 安装python-docx 写入Word 读取Word文件 Python操作CSV 简介 基本使用 Python 操作 Excel 常用工具 数据处理是 Python 的一大应用场景,而 Excel 又是当前最流行的数据处理软件.因此用 Python 进行数据处理时,很容易会和 Excel 打起交道.得益于前人的

  • python 针对在子文件夹中的md文档实现批量md转word

    前言; 最近想要实现批量将mardown文档转化为word.网上有很多解决的方法,但是自己保存的md文档在不同的文件夹,而大部分只能实现同一文件夹内的转换,因此稍加改进,得出以下功能. from glob import glob from pathlib import Path import os dirs = [ d for d in glob("./**/")] # 用在本文件夹内则调整为下列代码 # dirs = [ d for d in glob("./")

  • python办公之python编辑word

    目录 1 前言 2 前提准备 2.1 python-docx 的安装 2.2 docx 文档的结构说明 3 具体使用 3.1 创建标题 3.2 创建段落 3.3 创建表格 3.4 文档保存 3.5 获取文档操作 3.6 其它操作 4 总结 1 前言 在工作中时常会有繁重的文案工作,接触了python 之后,就会觉得这个比较简单了,python 操作word 和 excel 是比较常用的操作,相对比较简单,在本文中,我们就以 python 操作 word 为例来介绍一些简单的操作. 2 前提准备

  • 使用python matplotlib 画图导入到word中如何保证分辨率

    在写论文时,如果是菜鸟级别,可能不会花太多时间去学latex,直接用word去写,但是这有一个问题,当我们用其他工具画完实验彩色图时,放到word中会有比较模糊,这有两个原因导致的. 原因一:图片导入word中,word会对图片进行压缩,导致图片分辨率变小.可以在word中指定word的属性.过程如下: 选中图片 选择格式菜单栏 点击压缩图片按钮(上面圈出来的地方),在弹出来的对话框选择(220ppi),如下图所示: 原因二:用matplotlib产生的图片太大,如果在word中显示就需要缩小,

  • 使用Python通过win32 COM实现Word文档的写入与保存方法

    通过win32 COM接口实现软件的操作本质上来看跟直接操作软件一致,这跟我之前经常用的通过各种扩展的组件或者库实现各种文件的处理有较大的差异.如果有过Windows下使用Word的经历,那么使用win32 COM应该说是更为便捷的一种方式. 先前通过拼凑网络上的代码实现过Word文档的处理,今天通过读文档从头开始做一次新的尝试.简单实现一个Word文件的创建.写入与存储. 实现的代码如下: #!/usr/bin/python import os from win32com.client imp

  • 基于python的docx模块处理word和WPS的docx格式文件方式

    Python docx module for Word or WPS processing 本文是通过docx把word中的表格中的某些已填好的内容提取出来,存入excel表格. 首先安装docx的python模块: pip install python-docx 由于处理的为中文和符号,改成utf-8编码格式 import sys reload(sys) sys.setdefaultencoding('utf-8') from docx import Document import panda

  • 使用Python自动化Microsoft Excel和Word的操作方法

    将Excel与Word集成,无缝生成自动报告 毫无疑问,微软的Excel和Word是公司和非公司领域使用最广泛的两款软件.它们实际上是"工作"的同义词.通常情况下,每一周我们都会将两者结合起来,并以某种方式发挥它们的优点.虽然一般的日常用途不会要求自动化,但有时自动化可能是必需的.也就是说,当您有大量的图表.图形.表格和报告要生成时,如果您选择手动方式,它可能会成为一项极其繁琐的工作.其实没必要这样.实际上,有一种方法可以在Python中创建一个管道,您可以将两者无缝集成,在Excel

  • python实现某考试系统生成word试卷

    本文实例为大家分享了python实现某考试系统生成word试卷的具体代码,供大家参考,具体内容如下 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 准备条件 1.试题excel信息,存放在名为data.xls的excel文件中 2.安装python依赖的模块信息 pip install xlrd pip install python-docx 提示:以下是本篇文章正文内容,下面案例可供参考 编码实现 #!/bin/bash env python import xlrd impo

  • 两行Python代码实现pdf转word功能

    目录 一.安装依赖包 二.pdf转word 2.1 代码实现 2.2 pdf内容 2.3 转换后的word 补充 一.安装依赖包 pip install --index https://pypi.mirrors.ustc.edu.cn/simple/ python-office 二.pdf转word 2.1 代码实现 import office office.pdf.pdf2docx(file_path = 'test.pdf') 运行过程如下: [1/4] Opening document..

  • Python基础语法(Python基础知识点)

    Python与Perl,C和Java语言等有许多相似之处.不过,也有语言之间有一些明确的区别.本章的目的是让你迅速学习Python的语法. 第一个Python程序: 交互模式编程: 调用解释器不经过脚本文件作为参数,显示以下提示: $ python Python 2.6.4 (#1, Nov 11 2014, 13:34:43) [GCC 4.1.2 20120704 (Red Hat 5.6.2-48)] on linux2 Type "help", "copyright&

  • Windows上配置Emacs来开发Python及用Python扩展Emacs

    Windows下配置Emacs来开发Python 去年在网上偶然的一个机会知道了Emacs的存在,在周围前辈们都在夸赞Sublime好用的时候,喜欢跟大众唱反调的我,突然觉得如果能用Emacs来编代码,也许是个很牛的技能. 但是在看了一次Tutorial后,就因为复杂的快捷键和不同于一般编辑器的操作方式放弃了这个想法. 今年开始工作以后,公司还没有给我发配项目,让我有时间学了些Python入门.在寻找合适的编辑器的时候,搁置脑后许久的Emacs突然被揪了出来. 重新开始打开教程,耐着性子看完,并

随机推荐