三个Python自动化办公好用到爆的模块分享

目录
  • Pathlib
    • 删除与创建目录
    • 获取目录
    • 路径的拼接
    • 目录文件的判断
  • glob
  • PDF转成Word文档

今天小编来给大家推荐几个在自动化办公领域当中非常好用的Python模块,可以帮助大家在工作当中及大地提高效率,避免重复机械化地操作流程。

Pathlib

涉及到文件系统操作的时候,相信不少人仍然在使用Python当中的OS模块,相比较之下,Pathlib模块有着不少优势,我们来看几个简单的案例

删除与创建目录

例如我们可以来创建与删除目录,代码如下

from pathlib import Path

currentPath = Path.cwd()
makePath = currentPath / 'pythonPractice'
makePath.mkdir()

那么同样的,删除目录的代码为

currentPath = Path.cwd()
delPath = currentPath / 'pythonPractice'
delPath.rmdir()

获取目录

例如我们想要获取当前所在的目录的路径,代码如下

currentPath = Path.cwd()
print(currentPath)

以及电脑用户所在的目录

homePath = Path.home()
print(homePath) 

路径的拼接

例如我们想要拼接出桌面的绝对路径,代码如下

Path(Path.home(), "Desktop")

也可以是

Path.joinpath(Path.home(), "Desktop")

目录文件的判断

针对指定的路径,我们能够来判断是否是文件夹以及是否是一个文件,代码如下

input_path = r"指定的路径"

if Path(input_path ).exists():
 if Path(input_path ).is_file():
  print("是文件哦!")
 elif Path(input_path ).is_dir():
  print("是文件夹哦!")
else:
 print("路径给的不对!")

glob

Python当中的glob模块主要是用来查找符合特定规则的目录和文件,并将搜索到的结果返回到一个列表当中去。

由于该模块支持使用正则通配符来进行查找,因此使用起来也是特别的方便,我们来看一下简单的案例,

path1 = r".\[0-9].jpg"
glob.glob(path1)

outut

['.\\1.jpg', '.\\2.jpg', '.\\3.jpg', ......]

其中经常会用到的通配符有

  • *:匹配0个或者多个字符
  • **:匹配所有文件、目录,子目录和子目录里面的文件
  • []:匹配指定范围内的字符,例如[1-9]匹配的是1-9以内的字符
  • [!]:匹配不在指定范围内的字符

我们再来看几个案例,代码如下

for fname in glob.glob("./*.py"):
    print(fname)

上面的代码打印出了当前目录下的所有py后缀的文件,再来看一下案例

for fname in glob.glob("./file[!0-9].py"):
    print(fname)

上面代码则是打印出了以filename开头的非数字符号的py文件。

PDF转成Word文档

最后我们来讲讲如何实现将PDF文档转换成Word格式的文档,用到的模块是pdf2docx,我们先用pip命令来将该模块安装一下

pip install pdf2docx

我们来实践一下,代码如下

from pdf2docx import Converter

cv = Converter(r"pdf文档的具体路径")
cv.convert("test.docx", start=0,end=None)
cv.close()

如果是页面元素比较简单的文档,pdf2docx模块处理一下是完全够用了,但是有些时候PDF文档当中个别页面非常的花里胡哨,转换成Word格式的文档之后则会显得有点凌乱。

最后我们还能够针对指定的页数进行转换,例如只是针对文档当中的奇数页进行操作,代码如下

from pdf2docx import Converter

cv = Converter(r"pdf文档的具体路径")
cv.convert("test.docx", pages=[1, 3, 5, 7])
cv.close()

到此这篇关于三个Python自动化办公好用到爆的模块分享的文章就介绍到这了,更多相关Python自动化办公模块内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python标准库pathlib操作目录和文件

    目录 pathlib 基本组件 常用属性和基本方法 总结 学习 Python 时,尤其是在进行文件操作和数据处理时,经常会处理路径问题.最常用和常见的是 os.path 模块,它将路径当做字符串进行处理,如果使用不当可能导致难以察觉的错误,而且代码很难跨平台复用.pathlib 就是一个非常棒的Python标准库,超级好用. pathlib模块提供了一种在 POSIX 系统(如 Linux 和 Windows)下运行良好的高级抽象,它抽象了资源路径和资源命名结构,把文件系统接口从os模块中隔离出

  • Python文件系统模块pathlib库

    目录 一.pathlib库官方定义 二.pathlib秘籍 1. 基本用法 2. 基本属性 3. 改变路径 4. 拼接路径 5. 测试路径 6. 其他方法 三.os和pathlib.Path的区别 1. 获取当前文件路径 2. 获取上层/上层目录 3. 路径拼接 4. 其他封装 四.pathlib.PurePath的使用 1. PurePath.match 2. PurePath的子类:PurePosixPath(非Windows系统).PureWindowsPath 一.pathlib库官方定

  • Python 自动化常用操作大全

    目录 1. OS模块 2. shutil模块 3. globa模块 glob的几种用法 本文摘自微信公众号 GitPython:十个 Python 自动化常用操作.如有侵权,联系必删. 1. OS模块 导入:import os 1. 遍历文件夹 批量操作的前提就是对文件夹进行遍历,os.walk遍历文件夹后产生三个参数: 当前文件夹路径 包含文件夹的名称(列表形式) 包含文件名称(列表形式) 代码如下(按需求更改目标路径即可): for dirpath, dirnames, filenames

  • Python中的pathlib库使用详解

    目录 1. pathlib库介绍 2. pathlib库下Path类的基本使用 2.1 获取文件名 2.2 获取文件前缀和后缀 2.3 获取文件的文件夹及上一级.上上级文件夹 2.4 获取该文件所属的文件夹及其父文件夹 2.5 文件绝对路径 2.6 获取当前工作目录 2.7 获取用户 2.8 获取文件详细信息 2.9 检查目录或者文件是否存在 2.10 检查指定指定路径是否为folder或者file 2.11 将相对路径转换为绝对路径 2.12 遍历一个目录 2.13 获取所有符合pattern

  • Python自动化办公Excel模块openpyxl原理及用法解析

    openpyxl 介绍 openpyxl 是一个直接可用于读写 xlsx .xlsm.xltx.xltm 文件的 Python 内置库,借助它可以利用 Python 语法对本地 xlsx 文件进行自动化批量操作 先说一下安装部分,如果小伙伴们用 Anaconda 作为 Python 环境的话,openpyxl 无需安装可直接使用:需要安装的话方法也非常简单 pip 工具一行命令即可 pip install openpyxl xlsx 文件属性 在对 Excel 表格处理之前,需要了解一下 xls

  • python里glob模块知识点总结

    之前遇到过一类问题,要求快速做文件搜索,当时小编找了很多内容,但是没有发现实现方法,突然看到glob模块便豁然开朗了,该模块主要就是能够实现类似于windows的文件搜索,旗下的函数都可以实现搜索功能,并且有很多通配符,能够应用在多种场景中,一一对应的选择解决方案. 简单介绍: 匹配一定的格式文件和文件夹. 包含函数: 1.glob() 2.Iglob() 3.escape() 注意点: 不匹配以点符号(.)开始的文件,若需要则做处理. 应用实例: >>> import glob >

  • 三个Python自动化办公好用到爆的模块分享

    目录 Pathlib 删除与创建目录 获取目录 路径的拼接 目录文件的判断 glob PDF转成Word文档 今天小编来给大家推荐几个在自动化办公领域当中非常好用的Python模块,可以帮助大家在工作当中及大地提高效率,避免重复机械化地操作流程. Pathlib 涉及到文件系统操作的时候,相信不少人仍然在使用Python当中的OS模块,相比较之下,Pathlib模块有着不少优势,我们来看几个简单的案例 删除与创建目录 例如我们可以来创建与删除目录,代码如下 from pathlib import

  • Python自动化办公之邮件发送全过程详解

    使用Python实现自动化邮件发送,可以让你摆脱繁琐的重复性业务,可以节省非常多的时间.操作前配置(以较为复杂的QQ邮箱举例,其他邮箱操作类似) 单击设置-账号,滑倒下方协议处,开启IMAP/SMTP协议(IMAP,即Internet Message Access Protocol(互联网邮件访问协议),可以通过这种协议从邮件服务器上获取邮件的信息.下载邮件等.IMAP与POP类似,都是一种邮件获取协议.) (ps.开启需要验证) 记住端口号,后续写代码发送邮件时候需要: 生成授权码,前期配置完

  • Python自动化办公之Word转PDF的实现

    目录 pdf 工具包 - pdfkit html 转 pdf 网址 转 pdf 字符串生成pdf 结合 pydocx 将 word 转 html 再转 pdf 该章节我们将要学习如何将 word 文件转为 PDF文件,其实网上有很多种生成 PDF 的教程,不过绝大多数都是以 windows 为主的,并且兼容有很多的问题.windows.mac.linux 同时兼容的情况比较少,所以今天的章节我们就来学习一下如何在 windows.mac.linux 三种系统中都可以生成 PDF 的解决方案. p

  • Python自动化办公之创建PPT文件

    目录 PPT 的创建 python-pptx 的安装 生成一个空的 PPT python-pptx 的9种布局 从这一章开始,将进入 PPT 文件的自动化操作.关于 PPT 自动化操作所要实现的目的依然很简单.包括 “PPT的创建”.“读取PPT(不包含图片,图片是非可读对象)” 以及 “PPT” 的基本操作. 而使用到的操作 PPT 的模块就是 python-pptx 模块,我们全程就通过该模块来实现以上的内容. PPT 的创建 接下来我们就学习一下,如何利用 python-pptx 模块如何

  • Python自动化办公之PPT段落的使用

    目录 PPT 段落的使用 获取段落 段落添加内容 段落中定义多个段落 自定义段落 上一章节我们学习了基础的定义 PPT 的方法以及每一页中的样式,这节课我们将真正的在 PPT 中添加内容,学习一下 pptx 的段落的使用. PPT 段落的使用 开启本节课的学习,卷! 获取段落 既然是获取段落,就说明了是存在的段落,一开始就存在了某种样式之中. 第一步:定义 ppt 对象 ppt = Presentation() 通过 Presentation() 实例化一个 ppt 对象(Presentatio

  • Python自动化办公之手机号提取

    关于手机号码的提取,其实真正有用的部分就是re模块提供的正则表达式.使用正则表达式就能轻松地匹配到手机号码,由于功能比较简单这次并没有采用UI界面的方式来实现该功能. 第一步:写一个控制台输入函数. path = input('请输入需要提取手机号码的文件路径(.txt):\n') 第二步:读取包含手机号码的文本文件. def read_text(path): ''' 读取文本文件 :param path: 文本文件路径 :return: 返回文本 ''' file = open(path,en

  • python 自动化办公之批量修改文件名实操

    目录 1. 程序背景 2. 程序要求 3. 解决思路 4. 完整代码 5. 运行结果 6. 总结 1. 程序背景 之前做文件批量移动的时候不小心多加了一个pdf后缀,但问题不大,几行代码就可以搞定~ 2. 程序要求 将以下目录中文件夹中的有问题的文件全部重命名为单个.pdf结尾的文件 3. 解决思路 需要用到 os.re 和 shutil 三个库,均为系统自带,无需安装 使用 os 库得到年份的文件夹名,以及年份文件夹中的文件名 使用正则表达式 re 将“.pdf.pdf”全部替换为“.pdf”

  • python自动化办公操作PPT的实现

    1.python-pptx模块简介 使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍.这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便. 可以创建.修改PPT(.pptx)文件 需要单独安装,不包含在Python标准模块里 python-pptx官网介绍:ht

  • Python自动化办公实战案例详解(Word、Excel、Pdf、Email邮件)

    目录 背景 实现过程 1)替换Word模板生成对应邀请函 2)将Word邀请函转化为Pdf格式 4)自动发送邮件 5)完整代码 总结 背景 想象一下,现在你有一份Word邀请函模板,然后你有一份客户列表,上面有客户的姓名.联系方式.邮箱等基本信息,然后你的老板现在需要替换邀请函模板中的姓名,然后将Word邀请函模板生成Pdf格式,之后编辑统一的邀请话术(邮件正文),再依次发送邀请函附件到客户邮箱,你会怎么做? 正常情况下,我们肯定是复制粘贴Excel表格中的客户姓名,之后挨个Word文档进行替换

  • 五个方便好用的Python自动化办公脚本的实现

    目录 1.自动化阅读网页新闻 2.自动生成素描草图 3.自动发送多封邮件 4.自动化数据探索 5.自动桌面提示 小结 相比大家都听过自动化生产线.自动化办公等词汇,在没有人工干预的情况下,机器可以自己完成各项任务,这大大提升了工作效率. 编程世界里有各种各样的自动化脚本,来完成不同的任务. 尤其Python非常适合编写自动化脚本,因为它语法简洁易懂,而且有丰富的第三方工具库. 这次我们使用Python来实现几个自动化场景,或许可以用到你的工作中. 1.自动化阅读网页新闻 这个脚本能够实现从网页中

随机推荐