Python使用到第三方库PyMuPDF图片与pdf相互转换
使用 Python 进行图片和pdf之间的相互转换
使用到第三方库 PyMuPDF 在 python 环境下对 PDF 文件的操作。
PDF 转为图片
需新建文件夹 pdf2png
import fitz import glob def rightinput(desc): flag=True while(flag): instr = input(desc) try: intnum = eval(instr) if type(intnum)==int: flag = False except: print('请输入正整数!') pass return intnum pdffile = glob.glob("*.pdf")[0] doc = fitz.open(pdffile) flag = rightinput("输入:1:全部页面;2:选择页面\t") if flag == 1: strat = 0 totaling = doc.pageCount else: strat = rightinput('输入起始页面:') - 1 totaling = rightinput('输入结束页面:') for pg in range(strat, totaling): page = doc[pg] zoom = int(100) rotate = int(0) trans = fitz.Matrix(zoom / 100.0, zoom / 100.0).preRotate(rotate) pm = page.getPixmap(matrix=trans, alpha=False) pm.writePNG('pdf2png/%s.png' % str(pg+1))
图片合并为 PDF 文件
将所需合并的图片放置与文件夹 pic2pdf 中。
import glob import fitz import os def pic2pdf(): doc = fitz.open() for img in sorted(glob.glob("pic2pdf/*")): # 读取图片,确保按文件名排序 print(img) imgdoc = fitz.open(img) # 打开图片 pdfbytes = imgdoc.convertToPDF() # 使用图片创建单页的 PDF imgpdf = fitz.open("pdf", pdfbytes) doc.insertPDF(imgpdf) # 将当前页插入文档 if os.path.exists("allimages.pdf"): os.remove("allimages.pdf") doc.save("allimages.pdf") # 保存pdf文件 doc.close() if __name__ == '__main__': pic2pdf()
好了今天为大家介绍的比较简单,希望大家能明天
相关推荐
-
Python结合ImageMagick实现多张图片合并为一个pdf文件的方法
本文实例讲述了Python结合ImageMagick实现多张图片合并为一个pdf文件的方法.分享给大家供大家参考,具体如下: 前段时间买了不少书,现在手头的书籍积累的越来越多,北京这边租住的小屋子空间越来越满了.自从习惯了笔记本触摸板的手势操作之后,我偶觉得使用电脑看电子文档也挺享受的.于是想把自己的部分书籍使用手机拍照,然后合并成一个pdf文件. 最初尝试过找成熟的Windows软件,但是始终没有找到一个好用的软件.想写脚本处理,一直也没有实现.偶然查看ImageMagick软件的说明,找到了
-
python爬取网页内容转换为PDF文件
本文实例为大家分享了python爬取网页内容转换为PDF的具体代码,供大家参考,具体内容如下 将廖雪峰的学习教程转换成PDF文件,代码只适合该网站,如果需要其他网站的教程,可靠需要进行稍微的修改. # coding=utf-8 import os import re import time import pdfkit import requests from bs4 import BeautifulSoup from PyPDF2 import PdfFileMerger import sys
-
python爬取网页转换为PDF文件
爬虫的起因 官方文档或手册虽然可以查阅,但是如果变成纸质版的岂不是更容易翻阅与记忆.如果简单的复制粘贴,不知道何时能够完成.于是便开始想着将Android的官方手册爬下来. 全篇的实现思路 分析网页 学会使用BeautifulSoup库 爬取并导出 参考资料: * 把廖雪峰的教程转换为PDF电子书 * Requests文档 * Beautiful Soup文档 配置 在Ubuntu下使用Pycharm运行成功 转PDF需要下载wkhtmltopdf 具体过程 网页分析 如下所示的一个网页,要做的
-
Python3转换html到pdf的不同解决方案
问题:python3 如何转换html到pdf 描述: 我的电脑是windows764位,python3.4 我想用python 转换html到pdf. 我尝试了html2pdf,貌似它只支持Python2 我又尝试了wkhtmltox-0.12.2.2_msvc2013-win64和pdfkit,并用下面的例子测试. import pdfkit pdfkit.from_url('http://google.com', 'out.pdf') 报错信息 Traceback (most recent
-
利用python将图片版PDF转文字版PDF
图片版PDF无法复制,转化成文字版的PDF后使用更方便. 我们需要用到python3.6,pypdf2,ghostscript,PythonMagick,百度文字识别服务和pdfkit. 安装 安装python3.6 略 安装ghostscript https://ghostscript.com/download/gsdnld.html 安装wkhtmltopdf https://wkhtmltopdf.org/downloads.html pip安装PyPDF2,ghostscript,bai
-
Python多图片合并PDF的方法
python多图片合并pdf 起因 一个做美工的朋友需要将多个图片jpg .png 合并起来,PS操作太慢了所以用了python进行完成这个任务 代码 #!/usr/bin/env python # -*- coding: utf-8 -*- # @File : 2.py # @Author: huifer # @Date : 2018/12/20 from PIL import Image import os def rea(pdf_name): file_list = os.listdir(
-
Python分割指定页数的pdf文件方法
如下所示: from PyPDF2 import PdfFileWriter, PdfFileReader # 开始页 start_page = 0 # 截止页 end_page = 5 output = PdfFileWriter() pdf_file = PdfFileReader(open("3.pdf", "rb")) pdf_pages_len = pdf_file.getNumPages() # 保存input.pdf中的1-5页到output.pdf
-
Python使用到第三方库PyMuPDF图片与pdf相互转换
使用 Python 进行图片和pdf之间的相互转换 使用到第三方库 PyMuPDF 在 python 环境下对 PDF 文件的操作. PDF 转为图片 需新建文件夹 pdf2png import fitz import glob def rightinput(desc): flag=True while(flag): instr = input(desc) try: intnum = eval(instr) if type(intnum)==int: flag = False except: p
-
使用豆瓣源来安装python中的第三方库方法
这里以安装简单的nonebot库为例子 欧克,简明扼要,拿走点赞哟: 大家想要的豆瓣源如下: 因为有几个,但在这里还是建议使用国内的豆瓣源,本人感觉好用. pip3 install nonebot -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 解释一下啊:nonebot 这个是你自己要安装的第三方库的名字,自己想要装的第三方库就这改就行了. 下面这些是对于不会安装第三方库的同学们而写,如果会的话可以忽略下面,那就
-
Python自动安装第三方库的小技巧(pip使用详解)
大家好,我是才哥. 最近周末也加班了,害- 有刚接触python的粉丝同学在运行此前<>的完整代码遇到以下问题,然后- 好吧,今天我们就专门介绍一下Python安装第三方库的一些小技巧,其中还包含自动安装的方法哈. 1. pip在线安装 在cmd命令行模式下,通过pip install 第三方库名称的形式,直接进行第三方库的安装. 我们以安装plotly为例,安装表现如下: pip install plotly 如果需要安装的第三方库已经存在,我们执行安装命令的时候会提示其存在且展示库安装的位
-
Python使用sqlite3第三方库读写SQLite数据库的方法步骤
目录 1 数据概览 2 任务定义 3 实现步骤 3.1 利用pandas读取学生信息 3.2 利用sqlite3创建数据库和学生表 3.3 利用sqlite3将学生信息存入数据库 3.4 将李四数学成绩70录入SQLite数据库 3.5 将数据库中的王五数学成绩改为85 3.5 计算学生的各科平均分,并给出总分排名 4 小小的总结 1 数据概览 学生课程成绩:studentID.name.english.chinese.math,存在一定缺失值 2 任务定义 基于学生课程成绩文件,使用panda
-
Python pip安装第三方库的攻略分享
目录 简介 常用命令 安装后缀whl文件 常用的国内镜像 简介 pip 是 Python 的包安装程序.其实,pip 就是 Python 标准库(The Python Standard Library)中的一个包,只是这个包比较特殊,用它可以来管理 Python 标准库(The Python Standard Library)中其他的包.pip 支持从 PyPI,版本控制,本地项目以及直接从分发文件进行安装.pip 是一个命令行程序.安装 pip 后,会向系统添加一个 pip 命令,该命令可以从
-
详解python实现多张多格式图片转PDF并打包成exe
目录 转PDF初始代码 转PDF最终代码 GUI界面设计代码 打包成可执行文件 完整代码 附录 转PDF初始代码 从文件夹中读取图片数据,然后将他们保存为PDF格式. 不长,大概10行代码. from PIL import Image from os import * def PictureToPDF(picture_path, name): pictures = [] picture_file = listdir(picture_path) for file in picture_file:
-
Python中使用第三方库xlrd来写入Excel文件示例
继上一篇文章使用xlrd来读Excel之后,这一篇文章就来介绍下,如何来写Excel,写Excel我们需要使用第三方库xlwt,和xlrd一样,xlrd表示read xls,xlwt表示write xls,同样目前版本只支持97-03版本的Excel.xlwt下载:xlwt 0.7.4 安装xlwt 安装方式一样是python setup.py install就可以了,或者直接解压到你的工程目录中. API介绍 获取一个xls实例 复制代码 代码如下: xls = ExcelWrite.Work
-
利用Python自带PIL库扩展图片大小给图片加文字描述的方法示例
前言 最近的一个项目中需要在图片上添加文字,使用了OpenCV,结果发现利用opencv给图像添加文字有局限.可利用的字体类型比较少,需要安装Freetype扩展,比较复杂.而且不能用putText函数输出中文,否则就会出现乱码的情况.只好选择使用Python PIL函数库对照片进行处理,利用Python自带的PIL库扩展图片大小给图片加上文字描述,大多都是库函数调用,只是给定图片宽度后计算文字所需行数的代码需要写. 代码比较丑,but it works. 代码示例 #!/usr/bin/env
-
Python pip安装第三方库实现过程解析
对于Python开发用户来讲,安装第三方库是家常便饭,下面提供两种安装方式 pycharm软件安装 1.打开file>setting 2.点击+号 查询第三方库名,点击安装即可 pip安装 打开dos窗口,输入pip install 第三方库名 即可 注意:由于国外的源下载速度有时候太慢,浪费时间.而且经常出现下载后安装出错问题.所以把PIP安装源替换成国内镜像,可以大幅提升下载速度,还可以提高安装成功率. 国内源: 清华:https://pypi.tuna.tsinghua.edu.cn/si
-
Python中使用第三方库xlrd来读取Excel示例
本篇文章介绍如何使用xlrd来读取Excel表格中的内容,xlrd是第三方库,所以在使用前我们需要安装xlrd.另外我们一般会使用xlwt来写Excel,所以下一篇文章我们会来介绍如何使用xlwt来写Excel.xlrd下载:xlrd 0.8.0 安装xlrd 安装xlrd,只需运行setup即可,另外你也可以直接解压缩到你的project中,也可以直接用 xlrd的API 获取Excel,这里称之为work book 复制代码 代码如下: open_workbook(file_name) 获取
随机推荐
- Android开发重写Animation实现下拉图片后弹射回去效果示例
- 电脑维修的基本原则和方法
- js根据日期判断星座的示例代码
- php上传excel表格并获取数据
- PHP与C#分别格式化文件大小的代码
- JavaScript评论点赞功能的实现方法
- 用JavaScript检查大写键(Caps Lock)是否打开的脚本
- 利用node.js爬取指定排名网站的JS引用库详解
- php获取网页里所有图片并存入数组的方法
- 几乎被设计师遗忘了的标签fieldset legend
- C#实现的xml操作类完整实例
- SQL Server 数据库备份和还原认识和总结(二)
- 理解MySQL——索引与优化总结
- js刷新框架子页面的七种方法代码
- 最简单使IIS支持ASPX的权限设置(不建议服务器设置)
- C#使用FileSystemWatcher控件实现的文件监控功能示例
- Lambda表达式和Java集合框架
- Java中static的特点
- C#基于XNA生成随机颜色的方法
- 隐藏你的.php文件的实现方法