python包pdfkit(wkhtmltopdf) 将HTML转换为PDF的操作方法

2025-03-05 14:18:29

目录

python包-pdfkit 将HTML转换为PDF

什么是pdfkit
安装
使用

将url生成pdf文件
字符串生成pdf【pdfkit.from_string()函数】
报错OSError: No wkhtmltopdf executable found

报错

python包-pdfkit 将HTML转换为PDF

什么是pdfkit

pdfkit，把HTML+CSS格式的文件转换成PDF格式文档的一种工具。它就是html转成pdf工具包wkhtmltopdf的Python封装。所以，必须手动安装wkhtmltopdf。

安装

首先需要安装 pdfkit 库，使用 pip install pdfkit 命令就好了。
还需要安装 wkhtmltopdf 工具，本质就是利用这个工具来进行转换，pdfkit 库就是作为接口来调用该工具。
python版本 3.x，在命令行输入：

$sudo apt-get install wkhtmltopdf

工具下载地址：
wkhtmltopdf 官网：https://wkhtmltopdf.org/downloads.html

Ubuntu系统可以直接使用以下命令安装：

$sudo yum intsall wkhtmltopdf

CentOS系统可以直接使用以下命令安装：

$sudo yum intsall wkhtmltopdf

使用

将url生成pdf文件

不指定wkhtmltopdf，会从系统的默认执行路径下找 wkhtmltopdf

import pdfkit
'''将url生成pdf文件'''
def url_to_pdf(url, to_file):
    pdfkit.from_url(url, to_file,verbose=True)
url_to_pdf('http://www.baidu.com','out_3.pdf')

指定 wkhtmltopdf 的位置：

import pdfkit
'''将url生成pdf文件'''
def url_to_pdf(url, to_file):
    config = pdfkit.configuration(wkhtmltopdf='/usr/local/bin/wkhtmltopdf')
    pdfkit.from_url(url, to_file,configuration=config,verbose=True)
url_to_pdf('http://www.baidu.com','out_3.pdf')

字符串生成pdf【pdfkit.from_string()函数】

# 导入库
import pdfkit

'''将字符串生成pdf文件'''
def str_to_pdf(string, to_file):
    # 将wkhtmltopdf.exe程序绝对路径传入config对象
    path_wkthmltopdf = r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
    config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
    # 生成pdf文件，to_file为文件路径
    pdfkit.from_string(string, to_file, configuration=config)
    print('完成')
str_to_pdf('This is test!','out_3.pdf')

报错

报错OSError: No wkhtmltopdf executable found

在使用pdfkit.from_string或者pdfkit.from_file或者pdfkit.from_url将字符串、文件或者网页内容转化为pdf时，报错：

OSError: No wkhtmltopdf executable found

原因很明显，就是没找到可执行的wkhtmltopdf文件，也就是未找到wkhtmltopdf.exe文件。
python的pdfkit扩展包使用时需要基于wkhtmltopdf.exe这个可执行文件才可运行，因此需要先安装wkhtmltopdf。
对于windows系统，可以在（https://wkhtmltopdf.org/downloads.html）下载安装，然后将该程序的执行文件路径添加到环境变量中（这样即可直接用pdfkit扩展包，否则需要在使用pdfkit时，指明该程序的路径）

Ubuntu系统可以直接使用以下命令安装：

$sudo apt-get install wkhtmltopdf

CentOS系统可以直接使用以下命令安装：

$sudo yum intsall wkhtmltopdf

到此这篇关于python包pdfkit（wkhtmltopdf）将HTML转换为PDF的文章就介绍到这了,更多相关python pdfkit将HTML转换为PDF内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

赞 (0)

python 将html转换为pdf的几种方法

将 HTML 网页转换为 PDF 是很多人常见的一个需求,在浏览器上,我们可以通过浏览器的"打印"功能直接将网页打印输出为 PDF. 但是如果有多个网页就不好办了. 二进制软件网络上存在很多将 HTML 转换为 PDF 的软件和工具.比较著名的有 Carelib.wkhtmltopdf. whtmltopdf wkhtmltopdf 真是一个优秀的 HTML 转换 PDF 工具.其借助 Qt 的 WebKit 渲染引擎,将 HTML 文档渲染导出为 PDF 文档或图像. 功能十分完善
python pdfkit 中文乱码问题的解决方案

使用python pdfkit生成pdf文件中遇到中文乱码问题 1.生成的文件名不能带有中文字符 2.生成的pdf内容中文为乱码生成的文件名不能带有中文字符解决方法: 我暂时想到的处理方式是先生成英文文件名,再将这个文件重命名为中文的文件名 #coding=utf8 import os import pdfkit from uuid import uuid1 ret = '<html><head><meta charset="UTF-8"><
Python实现html转换为pdf报告(生成pdf报告)功能示例

本文实例讲述了Python实现html转换为pdf报告(生成pdf报告)功能.分享给大家供大家参考,具体如下: 1.先说下html转换为pdf:其实支持直接生成,有三个函数pdfkit.f 安装python包:pip Install pdfkit 系统安装wkhtmltopdf:参考 https://github.com/JazzCore/python-pdfkit/wiki/Installing-wkhtmltopdf mac下的wkhtmltopdf: brew install Caskro
python包pdfkit(wkhtmltopdf) 将HTML转换为PDF的操作方法

目录 python包-pdfkit 将HTML转换为PDF 什么是pdfkit 安装使用将url生成pdf文件字符串生成pdf[pdfkit.from_string()函数] 报错OSError: No wkhtmltopdf executable found 报错 python包-pdfkit 将HTML转换为PDF 什么是pdfkit pdfkit,把HTML+CSS格式的文件转换成PDF格式文档的一种工具.它就是html转成pdf工具包wkhtmltopdf的Python封装.所以,
Python实现将DOC文档转换为PDF的方法

本文实例讲述了Python实现将DOC文档转换为PDF的方法.分享给大家供大家参考.具体实现方法如下: import sys, os from win32com.client import Dispatch, constants, gencache def usage(): sys.stderr.write ("doc2pdf.py input [output]") sys.exit(2) def doc2pdf(input, output): w = Dispatch("W
python实现word 2007文档转换为pdf文件

在开发过程中,会遇到在命令行下将DOC文档(或者是其他Office文档)转换为PDF的要求.比如在项目中如果手册是DOC格式的,在项目发布时希望将其转换为PDF格式,并且保留DOC中的书签,链接等.将该过程整合到构建过程中就要求命令行下进行转换. Michael Suodenjoki展示了使用Office的COM接口进行命令行下的转换.但其导出的PDF文档没有书签.在Office 2007 SP2中,微软加入了该功能,对应的接口是ExportAsFixedFormat.该方法不仅适用于Word,
python 包中的sched 事件调度器的操作方法

目录一.延迟运行事件二.重叠事件三.事件优先级四.取消事件五.其他方法一.延迟运行事件在一个延迟或规定时间之后执行事件,需要采用enter()方法,参数如下: 间隔时间 ( 具体值决定与delayfunc,这里为秒 ) 优先级 ( 两个事件在同一时间到达时,先执行哪一个 ) 调用的函数函数参数 import sched import time # 生成调度器 scheduler = sched.scheduler(time.time, time.sleep) def print_
批量将ppt转换为pdf的Python代码只要27行!

这是一个Python脚本,能够批量地将微软Powerpoint文件(.ppt或者.pptx)转换为pdf格式. 使用说明 1.将这个脚本跟PPT文件放置在同一个文件夹下. 2.运行这个脚本. 全部代码 import comtypes.client import os def init_powerpoint(): powerpoint = comtypes.client.CreateObject("Powerpoint.Application") powerpoint.Visible =
python批量实现Word文件转换为PDF文件

本文为大家分享了python批量转换Word文件为PDF文件的具体方法,供大家参考,具体内容如下 1.目的通过万能的Python把一个目录下的所有Word文件转换为PDF文件. 2.遍历目录作者总结了三种遍历目录的方法,分别如下. 2.1.调用glob 遍历指定目录下的所有文件和文件夹,不递归遍历,需要手动完成递归遍历功能. import glob as gb path = gb.glob('d:\\2\\*') for path in path: print path 2.2.调用os.w
python爬取网页转换为PDF文件

爬虫的起因官方文档或手册虽然可以查阅,但是如果变成纸质版的岂不是更容易翻阅与记忆.如果简单的复制粘贴,不知道何时能够完成.于是便开始想着将Android的官方手册爬下来. 全篇的实现思路分析网页学会使用BeautifulSoup库爬取并导出参考资料: * 把廖雪峰的教程转换为PDF电子书 * Requests文档 * Beautiful Soup文档配置在Ubuntu下使用Pycharm运行成功转PDF需要下载wkhtmltopdf 具体过程网页分析如下所示的一个网页,要做的
python爬取网页内容转换为PDF文件

本文实例为大家分享了python爬取网页内容转换为PDF的具体代码,供大家参考,具体内容如下将廖雪峰的学习教程转换成PDF文件,代码只适合该网站,如果需要其他网站的教程,可靠需要进行稍微的修改. # coding=utf-8 import os import re import time import pdfkit import requests from bs4 import BeautifulSoup from PyPDF2 import PdfFileMerger import sys