浅谈Python处理PDF的方法
处理pdf文档
第一、
从文本中提取文本
第二、
创建PDF
两种方法
#使用PdfFileWriter import PyPDF2 pdfFiles = [] for filename in os.listdir('.'): if filename.endswith('.pdf'): pdfFiles.append(filename) print(pdfFiles) pdfWriter = PyPDF2.PdfFileWriter() pdfFileObj = open(pdfFiles[0],'rb') pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象 first,end =map(int,input('从多少页到多少页(用空格隔开):').split()) for pageNum in range(first-1,end): pageObj = pdfReader.getPage(pageNum) pdfWriter.addPage(pageObj) pdfOutput = open ('split_pdf.pdf','wb') pdfWriter.write(pdfOutput) pdfOutput.close()
#使用PdfFileMerger() import PyPDF2 merger = PyPDF2.PdfFileMerger() a = [str(i)+'webbook.pdf'for i in range(0,124)] for i in a: print(i) merger.append(open(i,'rb')) print("合并完成第"+str(i)) with open('combintion.pdf','wb') as f: merger.write(f)
总结
以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!
相关推荐
-
Python处理PDF及生成多层PDF实例代码
Python提供了众多的PDF支持库,本文是在Python3环境下,试用了两个库来完成PDF的生成的功能.PyPDF对于读取PDF支持较好,但是没找到生成多层PDF的方法.Reportlab看起来更成熟,能够利用Canvas很方便的生成多层PDF,这样就能够实现图片扫描上来的内容也可以进行内容搜索的目标. Reportlab 生成双层PDF 双层PDF应用PDF中的Canvas概念,先画文字,最后将图片画上去,这样就是两层的PDF. import os # import urllib2 impo
-
浅谈Python处理PDF的方法
处理pdf文档 第一. 从文本中提取文本 第二. 创建PDF 两种方法 #使用PdfFileWriter import PyPDF2 pdfFiles = [] for filename in os.listdir('.'): if filename.endswith('.pdf'): pdfFiles.append(filename) print(pdfFiles) pdfWriter = PyPDF2.PdfFileWriter() pdfFileObj = open(pdfFiles[0]
-
浅谈Python类的__getitem__和__setitem__特殊方法
一个有点绕的例子,用PyScripter调试器步进跟踪可以看清楚对 象结构的具体细节. 对原作改变了一下,在未定义子对象属性时__getitem__中使用现成的__setitem__来定义. ## encoding:utf-8 """ 这个类继承了object, object是Python的最小单元,可以在Python的">>>"控制台用dir(objct)或者dir (__builtins__.object)命令查看它的属性,可以看到_
-
浅谈python字符串方法的简单使用
学习python字符串方法的使用,对书中列举的每种方法都做一个试用,将结果记录,方便以后查询. (1) s.capitalize() ;功能:返回字符串的的副本,并将首字母大写.使用如下: >>> s = 'wwwwww' >>> scap = s.capitalize() >>> scap 'Wwwwww' (2)s.center(width,char); 功能:返回将s字符串放在中间的一个长度为width的字符串,默认其他部分用空格填充,否则使用c
-
浅谈python socket函数中,send与sendall的区别与使用方法
在python socket编程中,有两个发送TCP的函数,send()与sendall(),区别如下: socket.send(string[, flags]) 发送TCP数据,返回发送的字节大小.这个字节长度可能少于实际要发送的数据的长度.换句话说,这个函数执行一次,并不一定能发送完给定的数据,可能需要重复多次才能发送完成. 例子: data = "something you want to send" while True: len = s.send(data[len:]) if
-
浅谈Python类里的__init__方法函数,Python类的构造函数
如果某类里没有__init__方法函数,通过类名字创建的实例对象为空,切没有初始化:如果有此方法函数,通常作为类的第一个方法函数,有点像C++等语言里的构造函数. class Ca: def __init__(self, v): # 注意前后各两个下划线 self.name = v def pr(self): print "a--->", self.name ia = Ca("Jeapedu") # 本质调用的是__init__方法函数 ia.pr() Ca.
-
浅谈python类属性的访问、设置和删除方法
类属性和对象属性 我们把定义在类中的属性称为类属性,该类的所有对象共享类属性,类属性具有继承性,可以为类动态地添加类属性. 对象在创建完成后还可以为它添加额外的属性,我们把这部分属性称为对象属性,对象属性仅属于该对象,不具有继承性. 类属性和对象属性都会被包含在dir()中,而vars()是仅包含对象属性.vars()跟__dict__是等同的. 类属性和对象属性可类比于Java中的static成员和非static成员,只不python中的类属性和对象属性都是可以动态添加(和删除)的. clas
-
浅谈Python实现2种文件复制的方法
本文实例主要实现Python中的文件复制操作,有两种方法,具体实现代码如下所示: #coding:utf-8 # 方法1:使用read()和write()模拟实现文件拷贝 # 创建文件hello.txt src = file("hello.txt", "w") li = ["Hello world \n", "Hello China \n"] src.writelines(li) src.close() #把hello.txt
-
浅谈python在提示符下使用open打开文件失败的原因及解决方法
题目:在提示符下使用open打开一个文件 刚开始网上看了下打开的方式,结果一直实现不了,报错是没找到这个文件,而且和我输入的文件名不一样. 错误如下: >>>open('d:\456.txt') Traceback (most recent call last): File "<pyshell#0>", line 1, in <module> open('d:\456.txt') IOError: [Errno 2] No such file
-
浅谈python中真正关闭socket的方法
close方法可以释放一个连接的资源,但是不是立即释放,如果想立即释放,那么在close之前使用shutdown方法 shut_rd() -------关闭接受消息通道 shut_wr()--------关闭发送消息通道 shut_rdwr()-------连个通道都关闭 使用:在close()之前加上shutdown(num)即可 [shut_rd(), shut_wr(), shut_rdwr()分别代表num 为0 1 2 ] (但是测试过close()关闭,发现如果关闭后,那么ac
-
浅谈Python中函数的定义及其调用方法
一.函数的定义及其应用 所谓函数,就是把具有独立功能的代码块组织成为一个小模块,在需要的时候调用函数的使用包含两个步骤 1.定义函数–封装独立的功能 2.调用函数–享受封装的成果 函数的作用:在开发时,使用函数可以提高编写的效率以及代码的重用'' 函数: 函数是带名字的代码块,用于完成具体的工作 需要在程序中多次执行同一项任务时,你无需反复编写完成该任务的代码,而只需调用该任务的函数,让python运行其中的代码,你将发现,通过使用函数,程序编写,阅读,测试和修复都将更容易 1.定义函数 def
随机推荐
- 浅谈XML Schema中的elementFormDefault属性
- go语言睡眠排序算法实例分析
- oracle11g 最终版本11.2.0.4安装详细过程介绍
- java新特性之for循环最全的用法总结
- JavaWeb中上传和下载文件实例代码
- python操作MySQL数据库的方法分享
- python中利用Future对象回调别的函数示例代码
- qpython3 读取安卓lastpass Cookies
- js判断浏览器类型为ie6时不执行
- ASP.NET将Session保存到数据库中的方法
- asp.net开发微信公众平台之验证消息的真实性
- Python函数中定义参数的四种方式
- Android Animation实战之屏幕底部弹出PopupWindow
- MvcPager分页控件 适用于Bootstrap
- linux下2个检查tcp连接的命令
- MySQL优化之分区表
- 全国省市区县最全最新数据表(数据来源谷歌)
- 用JavaScript修改CSS属性的代码
- 服务器 C盘 安全加强批处理(去除一些特殊软件的权限)
- SpringBoot+Websocket实现一个简单的网页聊天功能代码