python-PyPDF2

python-PyPDF2作用:处理PDF文档提取文本,旋转页面,叠加页面1.pdfFileObj=open(‘meetingminutes.pdf’,’rb’)#打开pdf文档2.pdfReader=PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据3.pdfReader.numPages#获取页数4.pageObj=pdfReader.getPage(0)#获取指定页码的内…

大家好,又见面了,我是你们的朋友全栈君。

作用:处理PDF文档

提取文本,旋转页面,叠加页面

1.pdfFileObj = open(‘meetingminutes.pdf’,’rb’)#打开pdf文档

2.pdfReader = PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据

3.pdfReader.numPages#获取页数

4.pageObj = pdfReader.getPage(0)#获取指定页码的内容,从0开始

5.pageObj.extractText()#返回该页文本的字符串 注:难以做到全部提取

6.pageObj.rotateClockwise(90)#旋转页面。只能旋转90*x度

7.pageObj.mergePage(pdfReader.getPage(1))#将两页重叠

  

  

解密

1.pdfReader.isEncrypted#判断文档是否加密

2.pdfReader.decrypt(‘rosebud’)#对加密的文档进行解密

加密

1.pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象

    pdfwriter.encrypt(‘sdsd’)#加密

新建

1.无法世界添加内容,只能从其他pdf文档中拷贝过来加入

eg:

import PyPDF2

pdfFile = open(‘meetingminutes.pdf’,’rb’)#打开一个现有的文档

pdfReader = PyPDF2.PdfFileReader(pdfFile)#获取内容

pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象

for pageNum in range(pdfReader.numPages):#向PdfFileWriter对象中添加内容

    pageObj = pdfReader.getPage(pageNum)

    pdfwriter.addPage(pageObj)

pdfOutputFile = open(‘newFile.pdf’,’wb’)#新建一个pdf文档

pdfwriter.write(pdfOutputFile)#向文档中写入内容

pdfOutputFile.close()

注:所有的修改操作均无法再原文件上操作,只能将修改结果写入新文件中

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/152397.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • get请求中url传参中文乱码问题–集锦「建议收藏」

    =================================================分享一个好友的人工智能教程。零基础!通俗易懂!风趣幽默!大家可以看看是否对自己有帮助!点击查看教程================================================= 在项目中经常会遇到中文传参数,在后台接收到乱码问题。那么在遇到这种情况下我们应该怎么…

    2022年2月24日
    53
  • JAVA垃圾回收-可达性分析算法「建议收藏」

    在java中是通过引用来和对象进行关联的,也就是说如果要操作对象,必须通过引用来进行。那么很显然一个简单的办法就是通过引用计数来判断一个对象是否可以被回收。不失一般性,如果一个对象没有任何引用与之关联,则说明该对象基本不太可能在其他地方被使用到,那么这个对象就成为可被回收的对象了。这种方式成为引用计数法。这种方式的特点是实现简单,而且效率较高,但是它无法解决循环引用的问题,因此在Java中并没…

    2022年4月18日
    50
  • IIC原理超详细讲解—值得一看[通俗易懂]

    IIC原理超详细讲解—值得一看[通俗易懂]文章目录IIC简介IIC的物理层IIC的高阻态IIC物理层总结:IIC的协议层IIC总线时序图初始(空闲)状态开始信号:停止信号数据有效性应答信号IIC数据传送数据传送格式IIC发送数据IIC读数据:以AT24C02为例子软件IIC和硬件IICIIC简介    IIC(Inter-IntegratedCircuit)总线是一种由NXP…

    2022年6月14日
    68
  • python strip()方法使用

    python strip()方法使用描述pythonstrip(),用于去除述字符串头尾指定字符(默认为空格或换行符)或字符序列。注意:此方法只能去除头尾的空格或是换行符,不能去除中间的。语法:参数:chars–移除

    2022年7月5日
    23
  • hibernate二级缓存策略

    hibernate二级缓存策略ibernate二级缓存策略2008-08-0111:00相关文章:关于HibernateCache数据库对象的缓存策略Spring+Hibernate缓存不起作用推荐圈子:JBPM@net更多相关推荐很多人对二级缓存都不太了解,或者是有错误的认识,我一直想写一篇文章介绍一下hibernate的二级缓存的,今天终于忍不住了。我的经验主要来自hi

    2022年5月23日
    33
  • 概率/随机数算法

    概率/随机数算法包含主要的概率/随机数问题相关算法

    2022年7月26日
    13

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号