PyPDF2详解

PyPDF2详解工作中可能会涉及处理pdf文件,PyPDF2就是这样一个库,使用它可以轻松的处理pdf文件,它提供了读、写、分割、合并、文件转换等多种操作。官方地址:http://mstamy2.github.io/PyPDF2/安装1.RPM式系统(Redhat、CentOS)1pipinstallpypdf22.DEB式系统(Deb…

大家好,又见面了,我是你们的朋友全栈君。

工作中可能会涉及处理pdf文件,PyPDF2就是这样一个库, 使用它可以轻松的处理pdf文件,它提供了读、写、分割、合并、文件转换等多种操作。官方地址:http://mstamy2.github.io/PyPDF2/

安装

1. RPM式系统(Redhat、CentOS)

1
pip 
install 
pypdf2

2. DEB式系统(Debian、Ubuntu)以下任一

1
2
pip 
install 
pypdf2
apt 
install 
python-pypdf2

3. Windows

1
pip 
install 
pypdf2

使用

PyPDF2 包含了 PdfFileReader PdfFileMerger PageObject PdfFileWriter 四个常用的主要 Class。

简单读写

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from 
PyPDF2 
import 
PdfFileReader, PdfFileWriter
readFile 
= 
'read.pdf'
writeFile 
= 
'write.pdf'
# 获取一个 PdfFileReader 对象
pdfReader 
= 
PdfFileReader(
open
(readFile, 
'rb'
))
# 获取 PDF 的页数
pageCount 
= 
pdfReader.getNumPages()
print
(pageCount)
# 返回一个 PageObject
page 
= 
pdfReader.getPage(i)
# 获取一个 PdfFileWriter 对象
pdfWriter 
= 
PdfFileWriter()
# 将一个 PageObject 加入到 PdfFileWriter 中
pdfWriter.addPage(page)
# 输出到文件中
pdfWriter.write(
open
(writeFile, 
'wb'
))

 

合并分割 PDF

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
from 
PyPDF2 
import 
PdfFileReader, PdfFileWriter
def 
split_pdf(infn, outfn):
    
pdf_output 
= 
PdfFileWriter()
    
pdf_input 
= 
PdfFileReader(
open
(infn, 
'rb'
))
    
# 获取 pdf 共用多少页
    
page_count 
= 
pdf_input.getNumPages()
    
print
(page_count)
    
# 将 pdf 第五页之后的页面,输出到一个新的文件
    
for 

in 
range
(
5
, page_count):
        
pdf_output.addPage(pdf_input.getPage(i))
    
pdf_output.write(
open
(outfn, 
'wb'
))
def 
merge_pdf(infnList, outfn):
    
pdf_output 
= 
PdfFileWriter()
    
for 
infn 
in 
infnList:
        
pdf_input 
= 
PdfFileReader(
open
(infn, 
'rb'
))
        
# 获取 pdf 共用多少页
        
page_count 
= 
pdf_input.getNumPages()
        
print
(page_count)
        
for 

in 
range
(page_count):
            
pdf_output.addPage(pdf_input.getPage(i))
    
pdf_output.write(
open
(outfn, 
'wb'
))
if 
__name__ 
=
= 
'__main__'
:
    
infn 
= 
'infn.pdf'
    
outfn 
= 
'outfn.pdf'
    
split_pdf(infn, outfn)

其他命令

如果是要修改一个已有的 pdf 文件,可以将 reader 的页面添加到 writer 中:

pdfWriter.appendPagesFromReader(reader)

添加书签:

pdfWriter.addBookmark(title, pagenum, parent=parent)

转载于:https://www.cnblogs.com/pyxiaomangshe/p/7918839.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/152385.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • [转]sprintf函数用法详解

    [转]sprintf函数用法详解sprintf()格式化输出函数(图形)功能: 函数sprintf()用来作格式化的输出。用法: 此函数调用方式为intsprintf(char*string,char*format,arg_list);说明: 函数sprintf()的用法和printf()函数一样,只是sprintf()函数给出第一个参数string(一般为字符数组),然后再调用outtextxy()函数

    2022年6月23日
    31
  • 手机兼容性测试_浏览器兼容性测试工具

    手机兼容性测试_浏览器兼容性测试工具AndroidApp兼容性测试,是一个比较重要的App评价内容说到测试阶段,兼容性测试主要是对App在各类机型上的兼容、适配等情况进行测试。搞清楚这一阶段的测试重点后,因此,AndroidApp在进行兼容性测试前,一定要做好其前序测试内容,否则兼容性测试效果将会较差。1.机型配置问题Android兼容测试一定要做到宽范围覆盖,如果做不到这个,那么就违背了兼容性测试的目标——测试App在各类机型、系统上的运行是否兼容、适配。因此,兼容性测试必须要在各个机型、系统上对App进行运行、测.

    2025年7月23日
    4
  • Elastic Job 入门详解

    Elastic Job 入门详解Elastic job是当当网架构师张亮,曹昊和江树建基于Zookepper、Quartz开发并开源的一个Java分布式定时任务,解决了Quartz不支持分布式的弊端。Elastic job主要的功能有支持弹性扩容,通过Zookepper集中管理和监控job,支持失效转移等,这些都是Quartz等其他定时任务无法比拟的。

    2022年6月17日
    34
  • vue解决跨域_java跨域解决方案

    vue解决跨域_java跨域解决方案现阶段跨域方式有很多种,但是基本思想只有两种:绕过同源策略:历史遗留的产物,虽然思想很好,但是局限性太大(仅支持、因为数据是在中,所以携带数据小)。:通过反向代理绕过去,这是很完美的解决方案,加上会给服务器增加一点压力,不过这点压力问题并不大[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ddoEgRFd-1656482203293)(https://juejin.cn/)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4M4avsX0-1

    2022年9月30日
    4
  • XLSTransformer导出多sheet页

    XLSTransformer导出多sheet页https://blog.csdn.net/z69183787/article/details/51407171?utm_source=app&app_version=4.17.0&code=app_1562916241&uLinkId=usr1mkqgl919blen

    2022年7月24日
    8
  • windows10系统下vue开发环境搭建

    windows10系统下vue开发环境搭建安装NodeJs下载地址:http://nodejs.cn/download/到官网下载自己系统对应的版本,按照推荐的方式默认安装,这里不再赘述。安装完成后,打卡powershell,执行命令node-v查询一下,检查是否正常安装。如果提示找不到node命令,添加node安装路径到系统环境变量,重启powershell,再试。如果你安装的是旧版本的npm,可以很容易得通过npm命令来升级。sudonpminstallnpm-g#linuxnpminstallnpm-g

    2022年10月20日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号