使用Python将多个pdf指定页整合到一个pdf文件中

在工作的一些场景中,有时需要我们将多个pdf文件中的内容提取出来,比如有10个pdf文件,我们要统一打印pdf文件的第一页或者最后一页…

需求分析

我们需要批量提取PDF文件中的任意一页,可以是第一页也可以是中间某一页,也可以是最后一页。安装我们操作数组的逻辑,当我们输入整数的时候页面从前开始算,输入负数时页面从后开始算。

如果要提取的某一页不存在,则跳过改文件操作,提取下一个文件。

代码实现

这个需求需要使用操作PDF神器PyPDF2库,首先安装该管理包

pip install PyPDF2

然后验证该管理包是否安装成功,可以再Python环境文件中import改库,如果没有保持这标识已经安装成功,你可以在项目中使用该库。


# 如果没有报错,表示成功导入 PyPDF2
import PyPDF2

这里主要使用PdfReaderPdfWriter这两个读写Api;

为了方便操作,这里集中将pdf文档都放到一个名为pdf的文件夹中,脚本程序去该文件夹中读取要操作的文件;

另外为了动态读取页面,将要获取的页码写在一个名为config.txt的文件中

具体代码实现

from PyPDF2 import PdfReader, PdfWriter
import glob
 
def split_combine(path, pdf_writer):
    pdf = PdfReader(path)
    print(len

你可能感兴趣的:(python,python,pdf)