技术背景
有时候扫描文件的时候,不小心会得到多个pdf文件,常规的pdf阅读器,经常把文档合并作为一个高级付费功能。但其实通过Python的pypdf库,可以直接实现多个pdf文件的合并。
实现方案
首先需要通过pip安装pypdf:- $ python3 -m pip install pypdf
复制代码 安装完成后,可以写一个py脚本,也可以像我这样直接用IPython来完成相应文件的合并(例如本地有1.pdf和2.pdf两个文件):- In [1]: from pypdf import PdfWriter
- In [2]: merger = PdfWriter()
- In [3]: pdf_files = ["/home/Data/1.pdf", "/home/Data/2.pdf"]
- In [4]: for pdf in pdf_files:
- ...: merger.append(pdf)
- ...:
- In [5]: merger.write("/home/Data/12.pdf")
- Out[5]: (True, <_io.FileIO [closed]>)
- In [6]: merger.close()
- In [7]: exit()
复制代码 完成合并后,在相应路径下会生成一个12.pdf的最终文件,这样就完成pdf文件合并了。
总结概要
本文介绍了一个使用python进行免费pdf文档合并的实现方案。使用该方案,还可以针对同一个路径下的多个文件进行合并操作,还可以利用Python的正则表达式对文件名进行筛选。综合来说,该工具对于熟练使用Python的人来说,是一大办公福音。
版权声明
本文首发链接为:https://www.cnblogs.com/dechinphy/p/pypdf.html
作者ID:DechinPhy
更多原著文章:https://www.cnblogs.com/dechinphy/
请博主喝咖啡:https://www.cnblogs.com/dechinphy/gallery/image/379634.html
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |