【PDF转图片】如何将PDF转换成图片格式--Python

可能会有人问,很多PDF阅读软件都是可以直接将PDF文件保存成图片格式的,为什么非得用Python??

使用Python(代码)的优势就在于可以批量操作,试想,如果你有成百上千的PDF文件,你很有可能要一个一个的打开,然后用鼠标一步一步点另存为图片。而用Python,只用几行代码,就可以批量完成任务。

此外,刚刚遇到了另一种应用情景:

本人通过R软件生成了一个PDF文件,但是这个文件很大,200M+,使用电脑各种PDF阅读器无法打开,尝试使用Photoshop,等了很久之后依然没能打开。这种情况下,考虑使用代码将PDF转换成图片,因为使用代码不用打开文件,只需要对二进制数的处理,降低了对电脑配置的要求。

使用Python3的pdf2image模块:

1、安装前配置需求:

pip3和poppler

2、安装pdf3image:

pip3 install pdf2image

3、使用代码:

from pdf2image import convert_from_path

im = convert_from_path('./example.pdf')

im是一个list,每一页PDF都转化成了一个PIL图片对象

4、将PIL对象保存成图片

im[0].save("tt.png") #将第一页PDF保存成tt.png

原本一个无法通过PDF阅读器打开的PDF文件,在一两分钟内就保存成了一个可读的图片文件!