判断pdf文件是否正常可用
之前在下载港交所的文件的时候会碰到有些文件异常的情况,文件下载下来,但是不能打开。查到其他的方法不是判断错误就是很麻烦。
整理出一个非常简单的方法,将文件以二进制方式打开,然后判断文件的开头是否符合pdf标准:
处理我这个情况非常好用,不一定适用于所有情况
python实现:
def is_pdf_by_path(path):
with open(path, "rb") as f:
data = f.read()
if data and data.startswith(rb"%PDF-1."):
return True
return False
if __name__ == "__main__":
print(is_pdf_by_path("/Users/jack/Desktop/1.pdf"))
其中还可以对结尾进行判断,参考链接:https://stackoverflow.com/questions/941813/how-can-i-determine-if-a-file-is-a-pdf-file
# 若果觉得有帮助,可以点个推荐,以便传播