验证码识别之图像切割算法(一)

原来验证码:

切割前:      切割后:            

切割前:      切割后:            

切割前:      切割后:           

切割前:      切割后:          

切割前:      切割后:          

 

直接上代码:

#-*-coding:utf-8-*-
from PIL import Image,ImageFilter
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import matplotlib.cm as cm
img=Image.open("5.png")
im=img.convert("L")

a = np.array(im)
pd.DataFrame(a.sum(axis=0)).plot.line() # 画出每列的像素累计值
plt.imshow(a,cmap='gray') # 画出图像


# 核心代码,注意调整要切割的线 split_lines = [5,16,35,48,66] vlines = [plt.axvline(i, color='r') for i in split_lines] # 画出分割线 plt.show() ''' #################核心代码########################## ''' #设置获取图像的高和宽,根据需要调整 y_min=1 y_max=23 ims=[] c=1 for x_min,x_max in zip(split_lines[:-1],split_lines[1:]): im.crop([x_min,y_min,x_max,y_max] ).save(str(c)+'.jpeg') # crop()函数是截取指定图像! # save保存图像! c=c+1 for i in range(1,5): file_name="{}.jpeg".format(i) plt.subplot(8,3,i) im=Image.open(file_name).convert("1") #im=img.filter(ImageFilter.MedianFilter(size=3)) plt.imshow(im) # 显示截取的图像! plt.show()

 

说明:

本切割算法适合验证码中的字母位置基本固定在一定的范围内,有比较好的切割效果

 

posted @ 2018-07-07 16:52  淋哥  阅读(4783)  评论(0编辑  收藏  举报