OpenCV+python文字识别
# Author:Winter Liu is coming!
import cv2 as cv
import numpy as np
import pytesseract
# 预处理,高斯滤波(用处不大),4次开操作
# 过滤轮廓唯一
def contour_demo(img):
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
gray = cv.GaussianBlur(gray, (5, 5), 1)
ref, thresh = cv.threshold(gray, 127, 255, cv.THRESH_BINARY)
kernel = np.ones((9, 9), np.uint8)
thresh = cv.morphologyEx(thresh, cv.MORPH_OPEN, kernel, iterations=4)
contours, hierachy = cv.findContours(thresh, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE)
print(len(contours))
return contours
def capture(img):
contours = contour_demo(img)
# 轮廓唯一,以后可以扩展
contour = contours[0]
# 求周长,可在后面的转换中使用周长和比例
print(cv.arcLength(contour,True))
img_copy = img.copy()
# 使用approxPolyDP,将轮廓转换为直线,22为精度(越高越低),TRUE为闭合
approx = cv.approxPolyDP(contour, 22, True)
# print(approx.shape)
# print(approx)
# cv.drawContours(img_copy, [approx], -1, (255, 0, 0), 15)
n = []
# 生产四个角的坐标点
for x, y in zip(approx[:, 0, 0], approx[:, 0, 1]):
n.append((x, y))
p1 = np.array(n, dtype=np.float32)
# 对应点
p2 = np.array([(0, 0), (0, 1500), (1000, 1500), (1000, 0)], dtype=np.float32)
M = cv.getPerspectiveTransform(p1, p2) # 变换矩阵
# 使用透视变换
result = cv.warpPerspective(img_copy, M, (0, 0))
# 重新截取
result = result[:1501, :1001]
cv.imwrite(r"C:\PycharmProjects\OpenCV\pic\ocr.png", result)
return result
# 图像识别代码,需要预先下载安装开源工具包 pytesseract,配置环境变量
# pip install pytesseract
# 修改“C:\Python\Python37\Lib\site-packages\pytesseract\pytesseract.py”中“cmd”为绝对路径
def ocr_img(img):
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 图像清晰度越高结果越精确,时间更长
text = pytesseract.image_to_string(gray)
print(text)
src = cv.imread(r"C:\PycharmProjects\OpenCV\pic\page.jpg")
res = capture(src)
ocr_img(res)
cv.waitKey(0)
cv.destroyAllWindows()
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律