图片文字识别工具汇集

本文主要介绍了一些简单易懂最常用的 Python 图像处理库。

https://mp.weixin.qq.com/s?__biz=MzA4MjEyNTA5Mw==&mid=2652579986&idx=1&sn=59ff864ea7017cd0235aa160c7791157&chksm=846500d8b31289ced0b29c885f4a91e03b97513b7eb8b627dab97b7b12f9a5554518454af347&scene=21#wechat_redirect

当今世界充满了各种数据,而图像是其中高的重要组成部分。然而,若想其有所应用,我们需要对这些图像进行处理。图像处理是分析和操纵数字图像的过程,旨在提高其质量或从中提取一些信息,然后将其用于某些方面。

图像处理中的常见任务包括显示图像,基本操作(如裁剪、翻转、旋转等),图像分割,分类和特征提取,图像恢复和图像识别等。Python 之成为图像处理任务的最佳选择,是因为这一科学编程语言日益普及,并且其自身免费提供许多最先进的图像处理工具。

让我们看一下用于图像处理任务的一些常用 Python 库。

# 1. scikit Image

scikit-image 是一个基于 numpy 数组的开源 Python 包。它实现了用于研究、教育和工业应用的算法和实用程序。即使是对于那些刚接触 Python 的人,它也是一个相当简单的库。此库代码质量非常高并已经过同行评审,是由一个活跃的志愿者社区编写的。

用法举例:图像过滤、模版匹配

可使用“skimage”来导入该库。大多数功能都能在子模块中找到。

import matplotlib.pyplot as plt%matplotlib inlinefrom skimage import data,filtersimage = data.coins()# ... or any other NumPy array!edges = filters.sobel(image)plt.imshow(edges, cmap='gray')

模版匹配(使用 match_template 函数)

# 2. Numpy

Numpy 是 Python 编程的核心库之一,支持数组结构。图像本质上是包含数据点像素的标准 Numpy 数组。因此,通过使用基本的 NumPy 操作——例如切片、脱敏和花式索引,可以修改图像的像素值。可以使用 skimage 加载图像并使用 matplotlib 显示。

用法举例:使用 Numpy 来对图像进行脱敏处理

import numpy as npfrom skimage import dataimport matplotlib.pyplot as plt%matplotlib inlineimage = data.camera()type(image)numpy.ndarray #Image is a numpy arraymask = image < 87image[mask]=255plt.imshow(image, cmap='gray')

# 3. Scipy

scipy 是 Python 的另一个核心科学模块,就像 Numpy 一样,可用于基本的图像处理和处理任务。值得一提的是,子模块 scipy.ndimage 提供了在 n 维 NumPy 数组上运行的函数。该软件包目前包括线性和非线性滤波、二进制形态、B 样条插值和对象测量等功能。

用法举例:使用 SciPy 的高斯滤波器对图像进行模糊处理

from scipy import misc,ndimageface = misc.face()blurred_face = ndimage.gaussian_filter(face, sigma=3)very_blurred = ndimage.gaussian_filter(face, sigma=5)#Resultsplt.imshow(<image to be displayed>)

# 4. PIL/ Pillow

PIL (Python Imaging Library) 是一个免费的 Python 编程语言库,它增加了对打开、处理和保存许多不同图像文件格式的支持。然而,它的发展停滞不前,其最后一次更新还是在 2009 年。幸运的是, PIL 有一个正处于积极开发阶段的分支 Pillow,它非常易于安装。Pillow 能在所有主要操作系统上运行并支持 Python 3。该库包含基本的图像处理功能,包括点操作、使用一组内置卷积内核进行过滤以及颜色空间转换。

用法举例:使用 ImageFilter 增强 Pillow 中的图像

from PIL import Image, ImageFilter#Read imageim = Image.open( 'image.jpg' )#Display imageim.show()from PIL import ImageEnhanceenh = ImageEnhance.Contrast(im)enh.enhance(1.8).show("30% more contrast")

# 5. OpenCV-Python

OpenCV(开源计算机视觉库,Open Source Computer Vision Library)是计算机视觉应用中使用最广泛的库之一。OpenCV-Python 是 OpenCV 的 python API。OpenCV-Python 不仅速度快(因为后台由用 C / C ++ 编写的代码组成),也易于编码和部署(由于前端的 Python 包装器)。这使其成为执行计算密集型计算机视觉程序的绝佳选择。

用法举例:使用 Pyramids 创建一个名为'Orapple'的新水果的功能

 

# 6. SimpleCV

SimpleCV 也是用于构建计算机视觉应用程序的开源框架。通过它可以访问如 OpenCV 等高性能的计算机视觉库,而无需首先了解位深度、文件格式或色彩空间等。学习难度远远小于 OpenCV,并且正如他们的标语所说,“ 它使计算机视觉变得简单 ”。支持 SimpleCV 的一些观点是:

  • 即使是初学者也可以编写简单的机器视觉测试

  • 摄像机、视频文件、图像和视频流都可以交互操作

用法举例

# 7. Mahotas

Mahotas 是另一个用于 Python 的计算机视觉和图像处理库。它包含传统的图像处理功能(如滤波和形态学操作)以及用于特征计算的更现代的计算机视觉功能(包括兴趣点检测和局部描述符)。该接口使用 Python,适用于快速开发,但算法是用 C++ 实现的,并且针对速度进行了优化。Mahotas 库运行很快,它的代码很简单,(对其它库的)依赖性也很小。建议阅读他们的官方文档以了解更多内容。

用法举例

Mahotas 库使用简单的代码来完成工作。对于“ 寻找 Wally ”的问题,Mahotas 完成的得很好,而且代码量非常小。

# 8. SimpleITK

ITK (Insight Segmentation and Registration Toolkit) 是一个开源的跨平台系统,为开发人员提供了一整套用于图像分析的软件工具。其中, SimpleITK 是一个建立在 ITK 之上的简化层,旨在促进其在快速原型设计、教育以及脚本语言中的使用。SimpleITK 是一个包含大量组件的图像分析工具包,支持一般的过滤操作、图像分割和配准。SimpleITK 本身是用 C++ 编写的,但可用于包括 Python 在内的大量编程语言。

这里有大量说明了如何使用 SimpleITK 进行教育和研究活动的 Jupyter notebook。notebook 中演示了如何使用 SimpleITK 进行使用 Python 和 R 编程语言的交互式图像分析。

用法举例

下面的动画是使用 SimpleITK 和 Python 创建的可视化的严格 CT / MR 配准过程。

# 9. pgmagick

pgmagick 是 GraphicsMagick 库基于 Python 的包装器。GraphicsMagick 图像处理系统有时被称为图像处理的瑞士军刀。它提供了强大而高效的工具和库集合,支持超过 88 种主要格式图像的读取、写入和操作,包括 DPX,GIF,JPEG,JPEG-2000,PNG,PDF,PNM 和 TIFF 等重要格式。

用法举例:缩放、边缘提取

缩放

边缘提取

# 10. Pycairo

Pycairo 是图形库 cairo 的一组 python 绑定。Cairo 是一个用于绘制矢量图形的 2D 图形库。矢量图形很有趣,因为它们在调整大小或进行变换时不会降低清晰度。Pycairo 库可以从 Python 调用 cairo 命令。

用法:Pycairo 可以绘制线条、基本形状和径向渐变

posted @ 2023-04-24 21:08  myrj  阅读(55)  评论(0编辑  收藏  举报