18实例介绍之手写识别

图像识别

  • 图像识别(Image Recognition)是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。
  • 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。机器学习领域一般将此类识别问题转化为分类问题。



手写识别

  • 手写识别是常见的图像识别任务。计算机通过手写体图片来识别出图片中的字,与印刷字体不同的是,不同人的手写体风格迥异,大小不一,造成了计算机对手写识别任务的一些困难。
  • 数字手写体识别由于其有限的类别(0~9共10个数字)成为了相对简单的手写识别任务。DBRHDMNIST是常用的两个数字手写识别数据集

MNIST数据集

MNIST的下载链接:http://yann.lecun.com/exdb/mnist/

MNIST是一个包含数字0~9的手写体图片数据集,图片已归一化为以手写数字为中心的28*28规格的图片。MNIST由训练集与测试集两个

部分组成,各部分规模如下:

  • 训练集:60,000个手写体图片及对应标签
  • 测试集:10,000个手写体图片及对应标签

MNIST数据集的手写数字样例:

  • MNIST数据集中的每一个图片由28*28个像素点组成。
  • 每个像素点的值区间为0-255,0表示白色,255表示黑色。

image


DBRHD数据集

DBRHD (Pen-Based Recognition of HandwrittenDigits Data Set)是UCI的机器学习中心提供的数字手写体数据库:

https://archive.ics.uci.edu/ml/datasets/Pen-Based+Recognition+of+Handwritten+Digits

DBRHD数据集包含大量的数字09的手写体图片,这些图片来源于44位不同的人的手写数字,图片已归一化为以手写数字为中心的32*32规格的图片。DBRHD的训练集与测试集组成如下:

  • 训练集:7494个手写体图片及对应标签,来源于40位手写者。
  • 测试集:3498个手写体图片及对应标签,来源于14位手写者。

DBRHD数据集特点:

  • 去掉了图片颜色等复杂因素,将手写体数字图片转化为训练数据为大小32*32的文本矩阵。
  • 空白区域使用0代表,字迹区域使用1表示。

image



“手写识别”实例

已有许多模型在MNIST或DBRHD数据集上进行了实验,有些模型对数据集进行了偏斜矫正,甚至在数据集上进行了人为的扭曲、偏移、缩放及失真等操作以获取更加多样性的样本,使得模型更具有泛化性。

常用于数字手写体的分类器:

  • 线性分类器

  • K最近邻分类器

  • 非线性分类器

  • SVM

  • MLP多层感知器

  • 卷积神经网络



后续任务

利用全连接的神经网络实现手写识别的任务。

个人对于手写识别还是很感兴趣的,虽然这只是最简单的数字识别,一定好好学!

今天平板修好了,终于可以开始画画了,过两天去贴个膜。

posted @   奶酥  阅读(1344)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示