随笔分类 - 图像处理
摘要:中文检测的数据集,目前最火的应该是清华的CTW,https://ctwdataset.github.io/ 但是它的数据集只存储在微云和google driver,微云空间受限不能完全保存,所以下载的时候很蛋疼。我这边就挑了一个相对较小的数据集——MSRA TD5000,这个数据集支持中英文的倾斜文
阅读全文
摘要:本节课主要讲述了cs231n课程的背景和计算机视觉的历史,也主要介绍了目前很重要的一个计算机视觉数据集——IMAGENET。 更多内容参考 "我的AI学习之路" 课程简介 这门课程是由stanford大学计算机视觉李飞飞以及她的学生制作的,也叫做CS231n,是偏专业性的深度学习+计算机视觉课程。
阅读全文
摘要:OCR的全称是Optical Character Recoginition,光学字符识别技术。目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别、交通路牌的识别、车牌的自动识别等等。本篇就先讲一下基于开源软件和大厂服务的文字识别效果,后续会陆续讲解一下机器学习和深度学习实现的方案和
阅读全文
摘要:python基础 图像基础 图像的主要用途:分类、目标检测、图像分割、图像描述、图像生成 相关的组件:OpenCV、Tensorflow、Keras 图像的预处理:平滑与去噪——高斯滤波、中值滤波、曲率驱动滤波 图像的预处理:图像锐化 图像的预处理:边缘检测算子——Sobel、canny、拉普拉斯
阅读全文