1.计算机视觉概述
计算机视觉概述
课程学习方法
在开始学习之前,首先说明,这是我尝试自学计算机视觉课程的产物,在我看来,这是费曼学习法的一部分,你可以认为这是学习笔记,或者教程。
计算机技术的发展让我们不但能获取更多信息,而且获取的门槛日益降低,这个自学系列,我将完全依靠计算机和互联网进行,包括但不限于以下的方法:
- 从网络上搜集书籍
- 查阅各类博客、文章
- 观看各个视频网站、慕课网站上的视频教程
- 使用 ChatGPT 作为私人助教
学习过程中可能设计到许多杂乱的资料,我将尽可能把所有参考过的资料列出,方便查找和索引。
什么是计算机视觉
学习任何东西之前,我们首先问:“这是什么?”
下面是 ChatGPT 的回答:
计算机视觉是一种利用计算机和数学算法来模拟和自动处理人类视觉的科学和技术。其主要研究如何通过计算机精确地获取、处理、分析和理解图像和视频数据。计算机视觉使用各种摄像头、图像传感器以及其他数字设备来捕捉实时或静态的图像或视频,然后通过图像分析、分类、识别、跟踪等技术提取有用的信息。
计算机视觉技术被广泛应用于医疗、安防、自动驾驶、智能监控、人机交互、游戏等领域。比如在医疗方面,计算机视觉技术可以帮助医生快速、准确地诊断并治疗疾病;在安防领域,计算机视觉技术可以保护个人和财产的安全;在自动驾驶方面,计算机视觉技术可以帮助汽车感知周围环境并做出相应的决策和操作等等。
总之,计算机视觉是一门具有广泛应用前景的交叉学科,其研究成果不仅可以实现许多社会需求,也可以推动物联网、人工智能等领域的发展。
我们归结如下:
- 计算机视觉的目的是:通过计算机获取、处理、分析和理解图像和视频数据
- 计算机视觉实现的方法:利用计算机和数学算法
- 计算机视觉的技术:图像分析、分类、识别、跟踪
- 计算机视觉的应用领域:医疗、安防、自动驾驶、智能监控、人机交互、游戏等
计算机视觉发展历程
ChatGPT:
计算机视觉是人工智能领域中一个重要的分支,其发展历程大致可以分为以下几个阶段:
1.早期阶段(20世纪60年代-80年代初)
在这个时期,研究者主要关注图像处理、模式识别等方面,并尝试将这些技术应用于计算机视觉领域。其中比较有代表性的成果是1966年提出的Hough变换和1973年开发的Canny边缘检测算法。2.传统计算机视觉阶段(80年代末-21世纪初)
20世纪80年代末至90年代初期,随着计算机硬件和软件技术的发展,计算机视觉开始进入传统视觉处理阶段。在此期间,研究者们主要探讨了基于几何学、匹配算法等传统方法,可实现如目标检测、跟踪、图像分割等任务。3.深度学习计算机视觉阶段(21世纪初至今)
自2000年代初深度学习技术得到广泛应用以来,计算机视觉也迎来了新的发展阶段。通过卷积神经网络(CNN)、循环神经网络(RNN)、语义分割等技术的发展,计算机视觉开始实现更加复杂的任务,例如物体识别、图像描述、人脸识别以及自动驾驶等。总而言之,计算机视觉的发展经历了多个阶段,从早期的图像处理到传统计算机视觉再到深度学习计算机视觉。这些阶段中涌现出了许多优秀的算法和模型,为我们提供了更便捷高效的图像处理解决方案。
所以,计算机视觉从发展历程来看,分为:图像处理、传统计算机视觉、深度学习计算机视觉,我们学习的过程也将遵循发展历程,但是我们的重点是学习深度学习计算机视觉。