cs231n学习笔记（一）计算机视觉及其发展史

在网易云课堂上学习计算机视觉经典课程cs231n，觉得有必要做个笔记，因为自己的记性比较差，留待以后查看。

每一堂课都对应一个学习笔记，下面就开始第一堂课。

这堂课主要是回顾了计算机视觉的起源及其后来的发展，有助于学者理清计算机视觉的研究主题和发展脉络。

首先介绍了计算机视觉的相关领域，因为它不仅仅关乎计算机科学，还涉及生物，物理，工程等等学科，是一门综合性很强的学科。

接着从物种大爆炸讲起

推测生物有了视觉后极大地扩张了活动区域，带来了生物的蓬勃发展。

接着讲计算机视觉在近现代的发展，这里省略，直接跳到近些年有重要意义的学术成果。

2001年Viola&Jones推出人脸识别算法haar检测器

1999年David Lowe推出sift特征算法

2005年和2009年分别出现HOG特征算法和DPM算法

除了算法上的改进，数据规模的增大也是推动计算机视觉发展的主因，甚至到了深度学习时代，是各种数据集推动着算法的演化。

以下分别是PASCAL VOC和ImageNet，PASCAL 包含20类物体，而ImageNet则有惊人的22000类物体，图片数量达到1千4百万张。

那么计算机视觉究竟要解决哪些问题，比较重要的几个问题包括图像分类，

目标识别，图像描述，图像分割，场景理解等，其中，场景理解可以说是终极目标，

自然也是最具挑战性的问题。

回到这门课本身，CNN对于计算机视觉有何帮助，可以说进入人工智能时代，CNN就是解决计算机视觉的全部。不过CNN的出现可是有些年头了，早在1998年，Lecun就成功地利用CNN来识别邮政数字了，不过直到2012年Alexnet的出现引发了这一潮流。下面左图就是二者的网络结构，可以看出并没有大的改变，所以不得不归功于今时今日计算机的性能和数据集的出现。右图是在ImageNet数据集上的历年冠军，从2012年往后，基本就是CNN的天下了。

最后是一些基本要求吧，python，线性代数，微积分，还有CS229（机器学习）的基本知识，都要掌握。

posted @ 2018-07-27 16:16 wuzeyuan 阅读(755) 评论(0) 编辑收藏举报

刷新页面返回顶部

wuzeyuan

cs231n学习笔记（一）计算机视觉及其发展史

公告