CV1——学习笔记

计算机视觉(computer vision)是从图像和视频中提出数值或符号信息的计算系统，更形象一点说，计算机视觉是让计算机具备像人类一样的眼睛，看到图像，并理解图像。

计算机视觉三大应用：识别、检测、分割。

目标跟踪、视频分割、风格迁移、生成对抗网络（GAN）直播换脸、视频生成（LSTM预测未来信息）。

大部分计算机视觉，都靠深度学习了。

深度学习历史：

06-Hinton，神经网络反向传播训练。

12-提取特征用深度卷积。

RNN-序列图像处理。

LSTM-也是利用序列信息。

图像识别：

Alexnet, VGGnet, GoogleNet, ResNet, RetinaNet

目标检测：

Fast-rcnn, faster-rcnn, Yolo, Retina-Net

图像分割：

FCN，Mask-Rcnn

目标跟踪：

GOTURN， ECO

图像生成：

GAN，WGAN

光流：

FlowNet

视频分割：

Segnet

计算机视觉历史回顾，从浅层学习到深度学习 - 计算机视觉基础入门课程（从算法到实战应用） - AI研习社 - 研习AI产学研新知，助力AI学术开发者成长。 http://www.mooc.ai/course/353/learn?lessonid=2270&groupId=46#lesson/2270

posted @ 2019-08-16 17:34 ostartech 阅读(421) 评论(0) 编辑收藏举报

刷新页面返回顶部

Good Good Study~