CV1——学习笔记

计算机视觉(computer vision)是从图像和视频中提出数值或符号信息的计算系统,更形象一点说,计算机视觉是让计算机具备像人类一样的眼睛,看到图像,并理解图像。

计算机视觉三大应用:识别、检测、分割。

目标跟踪、视频分割、风格迁移、生成对抗网络(GAN)直播换脸、视频生成(LSTM预测未来信息)。

 大部分计算机视觉,都靠深度学习了。

 

深度学习历史:

06-Hinton,神经网络反向传播训练。

12-提取特征用深度卷积。

RNN-序列图像处理。

LSTM-也是利用序列信息。

图像识别:
Alexnet, VGGnet, GoogleNet, ResNet, RetinaNet
目标检测:
Fast-rcnn, faster-rcnn, Yolo, Retina-Net
图像分割:
FCN,Mask-Rcnn
目标跟踪:
GOTURN, ECO
图像生成:
GAN,WGAN
光流:
FlowNet
视频分割:
Segnet

计算机视觉历史回顾,从浅层学习到深度学习 - 计算机视觉基础入门课程(从算法到实战应用) - AI研习社 - 研习AI产学研新知,助力AI学术开发者成长。 http://www.mooc.ai/course/353/learn?lessonid=2270&groupId=46#lesson/2270

 

posted @ 2019-08-16 17:34  ostartech  阅读(440)  评论(0编辑  收藏  举报