CV1——学习笔记
计算机视觉(computer vision)是从图像和视频中提出数值或符号信息的计算系统,更形象一点说,计算机视觉是让计算机具备像人类一样的眼睛,看到图像,并理解图像。
计算机视觉三大应用:识别、检测、分割。
目标跟踪、视频分割、风格迁移、生成对抗网络(GAN)直播换脸、视频生成(LSTM预测未来信息)。
大部分计算机视觉,都靠深度学习了。
深度学习历史:
06-Hinton,神经网络反向传播训练。
12-提取特征用深度卷积。
RNN-序列图像处理。
LSTM-也是利用序列信息。
图像识别:
Alexnet, VGGnet, GoogleNet, ResNet, RetinaNet
目标检测:
Fast-rcnn, faster-rcnn, Yolo, Retina-Net
图像分割:
FCN,Mask-Rcnn
目标跟踪:
GOTURN, ECO
图像生成:
GAN,WGAN
光流:
FlowNet
视频分割:
Segnet
计算机视觉历史回顾,从浅层学习到深度学习 - 计算机视觉基础入门课程(从算法到实战应用) - AI研习社 - 研习AI产学研新知,助力AI学术开发者成长。 http://www.mooc.ai/course/353/learn?lessonid=2270&groupId=46#lesson/2270
ζั͡ޓއ genji - 至此只为原地流浪.......