视觉AI训练营Day01_视觉AI技术
视觉生产
定义
-
产生人或机器能感知的图像视频
-
能达到新的视觉表达
分类
-
生成:从0到1
-
拓展:从1到N
-
摘要:从N到1
-
升维:从An到An+1
-
增强/变换:从A到B
-
插入/合成:A+B=C
-
擦除:A-B=C
通用基础框架
五个关键维度(规范)
-
满足视觉/美学表现(可看)
-
合乎语义/内容逻辑(合理)
-
保证结果的丰富性(多样)
-
提供用户预期的抓手(可控)
-
带来用户/商业价值(可用)
分割抠图(三要点)
-
识别: 知道是什么
-
检测: 识别+知道在哪儿
-
分割: 识别+检测+每一个像素代表什么
难点
解题思路
框架流程
-
理需求
-
定草图
-
选状态
-
调细节
-
生成图
-
评好坏
视觉编辑
插入
删除
删除字幕、logo、广告、台标
变化
剪裁、内容不全、尺寸变化
视觉增强
人脸修复增强、渲染图超分、视频超分、插帧、HDR色彩扩展、风格迁移、颜色拓展。
视觉制造
如实体设计制造、包装几何图形、服装几何生成、视觉迁移及融合、多样性拓展、2D3D融合等