深度学习工程实践
Preknowledge
Visualization
- Weight & Bias
Overfitting
Data Augmentation
-
Random crops and scales
resize the short side of the image to [250, 400], and then crop [244, 244] (target size) from the image
Weight Regularization
L1/L2 Regularization
Stochastic Regularization
-
Dropout
train时随机drop了一些输入会导致最后得到的输出期望降低了,因此在test时需要等比例增大输出
-
DropoutConnect : randomly dropout the connection between neural units
-
Cutout : randomly mask (set 0 or 255) the input picture
-
Mixup : (For classification) randomly mixup 2 input pictures and their labels
Training Trick
Hyperparameter optimization
Network Architectures
-
Squeeze-and-Excitation Network [SENet]
-
Neural architecture search [NAS] (auto machine learning)
Semantic Segmentation
- Fully connected network
Upsampling
-
Unpooling
-
Max Unpooling
-
Transpose convolution (learnable upsampling)
Projects
Project 1
-
Testing on Real Data
-
Application to Downstream Tasks
-
Collect training data by your own phones/cameras:
-
Others
Dataset | Model | PSNR↑ | SSIM↓ | LPIPS↑ |
---|---|---|---|---|
SyntheticBurstVal | dbsr_synthetic_default.pth | 39.167 | 0.946 | 0.081 |
DBSRNet_syn_ep0100.pth | 39.090 | 0.945 | 0.083 | |
BurstSR | dbsr_burstsr_default.pth | 47.701 | 0.984 | 0.029 |
DBSRNet_burst_ep0040.pth | 47.664 | 0.983 | 0.030 | |
DBSRNet_burst_bggr_ep0040.pth | 43.867 | 0.964 | 0.063 |
解释:
DBSRNet_syn_ep0100.pth
:使用提供的人工合成的数据集SyntheticBurstVal
训练100 epoches后得到的模型
DBSRNet_burst_ep0040.pth
:使用提供的真实拍摄的数据集BurstSR
训练40 epoches后得到的模型
DBSRNet_burst_bggr_ep0040.pth
:将数据集读取时使用的RGGB的Bayer样式转换为BGGR样式后重新训练的模型
Bayer Pattern | PSNR↑ | SSIM↓ | LPIPS↑ |
---|---|---|---|
RGGB | 28.249 | 0.813 | 0.156 |
BGGR | 22.923 | 0.675 | 0.292 |
GRBG | 22.543 | 0.659 | 0.326 |
GBRG | 22.543 | 0.659 | 0.326 |
Project 2
Analysis
-
图片翻转导致识别效果较差。模型在训练时没有训练过翻转图片
数据增强、可变形卷积
-
视角差异较大
设计端到端网络
-
图像模糊程度不同
-
对于镜面物体效果较差
Project 3
Project 4
-
神经网络模型对高频信息不敏感,可以对图片像素坐标
(x, y)
进行位置编码来提升
Project 5
Presentations
My Project
学习车道线检测相关论文及算法,基于开源数据集CULane改进目前最佳算法(CLRerNet),提升检测精度
Reference
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人