2023 年 7月 21 日随笔档案 - deephub

2023年7月21日

摘要：与传统的卷积神经网络不同，vit使用最初设计用于自然语言处理任务的Transformers 架构来处理图像。微调这些模型以获得最佳性能可能是一个复杂的过程。下面是使用动画演示了在微调过程中嵌入的变化。这是通过对嵌入执行主成分分析(PCA)来实现的。这些嵌入是从处于不同微调阶段的模型及其相应的检查点阅读全文

posted @ 2023-07-21 09:29 deephub 阅读(32) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

公告