摘要: 到目前为止最轻松的作业 大概就是给一些(600个)人说的语音,让你判断测试集中的语音是谁说的 人的语音是一个 sequence,可以用 self-attention + FC 获得类别,这不就是 transformer 的 encoder 嘛! 代码:https://colab.research.g 阅读全文
posted @ 2024-01-31 22:44 SkyRainWind 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 调参调吐了。。做的最艰难的一次(虽然一共也没做几次) 最好做到了 private 0.82 / public 0.808 这题前前后后做了五天。。主要是后来 train 一次就得花很长很长时间,我的 kaggle 余额也用的差不多了。。 这个题目大概就是给你 11 种食物的图片,让你学习,并分类 题 阅读全文
posted @ 2024-01-31 19:37 SkyRainWind 阅读(78) 评论(0) 推荐(0) 编辑
摘要: 前言 当时老师要求我做 transformer 和 self-attention 的 ppt,结果当时在训练 ACM 没大有时间,就弄了个质量不高的,不出意外的被喷了。。。现在回头看看当时做的整体没有大问题,但是由于知识没有连贯起来导致有些地方没有提到,也没有形成一个比较完整的架构。 Transfo 阅读全文
posted @ 2024-01-31 14:28 SkyRainWind 阅读(17) 评论(0) 推荐(0) 编辑