10 2022 档案

小样本利器4. 正则化+数据增强 Mixup Family代码实现

摘要：

小样本利器4. 正则化+数据增强 Mixup Family代码实现

这一章我们介绍嵌入模型的增强&正则化方案Mixup和Manifold Mixup，方法朴实无华，效果亲测有效~ 阅读全文

posted @ 2022-10-30 13:54 风雨中的小七阅读(1435) 评论(0) 推荐(0) 编辑

Bert不完全手册9. 长文本建模 BigBird & Longformer & Reformer & Performer

摘要：

Bert不完全手册9. 长文本建模 BigBird & Longformer & Reformer & Performer

这一章我们来唠唠如何优化BERT对文本长度的限制，核心是对Transformer计算效率的优化，我们会分别从片段递归，稀疏注意力机制和矩阵降维几个方向，聊聊更高效的Transformer魔改方案阅读全文

posted @ 2022-10-08 10:36 风雨中的小七阅读(1686) 评论(0) 推荐(0) 编辑

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔档案 (114)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:解密Prompt系列37. RAG之前置决策何时联网的多种策略
@Tom123123123 恩恩同意，所以下一张就是多agent路由了，rag联网只是agent路由的一个简化场景...
--风雨中的小七
2. Re:解密Prompt系列37. RAG之前置决策何时联网的多种策略
将RAG作为Agent的一个Tool，由模型来决定Tool的调用，后续还可以加计算器等等很多插件，单RAG的应用场景很窄
--Tom123123123
3. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
@Tom123123123 我们是公司层申请的和个人申请不一样的...
--风雨中的小七
4. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
作者您好，Azure的GPT4是怎么申请的啊，能写个教程吗
--Tom123123123
5. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
@Hekk丶感谢反馈找到问题了已经修复~...
--风雨中的小七