04 2023 档案

摘要:one-hot,word2vec,elmo,bert 阅读全文
posted @ 2023-04-30 13:47 shiiiilong 阅读(85) 评论(0) 推荐(0) 编辑
摘要:SGD,AdaM,RMSProp... 阅读全文
posted @ 2023-04-29 11:06 shiiiilong 阅读(11) 评论(0) 推荐(0) 编辑
摘要:L0,L1,L2正则化;Dropout;数据增强;early stop 阅读全文
posted @ 2023-04-29 10:44 shiiiilong 阅读(131) 评论(0) 推荐(0) 编辑
摘要:同义词替换,回译等等 阅读全文
posted @ 2023-04-29 10:43 shiiiilong 阅读(78) 评论(0) 推荐(0) 编辑
摘要:为什么交叉熵经常用来当作训练的目标函数? 阅读全文
posted @ 2023-04-28 16:40 shiiiilong 阅读(32) 评论(0) 推荐(0) 编辑
摘要:随机森林,GBDT,XGBoost,独立同分布 阅读全文
posted @ 2023-04-28 11:46 shiiiilong 阅读(59) 评论(0) 推荐(0) 编辑
摘要:重要的分类评估指标 阅读全文
posted @ 2023-04-28 10:08 shiiiilong 阅读(47) 评论(0) 推荐(0) 编辑
摘要:基于LLaMA的指令微调模型--Alpaca(大羊驼),Vicuna(小羊驼) 阅读全文
posted @ 2023-04-18 13:31 shiiiilong 阅读(746) 评论(0) 推荐(0) 编辑
摘要:当下各种预训练模型的Subword算法概览 阅读全文
posted @ 2023-04-17 23:47 shiiiilong 阅读(41) 评论(0) 推荐(0) 编辑
摘要:解耦注意力的解码增强型BERT 阅读全文
posted @ 2023-04-17 23:46 shiiiilong 阅读(317) 评论(0) 推荐(0) 编辑
摘要:Roberta相对Bert的改动 阅读全文
posted @ 2023-04-17 23:38 shiiiilong 阅读(82) 评论(0) 推荐(0) 编辑