2023 年 4月随笔档案 - shiiiilong

摘要：one-hot，word2vec，elmo，bert 阅读全文

posted @ 2023-04-30 13:47 shiiiilong 阅读(85) 评论(0) 推荐(0) 编辑

优化算法

摘要：SGD，AdaM，RMSProp... 阅读全文

posted @ 2023-04-29 11:06 shiiiilong 阅读(11) 评论(0) 推荐(0) 编辑

如何减少过拟合？

摘要：L0，L1，L2正则化；Dropout；数据增强；early stop 阅读全文

posted @ 2023-04-29 10:44 shiiiilong 阅读(131) 评论(0) 推荐(0) 编辑

NLP中数据增强

摘要：同义词替换，回译等等阅读全文

posted @ 2023-04-29 10:43 shiiiilong 阅读(78) 评论(0) 推荐(0) 编辑

熵，交叉熵

摘要：为什么交叉熵经常用来当作训练的目标函数？阅读全文

posted @ 2023-04-28 16:40 shiiiilong 阅读(32) 评论(0) 推荐(0) 编辑

摘要：随机森林，GBDT，XGBoost，独立同分布阅读全文

posted @ 2023-04-28 11:46 shiiiilong 阅读(59) 评论(0) 推荐(0) 编辑

AUC

摘要：重要的分类评估指标阅读全文

posted @ 2023-04-28 10:08 shiiiilong 阅读(47) 评论(0) 推荐(0) 编辑

摘要：基于LLaMA的指令微调模型--Alpaca（大羊驼），Vicuna（小羊驼）阅读全文

posted @ 2023-04-18 13:31 shiiiilong 阅读(746) 评论(0) 推荐(0) 编辑

Subword算法

摘要：当下各种预训练模型的Subword算法概览阅读全文

posted @ 2023-04-17 23:47 shiiiilong 阅读(41) 评论(0) 推荐(0) 编辑

Bert变体--Deberta

摘要：解耦注意力的解码增强型BERT 阅读全文

posted @ 2023-04-17 23:46 shiiiilong 阅读(317) 评论(0) 推荐(0) 编辑

Bert变体--Roberta

摘要：Roberta相对Bert的改动阅读全文

posted @ 2023-04-17 23:38 shiiiilong 阅读(82) 评论(0) 推荐(0) 编辑

shiiiilong