会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
shiiiilong
首页
新随笔
联系
订阅
管理
04 2023 档案
词向量在各个历史阶段的经典模型
摘要:one-hot,word2vec,elmo,bert
阅读全文
posted @
2023-04-30 13:47
shiiiilong
阅读(85)
评论(0)
推荐(0)
编辑
优化算法
摘要:SGD,AdaM,RMSProp...
阅读全文
posted @
2023-04-29 11:06
shiiiilong
阅读(11)
评论(0)
推荐(0)
编辑
如何减少过拟合?
摘要:L0,L1,L2正则化;Dropout;数据增强;early stop
阅读全文
posted @
2023-04-29 10:44
shiiiilong
阅读(131)
评论(0)
推荐(0)
编辑
NLP中数据增强
摘要:同义词替换,回译等等
阅读全文
posted @
2023-04-29 10:43
shiiiilong
阅读(78)
评论(0)
推荐(0)
编辑
熵,交叉熵
摘要:为什么交叉熵经常用来当作训练的目标函数?
阅读全文
posted @
2023-04-28 16:40
shiiiilong
阅读(32)
评论(0)
推荐(0)
编辑
集成学习:Bagging & Boosting
摘要:随机森林,GBDT,XGBoost,独立同分布
阅读全文
posted @
2023-04-28 11:46
shiiiilong
阅读(59)
评论(0)
推荐(0)
编辑
AUC
摘要:重要的分类评估指标
阅读全文
posted @
2023-04-28 10:08
shiiiilong
阅读(47)
评论(0)
推荐(0)
编辑
基于LLaMA的指令微调模型--Alpaca(大羊驼),Vicuna(小羊驼)
摘要:基于LLaMA的指令微调模型--Alpaca(大羊驼),Vicuna(小羊驼)
阅读全文
posted @
2023-04-18 13:31
shiiiilong
阅读(746)
评论(0)
推荐(0)
编辑
Subword算法
摘要:当下各种预训练模型的Subword算法概览
阅读全文
posted @
2023-04-17 23:47
shiiiilong
阅读(41)
评论(0)
推荐(0)
编辑
Bert变体--Deberta
摘要:解耦注意力的解码增强型BERT
阅读全文
posted @
2023-04-17 23:46
shiiiilong
阅读(317)
评论(0)
推荐(0)
编辑
Bert变体--Roberta
摘要:Roberta相对Bert的改动
阅读全文
posted @
2023-04-17 23:38
shiiiilong
阅读(82)
评论(0)
推荐(0)
编辑
公告