2021年11月10日

第3章: 细说Language Model内幕及Transformer XL源码实现

摘要: 1,人工智能中最重要的公式之一MLE数学本质剖析及代码实战2,Language Model的数学原理、Chain Rule剖析及Sparsity问题3,Markov Assumption:first order、second order、third order剖析4,Language Model:u 阅读全文

posted @ 2021-11-10 10:08 l_time 阅读(62) 评论(0) 推荐(0) 编辑

第2章: 通过30+个细分模块完整实现Transformer论文源码及项目调试

摘要: 1,Transformer源码训练及预测整体效果展示2,模型训练model_training.py代码完整实现3,数据预处理data_preprocess.py代码完整实现4,Input端Embeddings源码完整实现5,Attention机制attention.py代码完整实现6,Multi-h 阅读全文

posted @ 2021-11-10 10:07 l_time 阅读(54) 评论(0) 推荐(0) 编辑

第1章: 贝叶斯理论下的Transformer揭秘

摘要: 1,基于Bayesian Theory,融Hard Attention、Soft Attention、Self-Attention、Multi-head Attention于一身的Transformer架构2,为什么说抛弃了传统模型(例如RNN、 LSTM、CNN等)的Transformer拉开了非 阅读全文

posted @ 2021-11-10 10:06 l_time 阅读(139) 评论(0) 推荐(0) 编辑

基于Transformer的NLP智能对话机器人实战课程

摘要: One Architecture, One Course,One World 本课程以Transformer架构为基石、萃取NLP中最具有使用价值的内容、围绕手动实现工业级智能业务对话机器人所需要的全生命周期知识点展开,学习完成后不仅能够从算法、源码、实战等方面融汇贯通NLP领域NLU、NLI、NL 阅读全文

posted @ 2021-11-10 10:02 l_time 阅读(93) 评论(0) 推荐(0) 编辑

导航