11 2024 档案
摘要:【NLP高频面题 - LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势? 重要性:⭐⭐⭐
阅读全文
摘要:【人人都能学得会的NLP - 文本分类篇 03】长文本多标签分类分类如何做? NLP Github
阅读全文
摘要:【NLP高频面题 - LLM架构篇】大模型为何使用RMSNorm代替LayerNorm? 重要性:★
阅读全文
摘要:【人人都能学得会的NLP - 文本分类篇 02】使用DL方法做文本分类任务 NLP Github 项
阅读全文
摘要:【NLP高频面题 - LLM架构篇】LLM对Transformer都有哪些优化? ⚠︎ 重要性:★★
阅读全文
摘要:【NLP高频面题 - LLM架构篇】LLM为何使用GQA代替MHA? 重要性:★★ 💯 NLP G
阅读全文
摘要:【人人都能学得会的NLP - 文本分类篇 01】使用ML方法做文本分类任务 NLP Github 项
阅读全文
摘要:【RAG 项目实战 08】为 RAG 添加历史对话能力 NLP Github 项目: NLP 项目实
阅读全文
摘要:【RAG 项目实战 07】替换 ConversationalRetrievalChain(单轮问答)
阅读全文
摘要:【NLP高频面题 - 分布式训练】ZeRO1、ZeRO2、ZeRO3分别做了哪些优化? 重要性:★★
阅读全文
摘要:【RAG 项目实战 06】使用 LangChain 结合 Chainlit 实现文档问答 NLP G
阅读全文
摘要:【NLP高频面题 - LLM架构篇】什么是旋转位置编码(RoPE)? 重要性:★★★ 💯 NLP
阅读全文
摘要:【RAG 项目实战 05】重构:封装代码 NLP Github 项目: NLP 项目实践:faste
阅读全文
摘要:【LLM训练】从零训练一个大模型有哪几个核心步骤? ⚠︎ 重要性:★★★ NLP Github 项目
阅读全文
摘要:【淘汰9成NLP面试者的高频面题】RNN是如何基于时间进行参数学习(BPTT)的? 重要性:★★ 本
阅读全文
摘要:【RAG 项目实战 04】添加多轮对话能力 NLP Github 项目: NLP 项目实践:fast
阅读全文
摘要:【RAG 项目实战 03】优雅的管理环境变量 【动手学 RAG】系列文章: 【RAG 项目实战 01
阅读全文
摘要:【淘汰9成NLP面试者的高频面题】LSTM中的tanh和sigmoid分别用在什么地方?为什么? 重
阅读全文
摘要:【RAG 项目实战 02】Chainlit 持久化对话历史 NLP Github 项目: NLP 项
阅读全文
摘要:**【淘汰9成NLP面试者的高频面题】BPE 分词器是如何训练的? ** ︎重要性:★★ 此题主要是
阅读全文
摘要:【淘汰9成NLP工程师的常识题】LSTM的前向计算如何进行加速? 重要性:★★★ 💯 这是我常用的
阅读全文
摘要:【RAG 项目实战 01】在 LangChain 中集成 Chainlit NLP Github 项
阅读全文
摘要:【淘汰9成NLP工程师的常识题】多头注意力相对于多头注意力有什么优势? 重要性:★★★ 💯 这是我
阅读全文
摘要:【模型部署】vLLM 部署 Qwen2-VL 踩坑记 03 - 多图支持和输入格式问题 NLP Gi
阅读全文
摘要:【模型部署】vLLM 部署 Qwen2-VL 踩坑记 02 - 推理加速 NLP Github 项目
阅读全文
摘要:【模型部署】vLLM 部署 Qwen2-VL 踩坑记 01 - 环境安装 NLP Github 项目
阅读全文