09 2024 档案
-
基于python框架实现一个简化的trm
摘要:基于py框架实现一个简化的trm? 目录基于py框架实现一个简化的trm?词向量A1回顾A2引入模型(对比)A3DUNE --举例ini化独热前向传播反向传播1. ELMo(Embeddings from Language Models)2. Transformer3. GPT(Generative 阅读全文
-
基于bert的煤矿装备维护知识命名实体识别研究
摘要:基于bert的煤矿装备维护知识命名实体识别研究 目录基于bert的煤矿装备维护知识命名实体识别研究命名实体识别条件随机场模型crf海岛局部全局隐马尔可夫模型hmm海岛显马尔可夫隐马尔可夫crf&hmm 缺点 摘要: 为解决煤矿装备维护知识中语义复杂、 实体识别困难的问题, 以自建的煤矿装备维护知识语 阅读全文
-
bloomberg
摘要:目录鸣谢参考文献Part.1.关于trm预处理位置编码>>encoder>>前馈FNN>>decodermasking>>finalPart.2.关于blmbgGPT要点※特别注意数据集FinPile金融数据集通用数据集P16P17MODEL介绍部分模型结构其他细节公式解释GELU特性工作原理模型尺 阅读全文
-
transformer 从零
摘要:transformer 从零 trm在做什么事情? 类比“翻译”,输入、黑盒处理、输出。 对其细化,黑盒中编码作为解码的输入,二者的结果作为终局输出的输入。继续细化成下图: 位置编码 下图为rnn下的时间线展开, 借由三角函数性质公式: 得到: 即,若当pos=“我”,k=“爱”时,pos+k的“你 阅读全文