上一页 1 2 3 4 5 6 7 8 9 ··· 13 下一页
  2023年11月11日
摘要: 本文主要介绍使用ResponseSelector实现校园招聘FAQ机器人,回答面试流程和面试结果查询的FAQ问题。FAQ机器人功能分为业务无关的功能和业务相关的功能2类。 一.data/nlu.yml文件 与普通意图相比,ResponseSelector训练数据中的意图采用group/intent格 阅读全文
posted @ 2023-11-11 22:55 扫地升 阅读(265) 评论(0) 推荐(1) 编辑
  2023年11月8日
摘要: Rasa NLU部分主要是解决NER(序列建模)和意图识别(分类建模)这2个任务。Rasa NLP是一个基于DAG的通用框架,图中的顶点即组件。组件特征包括有顺序关系、可相互替换、可互斥和可同时使用。有向无环图(DAG)在很多地方都有用到,比如Spark中等。虽然问答系统类型很多,比如闲聊问答、文档 阅读全文
posted @ 2023-11-08 00:25 扫地升 阅读(546) 评论(0) 推荐(1) 编辑
  2023年11月6日
摘要: 在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在10B以下的基础模型中最强的性能。ChatGLM3-6B采用了全新设计的Prompt格式,除正常的多轮对话外。同时原生支持工具调用(Function Call)、代码执行(Code Interpret 阅读全文
posted @ 2023-11-06 22:33 扫地升 阅读(2523) 评论(0) 推荐(0) 编辑
  2023年11月3日
摘要: 本文主要介绍P-tuning-v2论文中的5种任务,分别为Glue任务、NER任务、QA任务、SRL任务、SuperGlue任务,重点介绍了下每种任务使用的数据集。 一.Glue任务 GLUE(General Language Understanding Evaluation)是纽约大学、华盛顿大学 阅读全文
posted @ 2023-11-03 23:06 扫地升 阅读(507) 评论(0) 推荐(0) 编辑
摘要: 常见参数高效微调方法(Parameter-Efficient Fine-Tuning,PEFT)有哪些呢?主要是Prompt系列和LoRA系列。本文主要介绍P-Tuning v2微调方法。如下所示: Prompt系列比如,Prefix Tuning(2021.01-Stanford)、Prompt 阅读全文
posted @ 2023-11-03 00:17 扫地升 阅读(993) 评论(0) 推荐(0) 编辑
  2023年10月12日
摘要: DeepSpeed是一个深度学习优化软件套件,使分布式训练和推理变得简单、高效和有效。它可以做些什么呢?训练/推理具有数十亿或数万亿参数的密集或稀疏模型;实现出色的系统吞吐量并有效扩展到数千个GPU;在资源受限的GPU系统上进行训练/推理;实现前所未有的低延迟和高吞吐量的推理;以低成本实现极限压缩, 阅读全文
posted @ 2023-10-12 01:22 扫地升 阅读(2660) 评论(0) 推荐(1) 编辑
  2023年10月9日
摘要: 本文主要通过例子介绍了如何给核函数计时的思路和实现。实现例子代码参考文献[7],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.用CPU计时器计时(sumArraysOnGPU-timer.cu)[7] 在主函数中用CPU计时器测试向量加法的核函数 阅读全文
posted @ 2023-10-09 00:10 扫地升 阅读(493) 评论(0) 推荐(0) 编辑
  2023年10月8日
摘要: 本文主要通过例子介绍了CUDA异构编程模型,需要说明的是Grid、Block和Thread都是逻辑结构,不是物理结构。实现例子代码参考文献[2],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.Grid、Block和Thread间的关系 GPU中最 阅读全文
posted @ 2023-10-08 10:52 扫地升 阅读(510) 评论(0) 推荐(2) 编辑
  2023年10月7日
摘要: 本文主要讨论Langchain-Chatchat项目中自定义Agent问答的思路和实现。以"计算器工具"为例,简单理解就是通过LLM识别应该使用的工具类型,然后交给相应的工具(也是LLM模型)来解决问题。一个LLM模型可以充当不同的角色,要把结构化的Prompt模板写好,充分利用LLM的Zero/O 阅读全文
posted @ 2023-10-07 23:29 扫地升 阅读(1452) 评论(0) 推荐(0) 编辑
摘要: 在官方例子中给出了通过chain = NebulaGraphQAChain.from_llm(ChatOpenAI(temperature=0), graph=graph, verbose=True)来检索NebulaGraph图数据库。本文介绍了通过GPT2替换ChatOpenAI的思路和实现,暂 阅读全文
posted @ 2023-10-07 23:29 扫地升 阅读(265) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 13 下一页