摘要:
1 Zero-shot learning 零样本学习。 1.1 任务定义 利用训练集数据训练模型,使得模型能够对测试集的对象进行分类,但是训练集类别和测试集类别之间没有交集;期间需要借助类别的描述,来建立训练集和测试集之间的联系,从而使得模型有效。 Zero-shot learning 就是希望我们 阅读全文
摘要:
1 开源解析和拆分文档 第三方工具去对文件解析拆分,将文件内容给提取出来,并将我们的文档内容去拆分成一个小的chunk。常见的PDF word mark down, JSON、HTML。都可以有很好的一些模块去把这些文件去进行一个东西去提取。 1.1 优势 支持丰富的文档类型 每种文档多样化选择 与 阅读全文
摘要:
大模型在一定程度上去改变了我们生活生工作的思考的方式,然后也越来越多的个人还有企业在思考如何将大模型去应用到更加实际的呃生产生活中去,希望大语言模型能够呃有一些更多企业级别生产落地的实践,然后去帮助我们解决一些业务上的问题。目前 1 LLM的问题 1.1 幻觉 LLM因为是一个预训练模型,它已有一些 阅读全文
摘要:
1 模型 来看两种不同类型的模型--LLM 和聊天模型。然后,它将介绍如何使用提示模板来格式化这些模型的输入,以及如何使用输出解析器来处理输出。 LangChain 中的语言模型有两种类型: 1.1 Chat Models 聊天模型通常由 LLM 支持,但专门针对会话进行了调整。提供者 API 使用 阅读全文
摘要:
pip install --upgrade langchain==0.0.279 -i https://pypi.org/simple 1 创建一个LLM 自有算力平台+开源大模型(需要有庞大的GPU资源)企业自己训练数据 第三方大模型API(openai/百度文心/阿里通义千问...)数据无所谓 阅读全文
摘要:
LLM大模型与AI应用的粘合剂。 1 langchain是什么以及发展过程 LangChain是一个开源框架,旨在简化使用大型语言模型构建端到端应用程序的过程,也是ReAct(reason+act)论文的落地实现。 2022年10月25日开源 54K+ star 种子轮一周1000万美金,A轮250 阅读全文
摘要:
1 行业全景图 2 结构拆解AI GC 生成式AI这个产业。分成上中下游三大块。 2.1 上游基础层 主要包括: 算力:包括AI芯片和云服务等,例如像英伟达、AMD以及华为等厂商提供的算力基础设施。大型模型基于Transformer架构,对算力的需求很大。 数据:新时代的石油,分为基础数据服务、数据 阅读全文
摘要:
很多同学只知类似Check GPT或者说对国内的一些比较了解,对国外的不太了解,所以在这总结。 1 大模型的发展 左表 名称 参数 特点 发布时间 GPT-2 15亿 英文底模,开源 2019年 Google T5 110亿 多任务微调, 开源 2019年 GPT-3.5 1750亿 人工反馈微调 阅读全文
摘要:
1 Zero-shot learning 零样本学习。 1.1 任务定义 利用训练集数据训练模型,使得模型能够对测试集的对象进行分类,但是训练集类别和测试集类别之间没有交集;期间需要借助类别的描述,来建立训练集和测试集之间的联系,从而使得模型有效。 Zero-shot learning 就是希望我们 阅读全文
摘要:
1 Loki 1.1 简介 功能强大;轻量级,可以在配置更低的设备上部署;完全契合现代化部署方式; github Loki是受Prometheus启发的水平可扩展、高可用、多租户日志聚合系统。它的设计非常具有成本效益且易于操作。它不索引日志的内容,而是索引每个日志流的一组标签。 1.2 优点 与其他 阅读全文