刷新
聊聊ChatGLM-6B部署与微调的深入理解

博主头像 ChatGLM的部署,主要是两个步骤: 在Github上下载chatglm的库文件 在Hugging Face上下载模型参数与配置文件 ChatGLM包 从Github上看ChatGLM项目文件的结构来看,仅仅是包含三种部署方式的py代码与微调的py代码 而相关的实现细节,比如神经网络、激活函数、损 ...

ChatGPT高质量prompt技巧指南-《向 ChatGPT 提问获取高质量答案的艺 术:Prompt 工程技术完全指南》图书分享

博主头像 一、图书简介:本书是一本全面的指南,介绍了各种 Prompt 技术的理解和利用,用于从 ChatGPT中生成高质量的答案。 我们将探讨如何使用不同的 Prompt 工程技术来实现不同的目标。ChatGPT 是一 种先进的语言模型,能够生成类似人类的文本。然而,了解正确的提问方式以获 取我们所需的高质 ...

向量数据库~milvus

博主头像 本文主要基于milvus官方的材料外加自己的一些理解整理而来,欢迎交流 设计理念 云原生:存&算分离; 读写分离; 增量存量分离; 微服务架构,极致弹性; 日志即数据:通过message queue解耦生产者、消费着,降低系统复杂度; 提升index、data、query模块弹性; 流批一体:表和日 ...

Hugging Face 年度回顾:2023,开源大模型之年

博主头像 在 2023 年,大型语言模型(Large Language Models,简称 LLMs)受到了公众的广泛关注,许多人对这些模型的本质及其功能有了基本的了解。是否开源的议题同样引起了广泛的讨论。在 Hugging Face,我们对开源模型抱有极大热情。开源模型的优势在于,它们不仅促进了研究的可复制 ...

使用vLLM和ChatGLM3-6b批量推理

博主头像 当数据量大的时候,比如百万级别,使用 ChatGLM3-6b 推理的速度是很慢的。发现使用 vLLM 和 ChatGLM3-6b 批量推理极大的提高了推理效率。本文主要通过一个简单的例子进行实践。 1.安装 vLLM 和PyTorch [2] 除了 Python(本文使用 3.11)、CUDA(本文 ...

聊聊ChatGLM2-6B模型的微调

博主头像 概述 GLM、ChatGLM的相关基础知识说明: GLM模型底层还是基于Transformer,因此其设计、优化都是围绕Transformer的各个组件的。从注意力层的掩码、位置编码等方面优化与设计。 ChatGLM3/ChatGLM2的源码中,比如finetune、trainer等代码,其实是co ...

多模态AI:技术深掘与应用实景解析

博主头像 在当今人工智能技术的快速发展中,多模态AI凭借其独特的数据处理能力,成为了科技创新的前沿。这项技术结合了视觉、听觉、文本等多种感知模式,开辟了人工智能处理和理解复杂信息的新纪元。本文旨在深入探讨多模态AI的核心技术和其在现实世界中的应用场景,揭示这项技术如何推动科技前沿的发展。 图片来源:浙商证券研 ...

语言模型:GPT与HuggingFace的应用

博主头像 本文分享自华为云社区《大语言模型底层原理你都知道吗?大语言模型底层架构之二GPT实现》,作者:码上开花_Lancer 。 受到计算机视觉领域采用ImageNet对模型进行一次预训练,使得模型可以通过海量图像充分学习如何提取特征,然后再根据任务目标进行模型微调的范式影响,自然语言处理领域基于预训练语言 ...

大语言模型底层架构丨带你认识Transformer

博主头像 本文分享自华为云社区《大语言模型底层架构你了解多少?大语言模型底层架构之一Transfomer的介绍和python代码实现》,作者: 码上开花_Lancer 。 语言模型目标是建模自然语言的概率分布,在自然语言处理研究中具有重要的作用,是自然语言处理基础任务之一。大量的研究从n 元语言模型(n-gr ...

使用Langchain与ChatGLM实现本地知识库(二)

博主头像 大语言模型也只是将用户提供的大规模数据集训练而来,也并非万能的什么都知道,特别是一些小众知识、内部数据或私密的个人数据等,此时ChatGLM3肯定会胡乱回答就是ChatGPT4也不一定能给出满意回答;不少公司、个人都有自己的知识库或日志等此时如有可将这些数据以某种方式挂在大模型上此时在知识库存在的知 ...

聊一聊大模型

博主头像 本文对大模型从原理及结构上做了简单的介绍,希望能给各位在了解大模型的路上提供一些帮助。个人经验有限,说的不对的地方还请及时提出宝贵的意见,也可以联系本人线下讨论。下期会结合我们在财富领域训练大模型的经验写一篇偏实践的文章出来。 ...

医疗+GPT实践,分享一下共探讨

博主头像 医疗领域与GPT(生成对抗网络)实践相结合,将为医学研究、诊断和治疗带来革命性的变革。在这篇文章中,我们将探讨GPT在医疗领域的应用,以及它如何帮助医生和研究人员提高诊疗效率和准确性。 首先,让我们了解一下GPT。GPT是一种生成式人工智能技术,通过大量文本数据进行训练,从而学会生成具有逻辑性和连贯 ...

使用LangChain与ChatGLM实现本地知识库(一)

博主头像 本篇主要内容为介绍ChatGLM3的安装使用,后续才会涉及到使用LangChain实现本地知识库的内容; ChatGLM为智谱与清华大学开源的一个大语言模型,支持多轮对话、内容创作等,ChatGLM3-6B为ChatGLM3系列中门槛相对较低的一个,本地部署提供兼容OpenAI的API; LangC ...

AI Agents 蓄势待发!

博主头像 目录1. AI Agents: AI 前沿2. AI Agents: 为任务而生2.1 AI Agents是智能地处理任务的智能体2.2.1 Perception 感知模块2.2.2 Knowledge知识模块2.2.3 Brain 认知模块2.2.4 Skills技术模块2.2.5 Plan计划模 ...