目录1. AI Agents: AI 前沿2. AI Agents: 为任务而生2.1 AI Agents是智能地处理任务的智能体2.2.1 Perception 感知模块2.2.2 Knowledge知识模块2.2.3 Brain 认知模块2.2.4 Skills技术模块2.2.5 Plan计划模 ...
部署一个本地的聊天机器人-基于ChatGLM3 预备 理论上来说 8G及以上显存的英伟达GPU 笔者的设备 RTX 4060Ti (16G显存) Archlinux Python 3.10.10 ChatGLM3 代码版本 33953b119e7 开整 下载ChatGLM3 ChatGLM3 是智谱 ...
Q*使用了搜索算法来部分模拟人类的思维过程。未来形式化和形式逻辑的加入会显著加速AI思维能力的成熟。排除自主意识之外,AI几乎已经可以渗透到每个需要进行思考才能解决问题的领域中去了。 ...
人类的思维基于思考的目的性可以分为:执行性思维和创造性思维两种。 AI已经做到第一种,而实现创造性思维仍有挑战,但可见曙光。通过密切协作,人机终将构建出一个比任一单系统都更强大的联合认知系统。 ...
知识是抽象概念,记录在大脑中的是知识的一种物理映射结果。知识被执行了,大脑中的知识物理映射被读取了。人类仅仅是执行体,每一个个体的人类,真的拥有知识吗?毕竟载体的消失,对知识毫无影响 ...
简单的记忆和搜索对于人类而言是初步的“理解”。那么我们应该基于这个推论承认目前的 GPT 模型初步具有了“理解”的能力。当它可以流畅得回答特定领域相关问题时,我们应当承认 GPT “理解”了这些知识 ...
这一章我们聊聊大模型在数据分析领域的应用。数据分析主要是指在获取数据之后的数据清洗,数据处理,建模,数据洞察和可视化的步骤。这里我们聊两篇论文:Data-Copilot 和 InsightPilot ...
本文主要介绍了一个名为CoderEval的代码生成大模型评估基准,并对三个代码生成模型(CodeGen、PanGu-Coder和ChatGPT)在该基准上的表现进行了评估和比较。 ...
Prompt 对知识体系、认知演化和应用生态的深度影响,将引领我们进入一个崭新的GPT时代。Prompt 驱动 ChatGPT 完成从“懵懂”到“开窍”的认知飞跃,让它明确自己的定位和责任。 ...
在本博客中,我将分享如何巧妙地运用腾讯云的HAI服务进行AI绘画,通过对模型参数的微妙调整,观察图画效果,从而深入测试HAI在AI绘画领域的无限潜力。而通过对界面进行汉化,我们不仅提高了使用的便捷性,也为创作者提供了更加亲切的操作体验,使整个创作过程更加流畅而愉悦。在这个充满创意的旅程中,我们将揭开... ...
引子 向量数据库其实最早在传统的人工智能和机器学习场景中就有所应用。在大模型兴起后,由于目前大模型的token数限制,很多开发者倾向于将数据量庞大的知识、新闻、文献、语料等先通过嵌入(embedding)算法转变为向量数据,然后存储在Chroma等向量数据库中。当用户在大模型输入问题后,将问题本身也 ...
自stable diffusion开源之后AIGC绘画方向定制化百花齐放百家争鸣。而c站 https://civitai.com/ 也聚集了全球爱好者的各种微调训练模型分享。 其中以lora为首,应用最广泛。 而这些模型是怎么训练出来的,细节到底是什么样的,没有多少人能说得清楚。 而就博主知道的, ...
一、写在前面 昨天分享了一款可以帮我们写代码的插件CodeGeex,其实能帮我们解决大部分问题,讲道理已经很好了对不对? but,他就是最好的插件吗? 肯定不是,这不又让我又发现了一款可以平替的插件TONGYI Lingma(阿里云出品智能编码助手通义灵码)。 可能有同学会问了,那六哥这两个插件选哪 ...
面向大模型的全参数finetune 需要很高的计算消耗和存储成本,学界开始探索参数高效的微调方法。LoRA就是其中的代表,他在原始的Transformer模型上插入少量的参数,只训练增量的参数就能达到与全参数finetune相同/更优的效果 ...
ChatGPT,作为 OpenAI 的代表性产品之一,不仅为用户提供了强大的自然语言处理能力,而且关注用户的整体交互体验。在使用 ChatGPT 进行交互时,用户可能已经注意到了一个细节:当它产生回复时,回复会像人类逐字输入的方式逐渐出现,而不是一次性显示完整答案。 ...
前四章不论是和数据库和模型还是和搜索引擎交互,更多还是大模型和人之间的交互。这一章我们来唠唠只有大模型智能体的世界!分别基于源码介绍斯坦福小镇和Chatdev两篇论文 ...
在过去的几年中,基于深度学习的生成模型越来越受到关注,一方面这是因为该领域产生了一些惊人改进,另一方面受到关注也暗示着该领域进展迅猛。 依靠大量数据,精心设计的网络体系结构和智能培训技术,深入的生成模型已经显示出了令人难以置信的能力,可以生成各种高度逼真的各种内容,例如图像,文本和声音。 在这些深层 ...
目前,大模型的发展已经非常火热,关于大模型的训练、微调也是各个公司重点关注方向。但是大模型训练的痛点是模型参数过大,动辄上百亿,如果单靠单个GPU来完成训练基本不可能。所以需要多卡或者分布式训练来完成这项工作。 ...
目前,大模型的一个热门应用方向text2sql它可以帮助用户快速生成想要查询的SQL语句。那对于用户来说,大部分简单的sql都是正确的,但对于一些复杂逻辑来说,需要用户在产出SQL的基础上进行简单修改,Text2SQL应用主要还是帮助用户去解决开发时间,减少开发成本。 ...
注:文章的原文有11个章节,分别是: 摘要 (Abstract) 引言(Introduction) 概述(Overview) 大语言模型资源( Resources of LLMs) 预训练(Pre-trainng) 大语言模型的适配微调( Adaptation of LLMs) 使用(Utiliza ...