刷新
设备管理系统AI大模型应用RAG案例

博主头像 设备管理系统-AI大模型应用RAG案例设备管理系统功能 设备管理系统是为企业设备管理设计的软件,它通过数字化和自动化的方式,帮助企业提高管理效率和准确性。主要功能点:设备档案管理:帮助企业建立完整的设备档案,记录设备基本信息,如名称、型号、规格、供应商等,便于查询和管理。设备入库和领用:支持设备入库 ...

大厂的风控引擎架构设计

博主头像 1 架构师能力思维模型 全局思维 抽象思维 2 新需求的思考路径 需求是否合理,是否能解决问题? 能划分多少个子系统? 每个子系统能划分多少个模块?这个系统需要可靠性吗,需要扩展能力吗?成本需要控制吗? 表如何设计?API如何设计?模块之间如何通信? 3 风控引擎设计的核心点 架构会围绕核心点进行设 ...

Kimi的PPT生成功能体验

博主头像 Kimi的PPT生成功能体验我们只需要输入@PPT可以切换PPT模板在线编辑大纲生成PPT文件,下载后结论总体生成流程还算便利,缺点是 1) 模板还较少, 2)后期容易出现类同。今天先到这儿,希望对AIGC,云原生,技术领导力, 企业管理,系统架构设计与评估,团队管理, 项目管理, 产品管理,信息安 ...

淘宝的商品信息缓存体系是如何构建的?

博主头像 0 前言 在电商系统中,商品信息的快速获取对用户体验至关重要。本文将详细讲解一个多层级的商品信息缓存体系,旨在提高系统性能和可靠性。 开局一张图,剩下全靠编! 1 整体架构 该缓存体系采用了多级缓存策略,从前端到后端,逐层深入: CDN缓存 Nginx缓存集群 Redis缓存 JVM本地缓存 MyS ...

LLM并行训练7-混合并行总结

博主头像 概述 根据前面的系列文章, 对预训练大模型里用到的主要并行加速技术做了一系列拆分. 但是在实际的训练里往往是多种并行混合训练. 我们要怎么配置这些并行策略才能让训练框架尽可能的减少通信瓶颈, 提升GPU计算利用率呢? 这里的变量太多了, 以最简单的3D并行为例: 硬件层面有: 单台机器的卡数/卡间带 ...

ComfyUI插件:ComfyUI Impact 节点(一)

博主头像 前言: 学习ComfyUI是一场持久战,而 ComfyUI Impact 是一个庞大的模块节点库,内置许多非常实用且强大的功能节点 ,例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用,我们可以实现的工作有很多,例如自动人脸检测和优化修复、区域增强、 ...

Prompt Engneering

博主头像 Prompt-Engineerning Prompt-Engineerning(提示词工程) 目录Prompt-Engineerning零、文档中参数说明1、OpenAI API接口参数一、什么是提示词工程1、学习AI在提示词工程上有哪些优势2、Prompt调优二、Prompt典型构成1、定义角色为 ...

深入理解 Java17 新特性:Sealed Classes

博主头像 0 关键总结 Java SE 15在2020年9月发布,预览功能引入“封闭类”(JEP 360) 封闭类是一种限制哪些其他类或接口可扩展它的类或接口 类似枚举,封闭类在领域模型中捕获替代方案,允许程序员和编译器推理其穷尽性 封闭类对于创建安全的层次结构也很有用,通过解耦可访问性和可扩展性,允许库开发 ...

大厂的第三方支付业务架构设计

博主头像 0 前言 金融业务都很复杂。我们有可能复用第三方支付既有经验,解决其他金融业务问题吗? 和解数学应用题一样,应对第三方支付这类复杂业务: 先分析它里面的核心原理 再尝试通过核心原理推算出可能规律。这些规律就决定系统架构的演进规律 掌握这些分析问题的方法,碰到其他金融业务问题时就能游刃有余。 先搞懂支 ...

扫码支付后都发生了啥?

博主头像 1 金融业务 业务模式划分: 交易类业务,如扫码支付 信贷类业务 扫码支付普遍但不简单: 扫码支付是最具代表性,最常见的金融场景 传统银行业务的标志性机构大多参与到扫码支付过程,可通过扫码支付了解国家金融系统运作 扫码业务同时具有互联网应用和机构应用的技术特点:既要对接互联网用户,也要对接金融机构 ...

一文看懂AI的 Transformer 架构!

博主头像 1 AI的转换器是啥? 转换器,一种将输入序列转换或更改为输出序列的神经网络架构。它们通过学习上下文和跟踪序列组件之间的关系来做到这一点。例如,请考虑以下输入序列:“天空是什么颜色的?” 转换器模型会使用内部数学表示法来识别颜色、天空和蓝色这三个词之间的相关性和关系。利用这些知识,它会生成输出:“天 ...

区块链的基石:工作量证明机制,如何驱动数字货币革命?

博主头像 1 工作量证明(PoW,Proof of Work) 为防止恶意攻击,节点需完成复杂计算任务(即“挖矿”)来证明他们的工作量。这是一种共识机制,确保只有合法的区块可被添入区块链。 第一代共识机制,比特币的基础,即“按劳取酬”,你付出多少工作量,就获得多少报酬。 网络世界里,劳动就是你为网络提供的计算 ...

LLM-01 大模型 本地部署运行 ChatGLM2-6B-INT4(6GB) 简单上手 环境配置 单机单卡多卡 2070Super8GBx2 打怪升级!

博主头像 搬迁说明 之前在 CSDN 上发文章,一直想着努力发一些好的文章出来!这篇文章在 2024-04-17 10:11:55 已在 CSDN 发布 写在前面 其他显卡环境也可以!但是最少要有8GB的显存,不然很容易爆。 如果有多显卡的话,单机多卡也是很好的方案!!! 背景介绍 目前借到一台算法组的服务器 ...

LLM并行训练6-激活优化

博主头像 前置知识 Activation 激活指的是一些在fp时计算得到的临时tensor, 会用于bp时的计算. 如果能在fp计算后把临时tensor缓存下来就可以加速bp, 缺点在于激活会占用大量显存. 以一层transformer结构为例分析下各层存在的激活. 简单部分的分析这里忽略. 主要分析下几个不 ...

OpenAI&Claude API key获取

博主头像 一、CloseAI介绍 CloseAI是一家企业级的OpenAI服务代理商,主要面向被OpenAI限制地区的企业用户提供API代理服务。可以提供远超OpenAI账号限额的大规模并发调用,广泛被用于AI产品开发、数据处理、科学研究等领域。 我一般是随时用随时充值,按需充值,到账很快,几乎不需要等待。 ...

123···13>