刷新
graspnet复现保姆级教程

博主头像 ubuntu22.04复现graspnet保姆级教程 1. 配置环境 1.1 确定环境 Ubuntu22.04 显卡驱动:Driver Version:470.239.06 CUDA版本(作者使用的是10.0.221) 根据CUDA版本确定cudnn()版本 根据CUDA和cudnn版本下载对应的p ...

BiLSTM算法(二)

博主头像 案例二:对文本进行分类,类别有财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐 github代码链接点击此文本分类 原作者给出了好几种模型 此次仅针对BiLSTM模型分析。 核心代码如下: class Model(nn.Module): def __init__(self, config) ...

聊聊ChatGLM3多用户并发API调用的问题

博主头像 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote 背景 目前在公司内部4张A10的GPU服务器上部署了ChatGLM3开源模型;然后部署了官方默认的web_demo、api_demo两种模式;重新设计了前端,支持H5和安卓两个客户端调用。但却发现了不能并发 ...

【译】大模型能推理吗?

博主头像 原作:梅拉妮·米切尔 /Gemini翻译/ 我们应该如何看待当今大型语言模型的推理能力?正如上面的标题所示,关于这些庞大的预训练神经网络是否已经达到类人推理能力,或者它们的技能实际上是否“只是海市蜃楼”,争论正酣。 推理是人类智能的核心方面,而强大的领域无关推理能力长期以来一直是人工智能系统的一个关 ...

中文GPTS使用秘籍,字节扣子Coze工作流使用全教程

博主头像 免费扣子Coze教程地址:https://www.bzfree.com/ 大家好,我是斜杠君。今天和大家分享字节扣子Coze工作流创建和使用全教程,手把手教会你。 首先我们先来看一下如何创建一个工作流。 我们以创建这样一个工作流为例。这个工作流程的作用是:把用户输入的内容通过头条接口查询信息,把查到 ...

LLM面面观之MoE

博主头像 1. 背景 根据本qiang~最新的趋势观察,基于MoE架构的开源大模型越来越多,比如马斯克的Grok-1(314B), Qwen1.5-MoE-A2.7B等,因此想探究一下MoE里面的部分细节。 此文是本qiang~针对大语言模型的MoE的整理,包括原理、流程及部分源码。 2. MoE原理 MoE ...

ChatTuGraph:通过大模型“与图对话”

博主头像 相比于SQL相对成熟的语法标准,图查询语言尚未形成成熟的统一标准,目前是多种查询语法并存的状态,上手门槛高,因此更需要借助大语言模型的自然语言理解能力,降低图数据库查询语言的使用门槛。 ...

聊聊多模态大模型处理的思考

博主头像 转载请注明出处:https://www.cnblogs.com/zhiyong-ITNote 多模态:文本、音频、视频、图像等多形态的展现形式。 目前部门内业务要求领域大模型需要是多模态——支持音频/文本。从个人思考的角度来审视下,审视下多模态大模型的实现方式。 首先就要区分输入与输出,即输入的模态 ...

【译】关于涌现能力的常见论点

博主头像 原作:Jason Wei 引言:此博客文章不代表我的雇主OpenAI的立场(过去、现在或未来)。 /Gemini翻译/ 我将回顾在讨论大型语言模型的涌现能力时出现的一些常见论点。去年,我们撰写了一篇立场文件,将涌现能力定义为“小语言模型中不存在但在大语言模型中存在的能力”。我表明了涌现能力广泛存在, ...

【译】关于大语言模型的一些直觉

博主头像 原作:jasonwei, 引言:如今,一个悬而未决的问题是,为什么大型语言模型如此有效。在这篇博文中,我将讨论有关大型语言模型的六个基本直觉。其中许多直觉受到手动检查数据的启发,这是一项我发现有帮助且会推荐的练习。 语言模型经过预训练,可以简单地预测文本语料库中的下一个单词,并且它们由此学到了惊人的 ...

【译】用分数阶拉普拉斯解开大脑的神秘面纱

博主头像 原作:普利瑟姆 /Gemini翻译/ 人类大脑通常被称为已知宇宙中最复杂的物体,是连接性和功能性的奇迹。大脑由数十亿个神经元组成,每个神经元都有可能与数千个其他神经元相连,因此大脑的网络既庞大又复杂。 深度神经网络,特别是transformers的兴起无疑彻底改变了自然语言处理、计算机视觉,甚至某些 ...

生成式AI的力量:它如何彻底改变业务流程自动化

博主头像 生成式AI的力量:它如何彻底改变业务流程自动化 生成式AI是一种可以创建新数据或内容的人工智能,它正在彻底改变业务流程自动化。通过利用生成式人工智能,企业可以简化和增强各种流程,从而提高生产力、效率和创新能力。生成式人工智能在业务自动化方面的主要优势之一是能够加快内容创建速度。利用生成式人工智能,企 ...

聊聊心理医疗领域大模型的落地思考

博主头像 转载请注明出处:https://www.cnblogs.com/zhiyong-ITNote 近来,工作偏向于心理医疗领域方面的大模型,仅从领域大模型的落地,聊聊个人的一些思考。 硬件 准备好花钱买GPU。 领域大模型 业务场景的思考 首先需要审视斟酌业务领域的特殊性与可行性,我们要做的是心理领域, ...

聊聊大模型微调训练全流程的思考

博主头像 转载请注明出处:https://www.cnblogs.com/zhiyong-ITNote 参考现有的中文医疗模型:MedicalGPT、CareGPT等领域模型的训练流程,结合ChatGPT的训练流程,总结如下: 在预训练阶段,模型会从大量无标注文本数据集中学习领域/通用知识;其次使用{有监督微 ...

<1···789···15>