刷新
聊聊从大模型来看NLP解决方案之UIE

博主头像 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote 概述 自然语言处理NLP任务的实现,相比较以前基于传统机器学习算法实现方法,现在越来越集中使用大模型来实现。 通过——数据标注-模型训练-模型调优/微调-模型压缩-预测部署的大模型流程,覆盖NLP多场景满足 ...

大模型+电力预测?

博主头像 自ChatGPT问世以后,大模型非常的火,不出意外的话,电力系统方向又打算搞事情了。大模型+电力任重道远。最近听说了一些关于大模型+风光功率预测、负荷预测、电价预测的想法,初步分析下,很遗憾的是,个人得出结论是不可行。简单来说,如果强行使用大模型来做电力预测,本质上可能只是一厢情愿的希望大模型去预测 ...

聊聊大模型的屏蔽词工程

博主头像 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote 概述 在做微调训练时,鉴于业务场景的需要,可能会存在微调数据集中含有敏感词汇,譬如:自杀、跳楼等。而开源模型可能没有做敏感词汇的屏蔽工程。因此可能就会出现不可预控的现象,而我遇到的是,当我输入敏感词汇时,模 ...

graspnet复现保姆级教程

博主头像 ubuntu22.04复现graspnet保姆级教程 1. 配置环境 1.1 确定环境 Ubuntu22.04 显卡驱动:Driver Version:470.239.06 CUDA版本(作者使用的是10.0.221) 根据CUDA版本确定cudnn()版本 根据CUDA和cudnn版本下载对应的p ...

BiLSTM算法(二)

博主头像 案例二:对文本进行分类,类别有财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐 github代码链接点击此文本分类 原作者给出了好几种模型 此次仅针对BiLSTM模型分析。 核心代码如下: class Model(nn.Module): def __init__(self, config) ...

聊聊ChatGLM3多用户并发API调用的问题

博主头像 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote 背景 目前在公司内部4张A10的GPU服务器上部署了ChatGLM3开源模型;然后部署了官方默认的web_demo、api_demo两种模式;重新设计了前端,支持H5和安卓两个客户端调用。但却发现了不能并发 ...

【译】大模型能推理吗?

博主头像 原作:梅拉妮·米切尔 /Gemini翻译/ 我们应该如何看待当今大型语言模型的推理能力?正如上面的标题所示,关于这些庞大的预训练神经网络是否已经达到类人推理能力,或者它们的技能实际上是否“只是海市蜃楼”,争论正酣。 推理是人类智能的核心方面,而强大的领域无关推理能力长期以来一直是人工智能系统的一个关 ...

中文GPTS使用秘籍,字节扣子Coze工作流使用全教程

博主头像 免费扣子Coze教程地址:https://www.bzfree.com/ 大家好,我是斜杠君。今天和大家分享字节扣子Coze工作流创建和使用全教程,手把手教会你。 首先我们先来看一下如何创建一个工作流。 我们以创建这样一个工作流为例。这个工作流程的作用是:把用户输入的内容通过头条接口查询信息,把查到 ...

LLM面面观之MoE

博主头像 1. 背景 根据本qiang~最新的趋势观察,基于MoE架构的开源大模型越来越多,比如马斯克的Grok-1(314B), Qwen1.5-MoE-A2.7B等,因此想探究一下MoE里面的部分细节。 此文是本qiang~针对大语言模型的MoE的整理,包括原理、流程及部分源码。 2. MoE原理 MoE ...

ChatTuGraph:通过大模型“与图对话”

博主头像 相比于SQL相对成熟的语法标准,图查询语言尚未形成成熟的统一标准,目前是多种查询语法并存的状态,上手门槛高,因此更需要借助大语言模型的自然语言理解能力,降低图数据库查询语言的使用门槛。 ...

聊聊多模态大模型处理的思考

博主头像 转载请注明出处:https://www.cnblogs.com/zhiyong-ITNote 多模态:文本、音频、视频、图像等多形态的展现形式。 目前部门内业务要求领域大模型需要是多模态——支持音频/文本。从个人思考的角度来审视下,审视下多模态大模型的实现方式。 首先就要区分输入与输出,即输入的模态 ...

【译】关于涌现能力的常见论点

博主头像 原作:Jason Wei 引言:此博客文章不代表我的雇主OpenAI的立场(过去、现在或未来)。 /Gemini翻译/ 我将回顾在讨论大型语言模型的涌现能力时出现的一些常见论点。去年,我们撰写了一篇立场文件,将涌现能力定义为“小语言模型中不存在但在大语言模型中存在的能力”。我表明了涌现能力广泛存在, ...

【译】关于大语言模型的一些直觉

博主头像 原作:jasonwei, 引言:如今,一个悬而未决的问题是,为什么大型语言模型如此有效。在这篇博文中,我将讨论有关大型语言模型的六个基本直觉。其中许多直觉受到手动检查数据的启发,这是一项我发现有帮助且会推荐的练习。 语言模型经过预训练,可以简单地预测文本语料库中的下一个单词,并且它们由此学到了惊人的 ...

【译】用分数阶拉普拉斯解开大脑的神秘面纱

博主头像 原作:普利瑟姆 /Gemini翻译/ 人类大脑通常被称为已知宇宙中最复杂的物体,是连接性和功能性的奇迹。大脑由数十亿个神经元组成,每个神经元都有可能与数千个其他神经元相连,因此大脑的网络既庞大又复杂。 深度神经网络,特别是transformers的兴起无疑彻底改变了自然语言处理、计算机视觉,甚至某些 ...