大模型 - 第6页 - 网站分类

首批！华为云盘古研发大模型通过代码大模型评估，获当前最高等级

本文分享自华为云社区《首批！华为云盘古研发大模型通过代码大模型评估，获当前最高等级》，作者：华为云头条。近日，在中国信通院组织的首轮代码大模型评估中，华为技术有限公司的华为云盘古研发大模型最终获得4+级，成为国内首批通过该项评估的企业之一。参与本次评估的华为云盘古研发大模型在研发场景丰富度方面 ...

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

阿里云正式开源通义千问Qwen2系列模型，其中Qwen2-72B成为全球性能最强的开源模型，在全球权威测评中，性能超过美国最强开源模型Llama3-70B，也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。今天老牛同学部署和体验Qwen2-7B中等尺寸模型，包括本地部署、API嗲用和We... ...

GlaDS缘起

题目：Modeling channelized and distributed subglacial drainage in two dimensions 近年来，冰盖表面融化与冰盖动态之间的联系及其对海平面上升的影响引起了广泛关注。特别是格陵兰冰盖的研究显示，表面融水显著影响冰川移动速度，而冰 ...

聊聊GLM-4-9B开源模型的微调loss计算

概述 Github官方地址：GLM-4 网上已经有很多关于微调的文章，介绍各种方式下的使用，这里不会赘述。我个人比较关心的是微调时的loss计算逻辑，这点在很多的文章都不会有相关的描述，因为大多数人都是关心如何使用之类的应用层，而不是其具体的底层逻辑，当然咱也说不清太底层的计算。可了解其它loss ...

大模型高效微调-LoRA原理详解和训练过程深入分析

博客首发于我的知乎，详见：https://zhuanlan.zhihu.com/p/702629428 一、LoRA原理 LoRA(Low-Rank Adaptation of LLMs)，即LLMs的低秩适应，是参数高效微调最常用的方法。 LoRA的本质就是用更少的训练参数来近似LLM全参数微调所 ...

解密Prompt系列31. LLM Agent之从经验中不断学习的智能体

模型想要完成自主能力进化和自主能力获得，需要通过Self-Reflection from Past Experience来实现。那如何获得经历，把经历转化成经验，并在推理中使用呢？本章介绍三种方案 ...

ChatTTS 开源文本转语音模型本地部署、API使用和搭建WebUI界面（建议收藏）

ChatTTS是一款专为对话场景设计的支持中英文的文本转语音（TTS）模型，能够生成高质量、自然流畅的对话语音，同时还支持笑声、停顿等韵律特征，超越了大部分TTS开源模型。本文手把手部署、AIP使用、搭建可视化WebUI界面体验ChatTTS能力…… ...

本地部署GLM-4-9B清华智谱开源大模型方法和对话效果体验

清华大学和智谱AI推出了全面升级的新一代基座大模型GLM-4，整体性能相比GLM3提升60%，支持128K上下文，可根据用户意图自主理解和规划复杂指令、完成复杂任务…… ...

GPT-4 Turbo 和 GPT-4 的区别

引言人工智能（AI）领域的发展日新月异，OpenAI 的 GPT 系列模型一直是这一领域的佼佼者。GPT-4 和 GPT-4 Turbo 是目前市场上最先进的语言模型之一。本文将详细探讨 GPT-4 和 GPT-4 Turbo 之间的区别，以帮助用户更好地理解和选择适合自己的模型。模型简介 GP ...

什么是LLM大模型训练，详解Transformer结构模型

本文分享自华为云社区《LLM 大模型学习必知必会系列(四)：LLM训练理论篇以及Transformer结构模型详解》，作者：汀丶。 1.模型/训练/推理知识介绍深度学习领域所谓的“模型”，是一个复杂的数学公式构成的计算步骤。为了便于理解，我们以一元一次方程为例子解释： y = ax + b 该方程 ...

国产大语言模型ChatGLM3本地搭建、使用和功能扩展

1、官网 ChatGLM3 2、下载ChatGLM3源码直接在https://github.com/THUDM/ChatGLM3，下载源码 3、下载模型如果显卡8G一下建议下载ChatGLM3-6B，ModelScope是国内的，下载比较快用下面两种方式都可以下载使用git在MadelSco ...

AI大模型时代: 还需要百度吗？

随着人工智能技术的飞速发展，AI大模型已经成为各行各业的变革力量。在信息获取和知识共享方面，大模型的出现似乎对传统搜索引擎提出了挑战, 据不完全统计，国内已经出现数百大模型，更小规模的大模型就更多了。用户已经慢慢更多习惯使用AI来解决遇到的问题，不再是百度一下，未来百度的次数只会越来越少，那未来还 ...

借助AI大模型，三分钟原创一部儿童故事短视频（附完整操作步骤）

前面文章的介绍，我们可以通过在自己笔记本电脑上部署的Llama 3大模型生成文章、文本润色、生成摘要等。今天我们更进一步，在文本的基础上，快速制作一部儿童故事短视频，且可根据自己需要完全原创…… ...

大模型算法办备案全网最详细说明（+附件）

已成功备案产品（近130家，不包括审核中的）一、大模型算法备案的强制性二、生成式人工智能(大语言模型)安全评估要点三、大模型备案必备材料+重点说明四、大模型备案填报流程五、大模型备案时间成本对比六、备案建议附录、过程性材料关于备案咨询不论最终是找我们做备案，还是自己做备案，在备 ...

OpenIM Bot: 用LLM构建企业专属的智能客服

OpenIM Bot 通过结合LLM和RAG技术，构建企业专属的智能客服系统。该系统通过优化向量存储、混合检索和查询分析，解决了LLM的幻觉、新鲜度、token长度和数据安全问题，提升了用户体验。向量存储和预处理步骤确保文档高质量，而混合检索结合文本和语义搜索，增强了检索结果的准确性。通过迭代优化，... ...

什么是Token？为什么大模型要计算Token数

本文分享自华为云社区《【技术分享】什么是Token？为什么GPT基于Token定价》，作者：开天aPaaS小助手Tracy。在使用LLM大模型时，我们经常会遇到一个关键词，叫：Token。比如：最新版 GPT-4 Turbo 模型最高支持 128k token 上下文；曾经 GPT 最强对手 ...

解密Prompt系列30. LLM Agent之互联网冲浪智能体

这一章介绍自主浏览操作网页的WebAgent和数据集：初级MiniWoB++，高级MIND2WEB，可交互WEBARENA，多模态WebVoyager，多轮对话WebLINX，复杂AutoWebGLM ...

使用本地大语言模型和Langchain手搓免费的AI搜索问答助手

1 概述大语言模型虽然已经有了很多的背景知识，但针对模型训练之后新产生的内容，或者领域内的知识进行提问，大模型本身通常无法准确给出回应，一个常用的解决方法是，借助检索增强生成（RAG），将能够用于回答问题的相关上下文给到大模型，利用大模型强大的理解和生成能力，来缓解这个问题。本文主要介绍如何借助 ...

解密Prompt系列29. LLM Agent之真实世界海量API解决方案：ToolLLM & AnyTool

很早之前我们就聊过ToolFormer，Gorilla这类API调用的Agent范式，这一章我们针对真实世界中工具调用的以下几个问题，介绍微调(ToolLLM)和prompt(AnyTool)两种方案。真实世界的API数量庞大且多样：之前的多数工具调用论文，工具数量有限，工具相对简单具体，并且往往 ...

RAG-GPT 实践过程中遇到的挑战

本文介绍了RAG-GPT系统在构建智能客服时遇到的挑战及解决方案。通过结合检索机制和LLM生成能力，RAG系统可以生成上下文相关、准确且最新的信息，减少开发时间和数据清洗需求。文章探讨了RAG系统的核心流程、优势及挑战，并提出了Chunking和Embedding策略、RAG与微调的选择、以及系统测... ...