刷新
首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级

博主头像 本文分享自华为云社区《首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级》,作者: 华为云头条。 近日,在中国信通院组织的首轮代码大模型评估中,华为技术有限公司的华为云盘古研发大模型最终获得4+级,成为国内首批通过该项评估的企业之一。 参与本次评估的华为云盘古研发大模型在研发场景丰富度方面 ...

GlaDS缘起

博主头像 ​ 题目:Modeling channelized and distributed subglacial drainage in two dimensions 近年来,冰盖表面融化与冰盖动态之间的联系及其对海平面上升的影响引起了广泛关注。特别是格陵兰冰盖的研究显示,表面融水显著影响冰川移动速度,而冰 ...

聊聊GLM-4-9B开源模型的微调loss计算

博主头像 概述 Github官方地址:GLM-4 网上已经有很多关于微调的文章,介绍各种方式下的使用,这里不会赘述。我个人比较关心的是微调时的loss计算逻辑,这点在很多的文章都不会有相关的描述,因为大多数人都是关心如何使用之类的应用层,而不是其具体的底层逻辑,当然咱也说不清太底层的计算。 可了解其它loss ...

GPT-4 Turbo 和 GPT-4 的区别

博主头像 引言 人工智能(AI)领域的发展日新月异,OpenAI 的 GPT 系列模型一直是这一领域的佼佼者。GPT-4 和 GPT-4 Turbo 是目前市场上最先进的语言模型之一。本文将详细探讨 GPT-4 和 GPT-4 Turbo 之间的区别,以帮助用户更好地理解和选择适合自己的模型。 模型简介 GP ...

什么是LLM大模型训练,详解Transformer结构模型

博主头像 本文分享自华为云社区《LLM 大模型学习必知必会系列(四):LLM训练理论篇以及Transformer结构模型详解》,作者:汀丶。 1.模型/训练/推理知识介绍 深度学习领域所谓的“模型”,是一个复杂的数学公式构成的计算步骤。为了便于理解,我们以一元一次方程为例子解释: y = ax + b 该方程 ...

AI大模型时代: 还需要百度吗?

随着人工智能技术的飞速发展,AI大模型已经成为各行各业的变革力量。在信息获取和知识共享方面,大模型的出现似乎对传统搜索引擎提出了挑战, 据不完全统计,国内已经出现数百大模型,更小规模的大模型就更多了。 用户已经慢慢更多习惯使用AI来解决遇到的问题,不再是百度一下,未来百度的次数只会越来越少,那未来还 ...

大模型算法办备案全网最详细说明(+附件)

​ 已成功备案产品(近130家,不包括审核中的) 一、大模型算法备案的强制性 二、生成式人工智能(大语言模型)安全评估要点 三、大模型备案必备材料+重点说明 四、大模型备案填报流程 五、大模型备案时间成本对比 六、备案建议 附录、过程性材料 关于备案咨询 不论最终是找我们做备案,还是自己做备案,在备 ...

OpenIM Bot: 用LLM构建企业专属的智能客服

博主头像 OpenIM Bot 通过结合LLM和RAG技术,构建企业专属的智能客服系统。该系统通过优化向量存储、混合检索和查询分析,解决了LLM的幻觉、新鲜度、token长度和数据安全问题,提升了用户体验。向量存储和预处理步骤确保文档高质量,而混合检索结合文本和语义搜索,增强了检索结果的准确性。通过迭代优化,... ...

使用本地大语言模型和Langchain手搓免费的AI搜索问答助手

1 概述 大语言模型虽然已经有了很多的背景知识,但针对模型训练之后新产生的内容,或者领域内的知识进行提问,大模型本身通常无法准确给出回应,一个常用的解决方法是,借助检索增强生成(RAG),将能够用于回答问题的相关上下文给到大模型,利用大模型强大的理解和生成能力,来缓解这个问题。 本文主要介绍如何借助 ...

RAG-GPT 实践过程中遇到的挑战

博主头像 本文介绍了RAG-GPT系统在构建智能客服时遇到的挑战及解决方案。通过结合检索机制和LLM生成能力,RAG系统可以生成上下文相关、准确且最新的信息,减少开发时间和数据清洗需求。文章探讨了RAG系统的核心流程、优势及挑战,并提出了Chunking和Embedding策略、RAG与微调的选择、以及系统测... ...

<1···567···15>