今年春节,好消息不断,其中DeepSeek 的刷屏,真是振奋了国人的心。 DeepSeek 是一个基于 Transformer 架构的高性能语言模型,专注于提供高效的推理能力和定制化支持。它适用于多种自然语言处理任务,如文本生成、对话系统、代码补全等。DeepSeek 的设计目标是让用户能够在本地设 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 0 前言 Dify的一个“应用”指基于LLM构建的实际场景应用。通过创建应用,可将智能 AI 技术应用于特定的需求。它既包含了开发 AI 应用的工程范式,也包含了具体的交付物。 一个应用为开发者交付: 封装友好的 API,可由后端 ...
LangChain 核心模块学习:Chains 对于简单的大模型应用,单独使用语言模型(LLMs)是可以的。 但更复杂的大模型应用需要将 LLMs 和 Chat Models 链接在一起。 要么彼此链接,要么与其他组件链接。 LangChain 为这种“链式”应用程序提供了 Chain 接口。 La ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 流量:某个时间段内的所有请求,通过手段把发送到A应用的所有请求录制,然后把这些请求统一转发到B应用,让B应用接收到的请求参数跟A应用一致,实现A接收到的请求在B应用里面重新请求了一遍。整个过程即“流量回放”。 1 流量回放的意义 ...
字节跳动技术团队近日正式推出AI代码编辑器Trae(官网:https://www.trae.ai/),这款定位为「自适应AI IDE」的开发工具,凭借其创新功能组合在技术圈引发关注。作为面向下一代开发者的智能编程平台,Trae正在重新定义人机协作的编码体验。 一、核心亮点解析 双模大模型免费开放 T ...
Gemini 2.0 Flash 是谷歌最新推出的大型语言模型(LLM),它将人工智能的能力推向了新的边界。本文将深入探讨其关键特性,以及这些特性如何使其与其他知名模型区分开来。Gemini 与其他 LLM 的主要区别在于其多模态能力和高级推理能力。与许多主要专注于文本的 LLM 不同,Gemini ...
原作:阿尔贝托·罗梅罗 与 o1 相比,R1 的表现如何? DeepSeek 在六个相关基准(如 GPQA Diamond 和 SWE-bench Verified)以及其他替代测试(如 Codeforces 和 AIME)上对 R1 和 o1 进行了一对一比较。列表中遗漏了 ARC-AGI 和 F ...
一、环境准备 1. 安装VSCode 访问 Visual Studio Code官网 下载并安装最新版本 2. 安装IDEA(运行Java项目) 访问IDEA官网下载并安装最新Community社区版 二、Roo Code插件配置 1. 安装插件 打开VSCode扩展市场(Ctrl+Shift+X) ...
一、Cline:AI编程的通用解决方案 (项目地址:https://github.com/cline/cline) Cline作为一款开源的VS Code AI编程插件,通过集成前沿的机器学习模型,为开发者提供了智能化的编码体验。其核心功能包括: 智能代码补全 基于上下文感知的代码预测功能,支持主流 ...
0 前言 基于Dify现有能力,已能对不少业务场景提供帮助,但对一些特定诉求,还要借助其扩展机制,本文利用翻译场景举例详细说明。 1 翻译场景复杂性分析 翻译是从简单到复杂各级都存在的场景,比较简单的翻译可能一句简单 Prompt,但对复杂、效果要求较高翻译场景,可能需要一些复杂 LLM 编排,如吴 ...
LangChain 是什么 Langchain 是一个开源框架,它允许开发人员将大型语言模型与外部的计算和数据源结合起来,是一个通过组合模块和能力抽象来扩展 LLM 的助手 为什么需要 LangChain 增强语言模型的功能: LangChain 提供了可以将语言模型与各种数据源(如数据库、WebA ...
在追剧的时候经常能看到一些浪漫的告白桥段,男主用圣诞彩灯表白、用城市标志性建筑的LED表白,或者在五光十色的烟花绽放后刻下女主角的名字,充满了仪式感和氛围感~ 现在,这样的表白效果用AI软件就能实现了,在社交平台上甚至还出现了类似的直播内容,观众送热气球或者其他礼物,主播就把他们打出来的名字放进视频 ...
没想到新年最热闹的地方之一会是互联网,刷爆朋友圈的除了新年祝福还有DeepSeek。揣着一颗好奇心试了试,竟有一种发现新大路的感觉。估计是围观的人太多,在线的版本有时候会出现连不上的情况,好奇心驱使之下想尝试本地部署。 方案 本地化方案非常简单:Ollama + DeepSeek-R1 + Ench ...
由于Ollama的exe安装软件双击安装的时候默认是在C盘,以及后续的模型数据下载也在C盘,导致会占用C盘空间,所以这里单独写了一个自定义安装Ollama安装目录的教程。 Ollama官网地址:https://ollama.com/ 这里有些朋友可能会遇到无法下载的问题,这里提供我下载好的软件包给大 ...
0 你的问题,我知道! 工作意义是啥?职业发展在人生啥角色? 1 工作意义 农村人努力学习考上大学,得好工作,为逃离同村同龄人十几岁就工厂打工命运,过不凡人生,实现改命的唯一途径。毕业就进入自带光环的大厂,有份让所有亲戚羡慕的公司和薪水。我认为工作价值是让自己自立,改变命运。 但现实挑战才开始。 工 ...
新春开发 Cocos 3D 微信小游戏计划的第 4 天,包括游戏资源设计建议,如 UI 背景自适应、碰撞检测组件选用;游戏控制逻辑设计方面,包括组件层级管理及核心代码框架,还有配置中心和消息中心代码,所有的资源与代码均可免费下载…… ...
highlight: a11y-dark theme: channing-cyan 五、调用智谱 AI 1. ChatGLM 大模型 智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度 ...
0 你的问题,我知道! 和大厂朋友聊天,他感叹原来努力干活,做靠谱研发,积累职场经验,干下来,职业发展一般问题不大。而如今大厂“年轻化”,靠谱再不能为自己续航,企业似乎也不愿意持续为经验买单。 在这不确定时代,职业发展中有无硬通货? 更长远职业发展角度: 要抓住机会 要抵御风险,构建自己的职业发展护 ...
简述 前段时间推出的DeepSeek R1推理模型,与传统的大型语言模型有些不同,它能模拟逐步思考的过程,将复杂问题分解为更小的逻辑步骤,再得出解决方案,在数学推理、编程辅助和决策制定等需要深度理解的任务上表现更出色。这里也提供了两种方法来本地运行官方开源的模型。 文章文件 喜欢的朋友可以关注一下公 ...
写在前面 如题,近期优秀的大模型层出不穷。作为技术人,需要阅读高质量的AI技术报告或论文,并且掌握未来应用趋势。本文将推荐一些高质量的AI技术报告,以及Agent智能体综述。 大模型技术报告 DeepSeek-V3 Technical Report 作者:DeepSeek 时间:2024.12.27 ...