刷新
Windows本地安装LLaMA-Factory

以下是LLaMA-Factory官方推荐的依赖组件及其版本,如果在linux上安装建议使用表格中的推荐版本,但是在windows上安装时,由于各组件提供的windows版本没有linux版本完备,为了兼容性考虑可节省时间(使用发布的wheel包而不是本地编译),这里并没有完全采用官方推荐的版本。 以 ...

Agent大调查

参考文献:> https://www.kaggle.com/whitepaper-agents > 1.什么是Agent? Baseline:生成式AI模型 Training Aim:访问外部工具、自主规划和执行任务 What we get:具备推理、逻辑和访问外部信息的生成式AI(extended ...

Claude Code免费编程使用指南

博主头像 背景 之前写过文章Claude Code下Kimi-k2模型初试,随着模型发展,我们今天来看看如何免费用Claude code。我们再回顾下他的特性:智能上下文管理ClaudeCode 的持久记忆机制(CLAUDE.md 文件存储项目历史)与 OpenRouter 的多模型调度深度融合,形成「记忆 ...

读大语言模型12读后总结与感想兼导读

博主头像 1. 基本信息 大语言模型 特伦斯•谢诺沃斯基 著 中信出版社,2025年07月出版 1.1. 读薄率 书籍总字数13.7万字,笔记总字数42724字。 读薄率42724÷137000≈31.19% 1.2. 读厚方向 千脑智能 脑机穿越 未来呼啸而来 虚拟人 AI3.0 新机器人 人工不智能:计算 ...

[LangGraph]Human-in-the-loop示例之人工干预shell命令执行

博主头像 前言 看langgraph官方文档感觉human in the loop貌似还挺简单的,但实际上手时,那文档看得我云里雾里的。更详细的Guides和Reference,恕我能力有限,悲摧的也没看懂。作为试验,我想做一个功能:本地执行shell命令,每次执行前都要用户确认。左看官方文档, 右去西天请C ...

读大语言模型11从自然中学习

博主头像 1. 从自然中学习 1.1. 大自然经过演化形成的计算机制虽然看似反直觉,但却能高效解决复杂问题 1.1.1. 这些机制天然适配于大规模并行运算,这与传统计算机追求串行处理的思路有本质区别 1.1.2. 随着并行计算技术的发展,借鉴自然界的解决方案来突破计算瓶颈已成为可能 1.2. 感觉运动系统在脊 ...

AI辅助HP DL360 Gen7服务器维护-安装新硬盘场景

博主头像 背景HP DL360 Gen7 服务器安装新硬盘时,遇到问题如下问题:调研阶段KIMI K2模型我们试用让AI协助解决,第一次使用KIMI K2模型接着继续询问他的回答没有找出问题根本点,而是反馈ORCA自身限制问题,事实情况上只有2块物理硬盘。秘塔搜索最终在秘塔搜索长思考下,定位到问题https: ...

读大语言模型10人工智能进化

博主头像 1. 人工智能进化 1.1. 2023年,人工智能迎来了一个重大突破的里程碑年份 1.1.1. 大语言模型的能力不断增强,不仅改变了人机交互模式,还开启了机器之间的互动可能 1.2. 20世纪60年代,人工智能研究者追求的目标是通过基于直觉的编程来模拟人类智能 1.3. 既然大脑是人类智能的物质基础 ...

AI辅助硬件升级HP DL360 G7之一显卡篇

博主头像 背景 HP DL360 G7以​​1U紧凑设计​​融合了企业级性能、高扩展性与能效管理,尤其适合需平衡空间限制与计算需求的场景。其iLO 3远程管理、动态电源优化及模块化维护设计,大幅降低运维复杂度,成为2010年代初期至中期数据中心的主流选择。尽管目前已停产,二手市场仍常见其用于轻量级虚拟化或存储 ...

读大语言模型09超级智能

博主头像 1. 超级智能 1.1. 如果人工智能超越人类智能,可能会成为人类存在的一个重大威胁 1.1.1. 对超级人工智能潜在危险最为担忧的群体中,恰恰包括那些否认大语言模型具备真正智能的人 1.2. 计算机科学已经成为所有科学领域中不可或缺的重要组成部 1.3. GPT具备编写计算机程序的能力,这意味着它 ...

Qoder特色功能仓库wiki索引

博主头像 背景 前文有《阿里Qoder的Quest小试牛刀》,之前行业中已经有DeepWiki与ZReader, 我们使用相同的开源项目WeKnora进行对比。这个工程包含源代码文件Go文件151个,ts文件15个,Vue文件18个。我们使用Qoder生成Wiki试试:已知后端文件分布在以下主要功能模块:客户 ...

读大语言模型08计算基础设施

博主头像 1. 计算基础设施 1.1. 人工智能专家系统在20世纪70年代风靡一时 1.1.1. 基于规则的程序,目的是获取特定领域的专家知识 1.1.2. 每个专家系统都需要从领域专家处提取规则,并将其转化为特定的逻辑程序 1.1.3. 开发针对特定应用的专家系统不仅耗时长,而且需要投入大量人力 1.2.  ...

"Why Do Multi-Agent LLM Systems Fail?" 论文笔记

博主头像 介绍 (1) 发表:BuildingTrust'25 (2) 背景 尽管对多智能体 LLM 系统(MAS)的热情越来越多,但与单机准则框架相比,它们在流行的基准测试中的性能往往仍然很少。这一差距强调了系统地分析阻碍 MAS 有效性的挑战的必要性 (3) 贡献 对 MAS 执行轨迹进行了首次系统评估, ...

EMNLP 2025|vivo 等提出 DiMo-GUI:模态分治+动态聚焦,GUI 智能体推理时扩展的新范式

博主头像 本文提出了一种无需额外训练的GUI定位框架DiMo-GUI,通过​​逐级缩放动态聚焦​​目标区域减少视觉冗余,并​​分离文本与图标模态​​独立推理后综合评估确定目标,有效平衡多模态能力。在基准测试中性能显著提升,适用于网页导航和移动应用自动化等场景。 ...

1. LangChain4J 理论概述

博主头像 1. LangChain4J 理论概述 目录1. LangChain4J 理论概述最后: LangChain4J 的官方文档:https://docs.langchain4j.dev/ 中文文档地址:https://docs.langchain4j.info/ LangChain4j 的目标是简化将 ...

OWASP AI 测试指南落地

博主头像 将 OWASP AI 测试指南落地:通过非人类身份治理构建安全的 AI 基础 人工智能(AI)正成为现代开发流水线中的核心组件。各行各业都面临着关于如何测试与保护 AI 系统的共同难题——必须同时考虑其复杂性、动态性以及引入的全新风险。全新的 OWASP AI 测试指南正是为了应对这一挑战而生。 这 ...

读大语言模型07高维数学

博主头像 1. 高维数学 1.1. 数学作为人类最重要的智慧成果之一,有望帮助我们揭示大语言模型和人脑的运作奥秘 1.2. 深度学习网络是一种完全透明且可用数学方法分析的复杂数学函数 1.3. 当前,一个专注于探索这些网络模型在高维空间中的几何特性和统计性质的数学新纪元已经来临 1.4. 把各自领域推向一个由 ...

0基础也能搞定!30分钟免费搭建个人网站全攻略

博主头像 你是否也曾想过拥有一个自己的网站,却被复杂的技术术语和步骤吓退?今天,我要分享一个超简单的方法,只需要30分钟,零代码基础也能免费搭建一个属于自己的个人网站! 先搞懂两个核心工具:GitHub和Hexo 在开始动手前,咱们先来认识一下今天的两位主角:GitHub和Hexo。这两个工具就像一对黄金搭档 ...

<1···111213···29>