一、引言 Loop Engineering 这个词最近又热起来了。 如果你从去年开始关注 AI 工程化领域的动态,大概已经习惯了这种概念迭代的节奏——Prompt Engineering 还没完全消化,Context Engineering 就登场了;Harness Engineering 的论文刚 ...
最近在加班加点的做一个Token工厂, 模式类似与京东:有自营算力产生的模型,也外接第三方旗舰模型。 作为Token聚合分发平台,帮助文档是刚性需求。 Docsify是一个将Markdown文件转换为单页面静态网站(无需任何构建过程)的开源项目,实测下来3min就能构建并搭建一个 帮助文档站点。 1 ...
Adaptive Boosting(自适应提升)基于Boosting思想实现的一种集成学习;算法核心思想是:通过逐步提高那些被前一步分类错误的样本的权重来训练一个强分类器。 本章会讲解Adaboost算法推导过程,并用一个数值实例带着读者计算,使读者能够完全理解这个训练弱分类器至强分类器构建的过程。 ...
前面的文章依次介绍了如何截断历史会话的对话记录,包括按照记录数量截断、按照Token长度截断,以及浓缩为摘要截断等等,其中摘要操作又分为三大类: 1、使用第三方的摘要库对文本摘要; 2、使用在线大模型对文本摘要; 3、使用离线大模型对文本摘要; 以上对会话记录的各种处理操作,统称为AI应用的上下文 ...
一、前言 作为一名普通开发人员,我对 AI 工具的上手其实算比较晚。今年五月以前,基本还只是把 AI 当作聊天机器人使用。有时听同事提到一些关键词都听不懂,甚至不知道该如何提问,心里多少有些惭愧。直到最近因为一个契机,沉下心认真摸索了一段时间,才真正感受到 AI 工具的魅力和强大,也切身体会到它对生 ...
LLM具有固化的知识,而且针对LLM的调用是完全无状态,永远只做一锤子买卖。但是交给Agent的任务基本上不可能一蹴而就,而且还希望Agent具有学习进化的能力。所以你会发现,很多的Harness手段的目的就是为了弥合两者之间的鸿沟。解决这个问题的基本的前提是:需要赋予Agent记忆。 ...
AI创造是大规模模式重组:文本靠自回归预测,图像靠扩散从噪声还原,代码靠Code LLM学习千万仓库。DeepSeekV4编程成本1美元,Suno文字生成歌曲。AI不知何为美但见过足够美,所以能生成美。 ...
AI Agent 全日制30天速成|Day4 教学笔记 今日总学习目标 理解Agent规划、任务拆解核心思想,掌握ReAct、Plan-Solve标准推理框架 基于前3天代码,实现自主任务拆解Agent(复杂问题自动拆分多子任务) 实现多工具串行/并行调度、任务状态管理、失败子任务重试机制 整合RA ...
本文针对CUDA设备端跨线程块同步需求,在计算能力低于9.0(如RTX 4090 8.9、V100 7.0)无法使用集群同步的情况下,通过分析协作组grid.sync()源码,揭示了其基于屏障变量原子自增与符号位翻转的软件实现机制。借鉴该原理,设计并实现了一种自定义的跨块同步函数sync_ctas,... ...
\(\text{0x01}\). 问题定义 \(\text{Problem}\space \text{Definition}\). 最近公共祖先简称\(\text{LCA}\)。两个节点的最近公共祖先,就是这两个点的公共祖先里面,离根最远的那个。 为了方便,我们记某点集 \(S=\{v_1,v_2, ...
Windows 局域网文件共享实战:解决"账户被禁用"与"网络访问拒绝"问题 本文记录了一次 Windows 局域网文件共享的完整排错过程,从最基础的网络连通性检查,到本地安全策略配置,再到 NTFS 权限设置,最终实现两台电脑之间的文件传输。文中所有 IP 地址、用户名、主机名均为示例,实际操作时 ...
TokenJuice 的解决方案也足够优雅——不引入额外的 LLM 调用,不牺牲确定性,不增加外部依赖,用静态规则 + 流水线处理,在 < 5ms 内完成 50%-95% 的压缩。Fail-open 的设计哲学、三层规则配置体系、NativeAOT 兼容性,都体现了对生产环境的深刻理解。 ...
上一篇我们把现代大模型的五个核心模块拼回了 LLaMA 这个完整案例中,可以看到注意力机制仍然是计算最密集的部分。 而这个密集程度在序列变长时,会变得越来越恐怖: 标准自注意力的计算复杂度和空间复杂度都是 \(O(n^2)\):序列长度翻倍,计算量翻四倍,内存占用也翻四倍。 而在之前,我们用 KV ...
Windows 下构建 liboqs-java,实现 PQC 算法的调用 liboqs-java 本身不是一个纯 Java 库,它底层依赖 liboqs 这个 C 语言实现的后量子密码学库。也就是说,我们最终虽然是在 Java / Spring Boot 项目里调用 PQC 算法,但真正执行算法逻辑 ...
AI时代下,技术真的“平权”了吗?我们还要怎样“死磕”细节? 前言 最近这两年,各种AI编码助手和代码大模型呈爆发式增长。只要能写清楚Prompt,无论是生成一个带有Tailwind CSS的高保真数据大屏,还是快速搭建一个包含基础频控逻辑的短信平台MVP,甚至是写一段复杂的复杂不规则框客流统计算法 ...
漏洞核心原理一 CVE-2021-4034 (PwnKit) 的核心原理在于 pkexec 程序对命令行参数处理的一个越界读取(Out-of-bounds Read)漏洞,以及由此引发的环境变量写入。 参数处理越界 在 Linux 中,一个程序的 main 函数接收两个重要的参数:argc(参数数量 ...
上周一,我们组的会议纪要还要靠小陈手工整理,开完一个小时的早会,她要再花 40 分钟敲完发出来。同一天,她旁边的同事开完会直接站起来去喝咖啡,3 分钟后纪要已经在群里了。 不是谁效率高低的问题,是用没用对工具的问题。 我在后端做了 10 年,最近两个季度把职场 AI 工具摸了个遍。今天把我们实际跑通 ...
PHP 泛型之殇 泛型 RFC 提案被拒绝 PHP 开发者眼中的泛型现实 PHP 很可能不会迎来泛型。这并非什么新鲜事。一些核心开发者撰写了详尽的技术博客,阐述为什么运行时擦除式泛型不是个好主意,以及他们为何对当前的 RFC 投下反对票。 然而,PHP 社区中还有另一群人,他们非常支持这个 RFC, ...
Pi Agent 对接实现:消息解析、重试与取消 接一个 CLI 形态的 AI agent,绕不开三件事:怎么把它私有的事件流翻译成稳定消息、失败之后到底谁负责重试、用户点取消时进程怎么干净地停。其实这三件事说穿了,不过是"分清职责"罢了,只是真做起来,才知道水有多深。 背景 最近我在做一个 AI ...
DeepSeek能帮你解数学题、改合同、读文献,但它给出的答案里可能充斥着信誓旦旦但子虚乌有的事实和引用,这源于其推理能力的根本局限。 ...