刷新
GPT5写5000行代码,行不行?

博主头像 GPT-5智能提升多少很难说,相信后面更深度的体验才能感受到它的优缺点。从目前的感受而已,很有主动性,积极建议下一步动作,感觉多了一个催我干活的队友。 ...

GLM4.5V视觉模型小试牛刀

博主头像 背景GLM4.5V 是智谱AI于2025年8月11日发布的开源视觉推理模型,基于新一代旗舰文本基座模型 GLM-4.5-Air 开发,延续了 GLM-4.1V-Thinking 技术路线。参数规模:总参数 106B,激活参数 12B。 性能表现:在 41 个公开视觉多模态任务中,综合效果达到同级别开 ...

"ExpeRepair: Dual-Memory Enhanced LLM-based Repository-Level Program Repair" 论文笔记

博主头像 介绍 (1) 发表:Arxiv 06.12 (2) 挑战 主要探讨了基于 LLM 的 APR 的两个主要类别:代理和程序。尽管这两个范式都表现出希望,但它们依然表现出两个重要的局限性: 忽视历史修复经验:现有方法都忽略了从同一存储库中先前解决的问题中积累的宝贵历史经验,而实际上,软件项目在其演变过程 ...

GPT5模型工程重构实践

博主头像 背景OpenAI于‌北京时间2025年8月8日凌晨1时‌举行了线上发布会,正式推出GPT-5。CodeBuddy IDE,主打“产品-设计-研发部署”全流程一体化,旨在降低开发门槛,尤其适合独立开发者和非技术背景的用户。CodeBuddy整合了PRD、TRD、DRD文档生成、Figma设计稿转网页、 ...

Kimi-K2模型真实项目OOP重构实践

博主头像 背景 笔者写过多个模型OOP重构实践,包括《基于CodeBuddy自定义Agent知识库重构实践》与《Trae智能复杂项目重构实践》,三方与其他主流模型的评测今天我们在Trae来试试Kimi K2模型:实践杂上下文,长度可以满足,一次性对话。我们看重构多个文件还生成一个markdown文档# Thi ...

"AutoCodeRover: Autonomous Program Improvement" 论文笔记

博主头像 介绍 (1) 发表:ISSTA'24 (2) 背景 软件工程涉及程序改进的过程,特别是软件维护(例如,程序错误修复)和软件演变(例如,功能添加) 自动化程序维修任务对实现自动软件工程愿景的重要性。鉴于自动化程序维修的动机,并且开发人员经常花费大量的时间来修复错误。本工作提出了 AutoCodeRov ...

20个AI爱好者必听的顶级播客

博主头像 20个AI 爱好者必听的顶级播客(含推荐单集)1. TWIML AI 播客The TWIML AI Podcast 深入探讨机器学习与人工智能,邀请业内顶尖专家进行访谈。内容涵盖 AI、机器学习、深度学习、自然语言处理与数据科学。无论你是行业专家、技术型商业领袖,还是科技爱好者,都会有所收获。主持人 ...

HRM(Hierarchical Reasoning Model)部署训练记录

博主头像 前两天朋友刷到HRM这个27M模型的文章,想让我试着部署训练一下。此文用于记录部署过程 前期准备 克隆仓库 sapientinc/HRM 安装CUDA 我的CUDA是已经安装好的12.8版本,安装过程不再赘述 安装torch torch版本如下 Version: 2.7.1+cu128 pip in ...

"When Large Language Models Confront Repository-Level Automatic Program Repair How Well They Done" 论文笔记

博主头像 介绍 (1) 发表:ICSE'24 (2) 背景 APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文,从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的,例如 Quixbugs,要么无法准确恢复存储库级错误的方案,例如 Defects4J。本文研究了 ...

百度Comate的AI编程工具小试

博主头像 背景百度Comate基于文心大模型(ERNIE-Code),结合百度内部编程大数据及GitHub优质开源数据训练,具备深度语义理解能力。 支持100+编程语言(如Go、Java、Python、JavaScript等),兼容主流IDE(VS Code、JetBrains系列)。Zulu智能体提示词依然 ...

GLM4.5在线版快速开发实践

博主头像 背景1. GLM4.5​​ GLM(General Language Model,通用语言模型)是大语言模型(LLM)的一种技术路线,以支持多模态、长文本理解和复杂推理为特点。GLM4.5的代码生成能力基于对海量代码语料(如GitHub开源项目、技术文档、问答社区)的学习,支持​​主流编程语言​​( ...

CodeGeeX体验GLM4.5模型与实践

博主头像 背景各模型概要性能评估Ghost Comments看那些右箭头,就是动态注释,没有真实写入文件代码BUG修复总体一般,没有智能体的特色,只有CodeGeeX问答模式。增加注释速度快,但不生成方法头部的注释解释代码文字解释后,生成了流程图实战代码扩展性修改PK提示词@workspace #codeba ...

Git工作面试必知必会操作-命令行篇

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

清华大学软件学院长聘副教授龙明盛:Timer 3.0 已经成为了“满血版”的时序大模型

博主头像 7 月 5 日,2025 时序数据库技术创新大会在北京成功举办,清华大学软件学院长聘副教授龙明盛在大会上做主题报告《Timer 3.0:新一代生成式时序大模型》,深入剖析当前时间序列分析领域面临的核心挑战,系统阐述了时序大模型的技术演进趋势与行业痛点,并重点分享清华团队自主研发的时序大模型 Time ...

AI营销应用与出海

博主头像 反思脑图FAQ问:在复合的增长手段之下,如何确定哪一种手段更有效,是否存在数据安慰剂的问题?对于自杀式增长的现象,你们怎么看?答:这是一个有效的问题,我们现在面临的情况是,在复合增长手段中,很难判断哪一种手段更为有效,甚至可能存在数据安慰剂的现象。自杀式增长指的是投入后看到销售同步增长,但不确定这种 ...

cursor1.3 重大更新!复刻 claude code!

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

cursor1.3 重大更新!复刻 claude code!

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

<1···131415···29>