大模型 - 第16页 - 网站分类

欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族！

欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族！ GPT OSS 是 OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型：拥有 117B 参数的 gpt‑oss‑120b 和拥有 21B 参数的 gpt‑oss‑20b。二者皆采用 ...

"ExpeRepair: Dual-Memory Enhanced LLM-based Repository-Level Program Repair" 论文笔记

介绍 (1) 发表：Arxiv 06.12 (2) 挑战主要探讨了基于 LLM 的 APR 的两个主要类别：代理和程序。尽管这两个范式都表现出希望，但它们依然表现出两个重要的局限性：忽视历史修复经验：现有方法都忽略了从同一存储库中先前解决的问题中积累的宝贵历史经验，而实际上，软件项目在其演变过程 ...

GPT5模型工程重构实践

背景OpenAI于‌北京时间2025年8月8日凌晨1时‌举行了线上发布会，正式推出GPT-5。CodeBuddy IDE，主打“产品-设计-研发部署”全流程一体化，旨在降低开发门槛，尤其适合独立开发者和非技术背景的用户。CodeBuddy整合了PRD、TRD、DRD文档生成、Figma设计稿转网页、 ...

Kimi-K2模型真实项目OOP重构实践

背景笔者写过多个模型OOP重构实践，包括《基于CodeBuddy自定义Agent知识库重构实践》与《Trae智能复杂项目重构实践》，三方与其他主流模型的评测今天我们在Trae来试试Kimi K2模型：实践杂上下文，长度可以满足，一次性对话。我们看重构多个文件还生成一个markdown文档# Thi ...

AI编程：代码多，效果好？

捏着鼻子用多了就会发现：各家模型都有自己擅长的能力，这与不同平台所掌握的优质数据有关系，比如电商跨境，本地生活，内容制作，行业分析等。 ...

"AutoCodeRover: Autonomous Program Improvement" 论文笔记

介绍 (1) 发表：ISSTA'24 (2) 背景软件工程涉及程序改进的过程，特别是软件维护（例如，程序错误修复）和软件演变（例如，功能添加）自动化程序维修任务对实现自动软件工程愿景的重要性。鉴于自动化程序维修的动机，并且开发人员经常花费大量的时间来修复错误。本工作提出了 AutoCodeRov ...

20个AI爱好者必听的顶级播客

20个AI 爱好者必听的顶级播客(含推荐单集)1. TWIML AI 播客The TWIML AI Podcast 深入探讨机器学习与人工智能，邀请业内顶尖专家进行访谈。内容涵盖 AI、机器学习、深度学习、自然语言处理与数据科学。无论你是行业专家、技术型商业领袖，还是科技爱好者，都会有所收获。主持人 ...

HRM(Hierarchical Reasoning Model)部署训练记录

前两天朋友刷到HRM这个27M模型的文章，想让我试着部署训练一下。此文用于记录部署过程前期准备克隆仓库 sapientinc/HRM 安装CUDA 我的CUDA是已经安装好的12.8版本，安装过程不再赘述安装torch torch版本如下 Version: 2.7.1+cu128 pip in ...

"When Large Language Models Confront Repository-Level Automatic Program Repair How Well They Done" 论文笔记

介绍 (1) 发表：ICSE'24 (2) 背景 APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文，从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的，例如 Quixbugs，要么无法准确恢复存储库级错误的方案，例如 Defects4J。本文研究了 ...

百度Comate的AI编程工具小试

背景百度Comate基于文心大模型（ERNIE-Code），结合百度内部编程大数据及GitHub优质开源数据训练，具备深度语义理解能力。支持100+编程语言（如Go、Java、Python、JavaScript等），兼容主流IDE（VS Code、JetBrains系列）。Zulu智能体提示词依然 ...

关于生成式AI对软件工程相关职业影响

背景论文《Working with AI: Measuring the Occupational Implications of Generative AI》。这篇由微软研究院团队撰写的论文，通过分析20万条用户与Microsoft Bing Copilot（现Microsoft Copilot） ...

GLM4.5在线版快速开发实践

背景1. GLM4.5 GLM（General Language Model，通用语言模型）是大语言模型（LLM）的一种技术路线，以支持多模态、长文本理解和复杂推理为特点。GLM4.5的代码生成能力基于对海量代码语料（如GitHub开源项目、技术文档、问答社区）的学习，支持主流编程语言（ ...

CodeGeeX体验GLM4.5模型与实践

背景各模型概要性能评估Ghost Comments看那些右箭头，就是动态注释，没有真实写入文件代码BUG修复总体一般，没有智能体的特色，只有CodeGeeX问答模式。增加注释速度快，但不生成方法头部的注释解释代码文字解释后，生成了流程图实战代码扩展性修改PK提示词@workspace #codeba ...

Git工作面试必知必会操作-命令行篇

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

清华大学软件学院长聘副教授龙明盛：Timer 3.0 已经成为了“满血版”的时序大模型

7 月 5 日，2025 时序数据库技术创新大会在北京成功举办，清华大学软件学院长聘副教授龙明盛在大会上做主题报告《Timer 3.0：新一代生成式时序大模型》，深入剖析当前时间序列分析领域面临的核心挑战，系统阐述了时序大模型的技术演进趋势与行业痛点，并重点分享清华团队自主研发的时序大模型 Time ...

AI营销应用与出海

反思脑图FAQ问：在复合的增长手段之下，如何确定哪一种手段更有效，是否存在数据安慰剂的问题？对于自杀式增长的现象，你们怎么看？答：这是一个有效的问题，我们现在面临的情况是，在复合增长手段中，很难判断哪一种手段更为有效，甚至可能存在数据安慰剂的现象。自杀式增长指的是投入后看到销售同步增长，但不确定这种 ...

cursor1.3 重大更新！复刻 claude code！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

cursor1.3 重大更新！复刻 claude code！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

IT文档中总出现的 hooks 是什么钩子回调

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

【Datawhale AI夏令营--task2】科大讯飞AI大赛（大模型技术）

进入baseline2 开启python编码阶段啦感想：开始的晚了一些，准备环境花了好久哦，好在ai可以帮忙安装环境需要的各种包，并且运行的报错也可以解决。以及硅基流动的免费api超级慢TT，遍历数据花费的时间过长了。听到分享会上可以用阿里百炼的api，但在调用上还有些问题，接下来要再多试一 ...