上一页 1 2 3 4 5 6 ··· 12 下一页
摘要: 如书中所说算法很快收敛,但是实验发现结果不稳定。有待进一步探究。 ε-贪婪蒙特卡洛控制:5×5 网格世界实战 场景设定与实验目标 环境:\(5\times 5\) 网格,左上角为 \((1,1)\)。 动作集合:上、下、左、右、不动,共 5 个确定性动作。 奖励: 出格:\(-1\) 禁区(橙色格子 阅读全文
posted @ 2026-01-02 08:39 wlu 阅读(21) 评论(0) 推荐(0)
摘要: 网格世界价值迭代(Value Iteration)完整示例 注: 本文参照 《强化学习中的数学原理》一书,4.1章节“价值优化”部分的,例子是4.2策略优化中的数据。 代码借助AI一步步写出 代码大循环(Bellman Optimalty Equation直接求解V,只需要一次迭代)迭代111次 对 阅读全文
posted @ 2026-01-01 14:39 wlu 阅读(39) 评论(0) 推荐(0)
摘要: 网格世界策略评估与策略改进(5 动作) 注: 本文参照 《强化学习中的数学原理》一书,4.2章节“策略优化”部分的。 代码借助AI一步步写出,在复现算法过程中,中间结果与书中不一样。 代码大循环迭代17次 https://github.com/MathFoundationRL/Book-Mathem 阅读全文
posted @ 2026-01-01 13:55 wlu 阅读(41) 评论(0) 推荐(0)
摘要: Here’s a clear summary of what you learned and the workflow for using GitHub Copilot and OpenSpec for Spec-Driven Development (SDD) initiation: ┌───── 阅读全文
posted @ 2025-12-17 18:03 wlu 阅读(376) 评论(0) 推荐(0)
摘要: Blender及Trae Blender MCP安装、配置与调试详细过程 一、Trae Blender MCP安装 安装uv 安装途径选择:在Trae平台安装Blender MCP时,明确不能通过Marketplace创建MCP,必须采用手动安装方式,避免因错误安装途径导致安装失败。 配置文件设置: 阅读全文
posted @ 2025-04-25 12:35 wlu 阅读(1577) 评论(0) 推荐(0)
摘要: 决策树算法总结 决策树算法总结 基本概念 决策树是一种基本的分类与回归方法,通过对特征空间进行划分构建树形结构以实现决策。它由节点和有向边构成,内部节点代表一个特征或属性,分支是该特征的不同取值,叶节点表示类别或值。其核心思想是依据特征的不同取值对数据集进行递归划分,直至满足停止条件。 信息论相关概 阅读全文
posted @ 2025-03-15 15:53 wlu 阅读(146) 评论(0) 推荐(0)
摘要: 1. 朴素贝叶斯算法总结 1.1 模型 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布;然后基于此模型,对给定的输入 \(x\),利用贝叶斯定理求出后验概率最大的输出 \(y\)。 设输入空间 \(\mathcal{ 阅读全文
posted @ 2025-03-14 21:12 wlu 阅读(411) 评论(0) 推荐(0)
摘要: 1. KNN算法和KD - tree总结 1.1 KNN算法 模型 K近邻(K - Nearest Neighbors,KNN)算法是一种基本的分类与回归方法。它的模型实际上是对特征空间的划分,给定一个训练数据集,对于新的输入实例,在训练数据集中找到与该实例最邻近的 \(K\) 个实例,然后根据这 阅读全文
posted @ 2025-03-14 19:47 wlu 阅读(218) 评论(0) 推荐(0)
摘要: 感知器模型数学理论 感知器(Perceptron)是一种二分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别(取 +1 和 -1)。 模型定义 给定一个输入向量 \(\mathbf{x} = (x_1, x_2, \cdots, x_n)^T\),感知器模型的输出 \(y\) 由以下公式计 阅读全文
posted @ 2025-03-13 23:18 wlu 阅读(113) 评论(0) 推荐(0)
摘要: 这本书的第一部分塑造了你的思维。我们了解了 AI 是什么和不 是什么,帮助您设定期望。我们没有将 AI 视为取代您工作的机器人,而是 了解到 AI 可以成为一种实用的商业工具。您现在可以使用它来提高生产 力、减少人为错误,甚至增加收入。我们还了解到,AI 并不是解决所有问 题的灵丹妙药。它适用于具有 阅读全文
posted @ 2024-12-26 10:52 wlu 阅读(87) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 12 下一页