wlu - 博客园

2026年1月2日

摘要：如书中所说算法很快收敛，但是实验发现结果不稳定。有待进一步探究。 ε-贪婪蒙特卡洛控制：5×5 网格世界实战场景设定与实验目标环境：\(5\times 5\) 网格，左上角为 \((1,1)\)。动作集合：上、下、左、右、不动，共 5 个确定性动作。奖励：出格：\(-1\) 禁区（橙色格子阅读全文

posted @ 2026-01-02 08:39 wlu 阅读(21) 评论(0) 推荐(0)

2026年1月1日

RL 价值优化（4.1章节）

摘要：网格世界价值迭代（Value Iteration）完整示例注：本文参照《强化学习中的数学原理》一书，4.1章节“价值优化”部分的，例子是4.2策略优化中的数据。代码借助AI一步步写出代码大循环（Bellman Optimalty Equation直接求解V，只需要一次迭代）迭代111次对阅读全文

posted @ 2026-01-01 14:39 wlu 阅读(39) 评论(0) 推荐(0)

RL 策略优化（4.2章节）

摘要：网格世界策略评估与策略改进（5 动作）注：本文参照《强化学习中的数学原理》一书，4.2章节“策略优化”部分的。代码借助AI一步步写出，在复现算法过程中，中间结果与书中不一样。代码大循环迭代17次 https://github.com/MathFoundationRL/Book-Mathem 阅读全文

posted @ 2026-01-01 13:55 wlu 阅读(41) 评论(0) 推荐(0)

2025年12月17日

SDD: Github Copilot + OpenSpec

摘要： Here’s a clear summary of what you learned and the workflow for using GitHub Copilot and OpenSpec for Spec-Driven Development (SDD) initiation: ┌───── 阅读全文

posted @ 2025-12-17 18:03 wlu 阅读(376) 评论(0) 推荐(0)

2025年4月25日

Trae + Blender MCP

摘要： Blender及Trae Blender MCP安装、配置与调试详细过程一、Trae Blender MCP安装安装uv 安装途径选择：在Trae平台安装Blender MCP时，明确不能通过Marketplace创建MCP，必须采用手动安装方式，避免因错误安装途径导致安装失败。配置文件设置：阅读全文

posted @ 2025-04-25 12:35 wlu 阅读(1577) 评论(0) 推荐(0)

2025年3月15日

决策树算法总结

摘要：决策树算法总结决策树算法总结基本概念决策树是一种基本的分类与回归方法，通过对特征空间进行划分构建树形结构以实现决策。它由节点和有向边构成，内部节点代表一个特征或属性，分支是该特征的不同取值，叶节点表示类别或值。其核心思想是依据特征的不同取值对数据集进行递归划分，直至满足停止条件。信息论相关概阅读全文

posted @ 2025-03-15 15:53 wlu 阅读(146) 评论(0) 推荐(0)

2025年3月14日

朴素贝叶斯 Naïve Bayes = 贝叶斯公式 (Bayes) ➕ 条件独立假设（Naïve）

摘要： 1. 朴素贝叶斯算法总结 1.1 模型朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入输出的联合概率分布；然后基于此模型，对给定的输入 \(x\)，利用贝叶斯定理求出后验概率最大的输出 \(y\)。设输入空间 \(\mathcal{ 阅读全文

posted @ 2025-03-14 21:12 wlu 阅读(411) 评论(0) 推荐(0)

K近邻算法等

摘要： 1. KNN算法和KD - tree总结 1.1 KNN算法模型 K近邻（K - Nearest Neighbors，KNN）算法是一种基本的分类与回归方法。它的模型实际上是对特征空间的划分，给定一个训练数据集，对于新的输入实例，在训练数据集中找到与该实例最邻近的 \(K\) 个实例，然后根据这阅读全文

posted @ 2025-03-14 19:47 wlu 阅读(218) 评论(0) 推荐(0)

2025年3月13日

第二章感知机

摘要：感知器模型数学理论感知器（Perceptron）是一种二分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别（取 +1 和 -1）。模型定义给定一个输入向量 \(\mathbf{x} = (x_1, x_2, \cdots, x_n)^T\)，感知器模型的输出 \(y\) 由以下公式计阅读全文

posted @ 2025-03-13 23:18 wlu 阅读(113) 评论(0) 推荐(0)

2024年12月26日

Book notes: The Business Case for AI: A Leader's Guide to AI Strategies, Best Practices & Real-World Applications

摘要：这本书的第一部分塑造了你的思维。我们了解了 AI 是什么和不是什么，帮助您设定期望。我们没有将 AI 视为取代您工作的机器人，而是了解到 AI 可以成为一种实用的商业工具。您现在可以使用它来提高生产力、减少人为错误，甚至增加收入。我们还了解到，AI 并不是解决所有问题的灵丹妙药。它适用于具有阅读全文

posted @ 2024-12-26 10:52 wlu 阅读(87) 评论(0) 推荐(0)

Data and AI

公告