基于动态规划的强化学习算法 学习「强化学习」(基于这本教材,强烈推荐)时的一些总结,在此记录一下。 在马尔可夫决策过程 环境模型已知(也就是状态转移函数P、奖励函数r已知)的情况下,我们可以通过 「动态规划」 求得马尔可夫决策过程的最优策略 \(\pi^*\) 。 1. 动态规划 对于做过算法题目的 ...
背景 Mixup(混合) 定义 对于一个样本\((x_i,y_i)\),将其与另一个样本\((x_j,y_j)\)混合: \[\begin{aligned} \tilde{x}_i &= \lambda x_i + (1-\lambda)x_j, \\ \tilde{y}_i &= \lambda ...
马尔可夫决策过程 个人在学习「马尔可夫过程」时(基于这本教材,强烈推荐),做了些总结,并将遇到了一些感到困惑自我解答了,在此整理并记录一下。 1. 马尔可夫性质 简单的一句话:当前状态 只取决于上一时刻 的状态。这个视频很生动地解释了这一性质。 2. 马尔可夫过程 「马尔可夫过程」也叫「马尔可夫链」 ...
准备数据 加载数据集 MNIST from torchvision import datasets, transforms transform = transforms.Compose([ transforms.ToTensor(), # value of pixel: [0, 255] -> [0 ...
AUC是推荐系统常用的线下评价指标,其全称是Area Under the Curve。这里的Curve一般是指ROC(受试者操作曲线,Receiver operating characteristic),所以我们所说的AUC一般是指AUROC。 本文将沿分类阈值 -> 混淆矩阵 -> ROC -> ...
Numpy 高维空间中的轴 (axis) 完成日期: 2024-03-01 更新日期: 2024-03-01 问题 Numpy 中有众多操作会涉及到一个参数 axis, 也就是 轴. 这到底是什么? 沿着某轴操作 (例如 np.sum(axis=0)) 又是什么意思? 对于低维数组, 或许可以按 行 ...
论文标题:Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion 论文作者:Yangming Zhou, Yuzhou Yang, Qichao Ying, Zhenxing Qian, ...
在Kaggle竞赛中,要求我们应用时间序列预测,根据厄瓜多尔大型杂货零售商Corporación Favorita的数据预测商店销售情况,建立一个模型,准确地预测在不同商店销售的商品的单位销量。准确的预测可以减少与库存过多相关的食物浪费,提高客户满意度。 在六个可用的数据文件中,我们分析了其中的三... ...
可视化模型在测试样本中的表现为我们的评估增添了一个引人入胜、富有洞察力的维度。通过图形表示,我们可以更直观地了解模型在不同实例中的表现。通过这种可视化的探索,我们可以发现一些模式、趋势或潜在的改进领域,而这些在数字指标中可能并不明显。让我们深入研究可视化表示,揭示模型在测试数据上表现的细微差别。 ...
Homework3 数据集下载 在本地环境下进行实验总是令人安心,但是又苦于网上找不到数据集,虽然kaggle上有数据集但是下载存在问题 于是有了一个天才的想法,间接从kaggle上下载(利用output文件夹中的文件是可下载这一机制将数据集从input文件夹拷贝到output文件夹),具体操作如下 ...
本文介绍了一种基于深度学习的玉米病虫害检测系统系统的代码,采用最先进的YOLOv8算法并对比YOLOv7、YOLOv6、YOLOv5等算法的结果·,能够准确识别图像、视频、实时视频流以及批量文件中的玉米病虫害。文章详细解释了YOLOv8算法的原理,并提供了相应的Python实现代码、训练数据集,以及... ...
模型持久化(模型保存与加载)是机器学习完成的最后一步。因为,在实际情况中,训练一个模型可能会非常耗时,如果每次需要使用模型时都要重新训练,这无疑会浪费大量的计算资源和时间。 通过将训练好的模型持久化到磁盘,我们可以在需要使用模型时直接从磁盘加载到内存,而无需重新训练。这样不仅可以节省时间,还可以提高 ...
完整代码:The Annotated Transformer 前言 关于Transformer原理与论文的介绍:详细了解Transformer:Attention Is All You Need PyTorch中实现Transformer模型 前面介绍了,Transformer 模型结构的实现,这里 ...
原作:乔纳森·阿尔诺 时间:2023 年 12 月 11 日 在本文中,我们将解释如何解决手写人口普查的 OCR 问题,以及我们从这次实验中吸取的教训。本文将追踪我们测试的库和在线服务,以及我们如何应用鲁昂大学的科学出版物来进行历史文献分析。 为历史文档建立索引 光学字符识别 (OCR) 是一项成熟 ...
分类模型评估时,scikit-learn提供了混淆矩阵和分类报告是两个非常实用且常用的工具。它们为我们提供了详细的信息,帮助我们了解模型的优缺点,从而进一步优化模型。 这两个工具之所以单独出来介绍,是因为它们的输出内容特别适合用在模型的评估报告中。 1. 混淆矩阵 混淆矩阵(Confusion Ma ...
Softmax求导 其实BP过程在pytorch中可以自动进行,这里进行推导只是强迫症 A Apart证明softmax求导和softmax的BP过程 本来像手打公式的,想想还是算了,引用部分给出latex公式说明。 A.1 softmax导数 A.2 softmax梯度下降 B 基本上都是拾人牙慧 ...
一、对比度增强算法AGCWD硬件化实现 2013年发表在TIP上的对比度增强算法AGCWD(Efficient contrast enhancement using adaptive gamma correction with weighting distribution) 2014年发表在IEEE ...
完整代码:The Annotated Transformer 前言 关于Transformer原理与论文的介绍:详细了解Transformer:Attention Is All You Need 对于论文给出的模型架构,使用 PyTorch 分别实现各个部分。 命名transformer.py,引入 ...
前面两篇介绍了分类模型评估的两类方法,准确率分析和损失分析,本篇介绍的杰卡德相似系数和马修斯相关系数为我们提供了不同的角度来观察模型的性能,尤其在不平衡数据场景中,它们更能体现出其独特的价值。 接下来,让我们一起了解这两个评估指标的原理与特点。 1. 杰卡德相似系数 杰卡德相似系数(Jaccard ...
原作:杰里米·阿兰西奥 引言:在为各种企业实施AI项目一年后,我分享了我对公司在 LLMs 方面所犯错误的看法,以及应采取的策略。 2023 年是人工智能取得巨大成就的一年,特别是在具有大型语言模型的自然语言处理(LLMs)方面。随着生成式人工智能的出现以及随之而来的令人印象深刻的表现,大多数公司都 ...