11 2022 档案

摘要:偏差-方差权衡”是ML/AI中被经常提到的一个流行概念。我们这里用一个直观的公式来对它进行解释: MSE = Bias² + Variance 本文的目的并不是要证明这个公式,而是将他作为一个入口,让你了解统计学家如何以及为什么这样构建公式,以及我们如何判断是什么使某些估算器比其他估算器更好。 用公 阅读全文
posted @ 2022-11-30 11:23 deephub 阅读(80) 评论(0) 推荐(0) 编辑
摘要:神经网络架构和训练、自学习、棋盘对称性、Playout Cap Randomization,结果可视化 从我们之前的文章中,介绍了蒙特卡洛树搜索 (MCTS) 的工作原理以及如何使用它来获得给定棋盘状态的输出策略。我们也理解神经网络在 MCTS 中的两个主要作用;通过神经网络的策略输出来指导探索,并 阅读全文
posted @ 2022-11-29 11:11 deephub 阅读(120) 评论(0) 推荐(0) 编辑
摘要:用于深入了解数据的一些独特的数据可视化技术 可视化是一种方便的观察数据的方式,可以一目了然地了解数据块。我们经常使用柱状图、直方图、饼图、箱图、热图、散点图、线状图等。这些典型的图对于数据可视化是必不可少的。除了这些被广泛使用的图表外,还有许多很好的却很少被使用的可视化方法,这些图有助于完成我们的工 阅读全文
posted @ 2022-11-28 12:01 deephub 阅读(456) 评论(0) 推荐(0) 编辑
摘要:BT-Unet采用Barlow twin方法对U-Net模型的编码器进行无监督的预训练减少冗余信息,以学习数据表示。之后,对完整网络进行微调以执行实际的分割。 BT-Unet由 Indian Institute of Information Technology Allahabad开发,发布在202 阅读全文
posted @ 2022-11-27 10:52 deephub 阅读(71) 评论(0) 推荐(0) 编辑
摘要:我们将在本文中衡量交易策略的表现。并将开发一个简单的动量交易策略,它将使用四种资产类别:债券、股票和房地产。这些资产类别的相关性很低,这使得它们成为了极佳的风险平衡选择。 动量交易策略 这个策略是基于动量的的,因为交易者和投资者早就意识到动量的影响,这可以在广泛的市场和时间框架中看到。所以我们称之为 阅读全文
posted @ 2022-11-26 11:48 deephub 阅读(131) 评论(0) 推荐(0) 编辑
摘要:在本文中,我们将实现Meta AI和Sorbonne Universite的研究人员最近发表的一篇名为DIFFEDIT的论文。对于那些熟悉稳定扩散过程或者想了解DiffEdit是如何工作的人来说,这篇文章将对你有所帮助。 什么是DiffEdit? 简单地说,可以将DiffEdit方法看作图像到图像的 阅读全文
posted @ 2022-11-25 11:35 deephub 阅读(59) 评论(0) 推荐(0) 编辑
摘要:下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。 假设要预测其中一个变量。比如,sparkling wine。如何建立一个模型来进行预测呢? 一种常见的方法是将该变量其视为单变量时间序列。这样就有很多方法可以用来模拟这些系列。比如 ARIMA、指数平滑或 阅读全文
posted @ 2022-11-24 10:51 deephub 阅读(190) 评论(0) 推荐(0) 编辑
摘要:流 (Streams) 当我们启动内核(函数)时,它会在 GPU 中排队等待执行,GPU 会顺序按照启动时间执行我们的内核。设备中启动的许多任务可能依赖于之前的任务,所以“将它们放在同一个队列中”是有道理的。例如,如果将数据异步复制到 GPU 以使用某个内核处理它,则复制的步骤本必须在内核运行之前完 阅读全文
posted @ 2022-11-23 10:37 deephub 阅读(51) 评论(0) 推荐(0) 编辑
摘要:随着最大的人工智能研究会议(NeurIPS 2022)即将到来,我们进入了2022年的最后阶段。让我们回顾一下人工智能世界最近发生了什么。 在介绍推荐论文之前,先说一个很有意思的项目: img-to-music:想象图像听起来是什么样的模型! https://huggingface.co/space 阅读全文
posted @ 2022-11-22 11:33 deephub 阅读(142) 评论(0) 推荐(0) 编辑
摘要:在本文中,我们将回顾特性选择技术并回答为什么它很重要以及如何使用python实现它。 本文还可以帮助你解答以下的面试问题: 什么是特征选择? 说出特性选择的一些好处 你知道哪些特征选择技巧? 区分单变量、双变量和多变量分析。 我们能用PCA来进行特征选择吗? 前向特征选择和后向特征选择的区别是什么? 阅读全文
posted @ 2022-11-21 12:25 deephub 阅读(41) 评论(0) 推荐(0) 编辑
摘要:可解释的AI(XAI)一直是人们研究的一个方向,在这篇文章中,我们将看到如何使用LIME来解释一个模型是如何学习扑克规则的。在这个过程中,我们将介绍: 如何将LIME应用到扑克游戏中; LIME如何工作; LIME 的优点和缺点是什么。 将LIME应用到扑克游戏中 目标 我们的目标是建立一个可以预测 阅读全文
posted @ 2022-11-20 11:42 deephub 阅读(48) 评论(0) 推荐(0) 编辑
摘要:本文中将介绍一个流行的机器学习项目——文本生成器,你将了解如何构建文本生成器,并了解如何实现马尔可夫链以实现更快的预测模型。 文本生成器简介 文本生成在各个行业都很受欢迎,特别是在移动、应用和数据科学领域。甚至新闻界也使用文本生成来辅助写作过程。 在日常生活中都会接触到一些文本生成技术,文本补全、搜 阅读全文
posted @ 2022-11-19 10:34 deephub 阅读(142) 评论(0) 推荐(0) 编辑
摘要:Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的 阅读全文
posted @ 2022-11-18 12:53 deephub 阅读(12060) 评论(0) 推荐(0) 编辑
摘要:你是否遇到过数据集中有多个文本特性的情况?例如,根据消息的上下文正确地对消息进行分类,即理解前面的消息。比如说我们有下面的数据集,需要对其进行分类。 当只考虑message时,你可以看到它的情绪是积极的,因为“incredible”这个词。但是当考虑到背景时,我们可以看到它时消极的 所以对于上下文来 阅读全文
posted @ 2022-11-17 10:18 deephub 阅读(18) 评论(0) 推荐(0) 编辑
摘要:卷积神经网络设计史上的主要里程碑:模块化、多路径、因式分解、压缩、可扩展 一般来说,分类问题是计算机视觉模型的基础,它可以延申解决更复杂的视觉问题,例如:目标检测的任务包括检测边界框并对其中的对象进行分类。而分割的任务则是对图像中的每个像素进行分类。 卷积神经网络(CNNs)首次被用于解决图像分类问 阅读全文
posted @ 2022-11-16 12:28 deephub 阅读(32) 评论(0) 推荐(0) 编辑
摘要:PyTorch是一个开源的深度学习框架,它提供了一个用于高级特性的Python包。在本文中,我们将介绍PyTorch中的常见抽样函数。抽样是一个统计过程,它从总体中提取一个子集,通过子集来研究整个总体。 完整文章 https://avoid.overfit.cn/post/17413e750e7e4 阅读全文
posted @ 2022-11-15 11:38 deephub 阅读(31) 评论(0) 推荐(0) 编辑
摘要:什么是自相关以及为什么它在时间序列分析中是有用的。 在时间序列分析中,我们经常通过对过去的理解来预测未来。为了使这个过程成功,我们必须彻底了解我们的时间序列,找到这个时间序列中包含的信息。 自相关就是其中一种分析的方法,他可以检测时间系列中的某些特征,为我们的数据选择最优的预测模型。 在这篇简短的文 阅读全文
posted @ 2022-11-14 10:26 deephub 阅读(78) 评论(0) 推荐(0) 编辑
摘要:在前一篇文章中,我们介绍了如何使用 GPU 运行的并行算法。这些并行任务是那些完全相互独立的任务,这点与我们一般认识的编程方式有很大的不同,虽然我们可以从并行中受益,但是这种奇葩的并行运行方式对于我们来说肯定感到非常的复杂。所以在本篇文章的Numba代码中,我们将介绍一些允许线程在计算中协作的常见技 阅读全文
posted @ 2022-11-13 11:09 deephub 阅读(34) 评论(0) 推荐(0) 编辑
摘要:我们已经介绍过很多解析机器学习模型的方法,例如如pdp、LIME和SHAP,但是这些方法都是用在表格数据的,他们能不能用在神经网络模型呢?今天我们来LIME解释CNN。 图像与表格数据集有很大不同(显然)。如果你还记得,在之前我们讨论过的任何解释方法中,我们都是根据特征重要性,度量或可视化来解释模型 阅读全文
posted @ 2022-11-12 11:09 deephub 阅读(67) 评论(0) 推荐(0) 编辑
摘要:条件GAN (cGAN) + Atrous卷积(AC) +带权重块的通道注意力(CAW) 该论文提出了一种基于深度对抗学习的超声图像乳腺肿瘤分割分类方法(cGAN+AC+CAW),论文虽然是2019年提出的,但是他提出了使用GAN进行分割的方法在当时来说却是一个非常新奇的想法,该论文基本上把所有当时 阅读全文
posted @ 2022-11-11 10:56 deephub 阅读(38) 评论(0) 推荐(0) 编辑
摘要:近年来基于图的机器学习有了很大的发展。基于图的方法在数据科学中的许多常见问题中都有应用,例如链接预测、社群发现、节点分类等。根据如何组织问题和所拥有的数据,有许多解决问题的方法。本文将提供一个基于图的嵌入算法的高层次的概述。最后还将介绍如何用Python库(如node2vec)来在图上生成各种嵌入。 阅读全文
posted @ 2022-11-10 10:35 deephub 阅读(126) 评论(0) 推荐(0) 编辑
摘要:本篇文章将实现AlphaZero的核心搜索算法:蒙特卡洛树搜索 蒙特卡洛树搜索(MCTS) 你可能熟悉术语蒙特卡洛[1],这是一类算法,反复进行随机抽样以获得某个结果。 例如上图,在单位正方形中选择随机点,计算圆内有多少个点,可以用来估计pi/4的值 本文中我们将详细介绍MCTS的所有步骤。但首先我 阅读全文
posted @ 2022-11-09 11:10 deephub 阅读(116) 评论(0) 推荐(0) 编辑
摘要:在本文中,我们将在PyTorch中为Chain Reaction[2]游戏从头开始实现DeepMind的AlphaZero[1]。为了使AlphaZero的学习过程更有效,我们还将使用一个相对较新的改进,称为“Playout Cap Randomization”[3],以及来自[4]的一些其他技术。 阅读全文
posted @ 2022-11-08 14:44 deephub 阅读(71) 评论(0) 推荐(0) 编辑
摘要:医学图像分析,多任务学习,图像分类,图像分割,U-Net,后处理 该论文是18年发布的,提出了一种基于Deep U-Net的多任务学习框架,用于GE-MRI左心房分割,该框架同时执行心房分割和消融前后分类。虽然论文已经很老了,但是改论文提出的多任务和后处理方法到现在还是可以参考的。 多任务U-Net 阅读全文
posted @ 2022-11-07 13:02 deephub 阅读(39) 评论(0) 推荐(0) 编辑
摘要:NMS即non maximum suppression即非极大抑制,顾名思义就是抑制不是极大值的元素,搜索局部的极大值。在最近几年常见的物体检测算法(包括rcnn、sppnet、fast-rcnn、faster-rcnn等)中,最终都会从一张图片中找出很多个可能是物体的矩形框,然后为每个矩形框为做类 阅读全文
posted @ 2022-11-06 09:19 deephub 阅读(98) 评论(0) 推荐(0) 编辑
摘要:机器学习算法只接受数值输入,所以如果我们遇到分类特征的时候都会对分类特征进行编码,本文总结了常见的11个分类变量编码方法。 1、ONE HOT ENCODING 最流行且常用的编码方法是One Hot Enoding。一个具有n个观测值和d个不同值的单一变量被转换成具有n个观测值的d个二元变量,每个 阅读全文
posted @ 2022-11-05 09:23 deephub 阅读(49) 评论(0) 推荐(0) 编辑
摘要:GPU(图形处理单元)最初是为计算机图形开发的,但是现在它们几乎在所有需要高计算吞吐量的领域无处不在。这一发展是由GPGPU(通用GPU)接口的开发实现的,它允许我们使用GPU进行通用计算编程。这些接口中最常见的是CUDA,其次是OpenCL和最近刚出现的HIP。 Python中使用CUDA CUD 阅读全文
posted @ 2022-11-04 12:43 deephub 阅读(114) 评论(0) 推荐(0) 编辑
摘要:大多数时间序列可以分解为不同的组件,在本文中,我将讨论这些不同的组件是什么,如何获取它们以及如何使用 Python 进行时间序列分解。 时间序列组成 时间序列是(主要)三个组成部分的组合:趋势、季节性和残差/剩余部分。让我们简单的解释这三个组成部分 趋势:这是该序列的整体运动。它可能会持续增加、也可 阅读全文
posted @ 2022-11-03 10:51 deephub 阅读(72) 评论(0) 推荐(0) 编辑
摘要:UNet 可以算是 FCN 的一种变体,是最常用、最简单的一种分割模型,简单、高效、易懂、容易构建,且可以从小数据集中训练。2015 年,UNet 在论文 U-Net: Convolutional Networks for Biomedical Image Segmentation 中被提出 。 U 阅读全文
posted @ 2022-11-02 10:31 deephub 阅读(147) 评论(0) 推荐(0) 编辑
摘要:我们在使用卷积神经网络或递归神经网络或其他变体时,通常都希望对模型的架构可以进行可视化的查看,因为这样我们可以 在定义和训练多个模型时,比较不同的层以及它们放置的顺序对结果的影响。还有可以更好地理解模型结构、激活函数、模型参数形状(神经元数量)等 keras 中有一些现成的包可以创建我们的神经网络模 阅读全文
posted @ 2022-11-01 10:24 deephub 阅读(43) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示