04 2022 档案

摘要:数据可视化基本上是数据的图形表示。在探索性数据分析中,可以使用数据可视化来理解变量之间的关系,还可以通过视化数据揭示底层结构或了解数据信息。 有多种工具可以帮助我们创建数据可视化。Seaborn就是其中之一 ,它是一个流行的 Python 数据可视化库。虽然Seaborn也是基于 Matplotli 阅读全文
posted @ 2022-04-30 13:25 deephub 阅读(93) 评论(0) 推荐(0) 编辑
摘要:太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略: 删除未使用的列 删除具有缺失值的列 不相关的 阅读全文
posted @ 2022-04-29 11:20 deephub 阅读(233) 评论(0) 推荐(0) 编辑
摘要:4月25日(星期一)至4月29日(星期五),International Conference in Learning Representations(ICLR)将连续第三年在线举行。它是世界机器学习研究世界上最大,最受欢迎的会议之一:它包含超过一千篇有关主题的论文,包括ML理论,强化学习(RL),计 阅读全文
posted @ 2022-04-28 10:51 deephub 阅读(193) 评论(0) 推荐(0) 编辑
摘要:训练深度神经网络是一项具有挑战性的任务。多年来,研究人员提出了不同的方法来加速和稳定学习过程。归一化是一种被证明在这方面非常有效的技术。 在这篇文章中,我将使用类比和可视化的方式来回顾这些方法中,这将帮助您了解它们的产生的原因和思维过程。 为什么要归一化? 例如,我们现在用两个特征构建一个简单的神经 阅读全文
posted @ 2022-04-27 10:23 deephub 阅读(270) 评论(0) 推荐(0) 编辑
摘要:2015 年 11 月,wikipedia的用户 Laughinthestocks 首次引入了“激活函数表”。从那时开始到现在,维基百科页面已经发生了 391 次更改。在本文中,我通过自己写的一个程序来挖掘截至 2022 年 4 月 22 日时维基百科页面历史中的每个唯一激活函数。本文还提供了针对激 阅读全文
posted @ 2022-04-26 11:13 deephub 阅读(31) 评论(0) 推荐(0) 编辑
摘要:在零售、经济和金融等行业,数据总是由于货币和销售而不断变化,生成的所有数据都高度依赖于时间。如果这些数据没有时间戳或标记,实际上很难管理所有收集的数据。Python 程序允许我们使用 NumPy timedelta64 和 datetime64 来操作和检索时间序列数据。sklern库中也提供时间序 阅读全文
posted @ 2022-04-25 11:41 deephub 阅读(167) 评论(0) 推荐(0) 编辑
摘要:1、Integrating LSTMs and GNNs for COVID-19 Forecasting Nathan Sesti, Juan Jose Garau-Luis, Edward Crawley, Bruce Cameron 将COVID-19的传播与图神经网络(GNN)的结合,使得最 阅读全文
posted @ 2022-04-24 10:14 deephub 阅读(261) 评论(0) 推荐(0) 编辑
摘要:5分钟NLP:Text-To-Text Transfer Transformer (T5)统一的文本到文本任务模型 本文将解释如下术语:T5,C4,Unified Text-to-Text Tasks 迁移学习在NLP中的有效性来自对具有自监督任务的丰富无标记的文本数据进行预训练的模型,例如语言建模 阅读全文
posted @ 2022-04-23 09:46 deephub 阅读(596) 评论(0) 推荐(0) 编辑
摘要:三十多年来,许多研究人员在图像识别算法和图像数据方面积累了丰富的知识。如果你对图像训练感兴趣但不知道从哪里开始,这篇文章会是一个很好的开始。这篇文章简要介绍了过去的演变,并总结了现在的一些热门话题。 ImageNet 预训练模型 迁移学习(热门话题) 使用预训练模型识别未知图像 PyTorch Im 阅读全文
posted @ 2022-04-22 11:19 deephub 阅读(180) 评论(0) 推荐(0) 编辑
摘要:概率和统计知识是数据科学和机器学习的核心;我们需要统计和概率知识来有效地收集、审查、分析数据。 现实世界中有几个现象实例被认为是统计性质的(即天气数据、销售数据、财务数据等)。这意味着在某些情况下,我们已经能够开发出方法来帮助我们通过可以描述数据特征的数学函数来模拟自然。 “概率分布是一个数学函数, 阅读全文
posted @ 2022-04-21 13:17 deephub 阅读(610) 评论(0) 推荐(0) 编辑
摘要:1、ReLLIE: Deep Reinforcement Learning for Customized Low-Light Image Enhancement Rongkai Zhang, Lanqing Guo, Siyu Huang, Bihan Wen 低光图像增强 (LLIE) 是一个普遍 阅读全文
posted @ 2022-04-20 10:19 deephub 阅读(63) 评论(0) 推荐(0) 编辑
摘要:本文是关于检测和处理数据集中的异常值,主要包含以下四部分内容: 什么是异常值? 为什么检测异常值很重要? 如何检测异常值? 如何处理异常值? 什么是异常值? 异常值是与其他观察结果显着不同的数据点。如下图所示,橙色数据点与一般分布相去甚远。我们将此点称为异常值。 为什么检测异常值很重要? 在数据科学 阅读全文
posted @ 2022-04-19 10:29 deephub 阅读(154) 评论(0) 推荐(0) 编辑
摘要:Boosting 是一种松散的策略,它将多个简单模型组合成一个复合模型。这个想法的理论来自于随着我们引入更多的简单模型,整个模型会变得越来越强大。在 boosting 中,简单模型称为弱模型或弱学习器。在回归的背景下,第一个简单模型只是一个常数,而随后的简单模型是“回归树”。 什么是回归树呢?它是用 阅读全文
posted @ 2022-04-18 10:02 deephub 阅读(200) 评论(0) 推荐(0) 编辑
摘要:GNN 提供了一种在图结构化数据上使用深度学习技术的方法。图结构数据无处不在:从化学(例如分子图)到社交媒体(例如社交网络)以及金融投资(例如 VC 投资网络),GNN 在各种任务中显示出最先进的性能¹ ²。 在我的以前的一个实践:在投资者、初创公司和个人组成的投资网络上预测初创公司未来的融资轮次, 阅读全文
posted @ 2022-04-17 11:16 deephub 阅读(242) 评论(0) 推荐(0) 编辑
摘要:本文提供了与SRCNN论文的总结和回顾,如果你对于图像的超分辨率感兴趣,一定要先阅读这篇论文,他可以说是所有基于深度学习的超分辨率模型的鼻祖 卷积神经网络通常用于分类,目标检测,图像分割等与某些与图像有关的问题中。在本文中,将介绍CNN 如何用于单图像超分辨率(SISR)。这有助于解决与计算机视觉相 阅读全文
posted @ 2022-04-16 10:53 deephub 阅读(84) 评论(0) 推荐(0) 编辑
摘要:股票走势预测是对股票价格未来走势的预测,在投资中起着至关重要的作用。因为同行业的股票价格是高度相关的,所以市场中的股票之间的信息是可以共享的。最近也提出了几种方法来通过从 Web 中提取的股票概念类别(例如,技术、互联网零售)来挖掘共享信息,以改进预测结果。 在以前的工作假设中股票和信息之间的联系是 阅读全文
posted @ 2022-04-15 15:49 deephub 阅读(70) 评论(0) 推荐(0) 编辑
摘要:1、Dimension Reduction for Spatially Correlated Data: Spatial Predictor Envelope 2、Unsupervised Machine Learning for Exploratory Data Analysis of Exopl 阅读全文
posted @ 2022-04-14 10:24 deephub 阅读(62) 评论(0) 推荐(0) 编辑
摘要:本文将使用 Python 实现和对比解释 NLP中的3 种不同文本摘要策略:老式的 TextRank(使用 gensim)、著名的 Seq2Seq(使基于 tensorflow)和最前沿的 BART(使用Transformers )。 NLP(自然语言处理)是人工智能领域,研究计算机与人类语言之间的 阅读全文
posted @ 2022-04-13 11:19 deephub 阅读(200) 评论(0) 推荐(0) 编辑
摘要:MAE是一种使用自监督预训练策略的ViT,通过遮蔽输入图像中的补丁,然后预测缺失区域进行子监督的与训练。尽管该方法既简单又有效,但 MAE 预训练目标目前仅限于单一模态——RGB 图像——限制了在通常呈现多模态信息的实际场景中的应用和性能。 在新论文 MultiMAE: Multi-modal Mu 阅读全文
posted @ 2022-04-12 11:12 deephub 阅读(400) 评论(0) 推荐(0) 编辑
摘要:AutoML 可以为预测建模问题自动找到数据准备、模型和模型超参数的最佳组合,本文整理了5个最常见且被熟知的开源AutoML 框架。 AutoML框架执行的任务可以被总结成以下几点: 预处理和清理数据。 选择并构建适当的特征。 选择合适的模型。 优化模型超参数。 设计神经网络的拓扑结构(如果使用深度 阅读全文
posted @ 2022-04-11 10:24 deephub 阅读(350) 评论(0) 推荐(0) 编辑
摘要:将Prophet的预测结果作为特征输入到 LightGBM 模型中进行时序的预测 我们以前的关于使用机器学习进行时间序列预测的文章中,都是专注于解释如何使用基于机器学习的方法进行时间序列预测并取得良好结果。 但是在这篇文章将使用更高级的技术来预测时间序列,本文将使用 Prophet 来提取新的有意义 阅读全文
posted @ 2022-04-10 10:07 deephub 阅读(127) 评论(0) 推荐(0) 编辑
摘要:NVidia 的新 H100 GPU已经发布了,我们也很久没有发论文推荐了,这是4月份的论文推荐:Google 的 5400 亿参数 PaLM、Pathways、Kubric、Tensor Programs、Bootstrapping Reasoning With Reasoning、Sparse 阅读全文
posted @ 2022-04-09 12:01 deephub 阅读(143) 评论(0) 推荐(0) 编辑
摘要:我们每天都在为选择进行自己的假设,并且按照自己认为最好的方向做出选择,所以假设在我们的生活中是无处不在的,例如:A 路是否会比 B 路花费更少的时间,X 的平均投资回报率是否高于 Y 的投资,以及电影 ABC 是否比电影 XYZ 好。在所有这些情况下,我们都在对我们做出的假设进行检验。 建立假设,使 阅读全文
posted @ 2022-04-08 11:25 deephub 阅读(397) 评论(0) 推荐(0) 编辑
摘要:Gaussian Naive Bayes (GNB) 是一种基于概率方法和高斯分布的机器学习的分类技术。朴素贝叶斯假设每个参数(也称为特征或预测变量)具有预测输出变量的独立能力。所有参数的预测组合是最终预测,它返回因变量被分类到每个组中的概率,最后的分类被分配给概率较高的分组(类)。 什么是高斯分布 阅读全文
posted @ 2022-04-07 10:43 deephub 阅读(418) 评论(0) 推荐(0) 编辑
摘要:在计算机视觉中的单任务学习已经取得了很大的成功。但是许多现实世界的问题本质上是多模态的。例如为了提供个性化的内容,智能广告系统应该能够识别使用的用户并确定他们的性别和年龄,跟踪他们在看什么,等等。多任务学习(Multi-Task Learning, MTL)可以实现这样的系统,其中一个模型在多个任务 阅读全文
posted @ 2022-04-06 11:05 deephub 阅读(116) 评论(0) 推荐(0) 编辑
摘要:深度神经网络 (DNN) 已经发展到现在已经可以在计算机视觉和自然语言处理等许多任务上表现非常出色。而现在主要的研究是如何训练这些 DNN 以提高其准确性。准确性的主要问题是神经网络极易受到对抗性扰动的影响。 例如下面的图片,添加噪声之前和之后的两张图像对我们来说似乎相同。但对于神经网络来说,右边的 阅读全文
posted @ 2022-04-05 11:34 deephub 阅读(45) 评论(0) 推荐(0) 编辑
摘要:今天我将讨论一些在过去十年中出现的主要的半监督学习模型。首先让我们谈谈什么是半监督学习以及我们为什么对它感兴趣! 假设我们有一个大的标记图像数据集。我们想使用这些数据来构建一个模型,进行图像分类的任务,解决这个问题的标准方法是构建卷积神经网络 (CNN)。CNN 已被证明在使用大型数据集进行训练时可 阅读全文
posted @ 2022-04-04 10:37 deephub 阅读(171) 评论(0) 推荐(0) 编辑
摘要:异常检测是指数据科学中可帮助发现数据集中的异常值有用的技术。异常检测在处理时间序列数据时特别有用。例如时间序列数据来自传感器测量结果(例如压力和温度),由于设备故障和瞬态现象等问题包含许多异常点, 异常检测有助于消除这些点异常值,以优化时间序列数据中的信号。对于销量预测等需求异常点也可以表示为活动或 阅读全文
posted @ 2022-04-02 10:05 deephub 阅读(151) 评论(0) 推荐(0) 编辑
摘要:图像模糊是由相机或拍摄对象移动、对焦不准确或使用光圈配置不当导致的图像不清晰。为了获得更清晰的照片,我们可以使用相机镜头的首选焦点重新拍摄同一张照片,或者使用深度学习知识重现模糊的图像。由于我的专长不是摄影,只能选择使用深度学习技术对图像进行去模糊处理! 在开始这个项目之前,本文假定读者应该了解深度 阅读全文
posted @ 2022-04-01 10:02 deephub 阅读(141) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示