01 2023 档案

摘要:连续分级概率评分(Continuous Ranked Probability Score, CRPS)或“连续概率排位分数”是一个函数或统计量,可以将分布预测与真实值进行比较。 机器学习工作流程的一个重要部分是模型评估。这个过程本身可以被认为是常识:将数据分成训练集和测试集,在训练集上训练模型,并使 阅读全文
posted @ 2023-01-31 10:56 deephub 阅读(354) 评论(0) 推荐(0) 编辑
摘要:不平衡数据集是指一个类中的示例数量与另一类中的示例数量显著不同的情况。 例如在一个二元分类问题中,一个类只占总样本的一小部分,这被称为不平衡数据集。类不平衡会在构建机器学习模型时导致很多问题。 不平衡数据集的主要问题之一是模型可能会偏向多数类,从而导致预测少数类的性能不佳。 这是因为模型经过训练以最 阅读全文
posted @ 2023-01-30 10:49 deephub 阅读(66) 评论(0) 推荐(0) 编辑
摘要:DeepTime,是一个结合使用元学习的深度时间指数模型。通过使用元学习公式来预测未来,以应对时间序列中的常见问题(协变量偏移和条件分布偏移——非平稳)。该模型是时间序列预测的元学习公式协同作用的一个很好的例子。 DeepTime架构 DeepTime组件 DeepTime中有三种类型的层: 岭回归 阅读全文
posted @ 2023-01-29 10:35 deephub 阅读(135) 评论(0) 推荐(0) 编辑
摘要:语音识别是人工智能中的一个领域,它允许计算机理解人类语音并将其转换为文本。该技术用于 Alexa 和各种聊天机器人应用程序等设备。而我们最常见的就是语音转录,语音转录可以语音转换为文字记录或字幕。 wav2vec2、Conformer 和 Hubert 等最先进模型的最新发展极大地推动了语音识别领域 阅读全文
posted @ 2023-01-28 10:46 deephub 阅读(534) 评论(0) 推荐(0) 编辑
摘要:我的代码的哪些部分运行时间最长、内存最多?我怎样才能找到需要改进的地方?” 在开发过程中,我很确定我们大多数人都会想知道这一点,而且通常情况下存在开发空间。在本文中总结了一些方法来监控 Python 代码的时间和内存使用情况。 本文将介绍4种方法,前3种方法提供时间信息,第4个方法可以获得内存使用情 阅读全文
posted @ 2023-01-27 10:38 deephub 阅读(85) 评论(0) 推荐(0) 编辑
摘要:卷积神经网络(CNN)是解决图像分类、分割、目标检测等任务的流行模型。本文将CNN应用于解决简单的二维路径规划问题。主要使用Python, PyTorch, NumPy和OpenCV。 任务 简单地说,给定一个网格图,二维路径规划就是寻找从给定起点到所需目标位置(目标)的最短路径。机器人技术是路径规 阅读全文
posted @ 2023-01-26 11:53 deephub 阅读(117) 评论(0) 推荐(0) 编辑
摘要:Pandas 是数据科学社区中使用最广泛的库之一,它是一个强大的工具,可以进行数据操作、清理和分析。本文将提供最常用的 Pandas 函数以及如何实际使用它们的样例。我们将涵盖从基本数据操作到高级数据分析技术的所有内容,到本文结束时,你会深入了解如何使用 Pandas 并使数据科学工作流程更高效。 阅读全文
posted @ 2023-01-25 11:25 deephub 阅读(23) 评论(0) 推荐(0) 编辑
摘要:本文是关于如何使用cuda和Stable-Diffusion生成视频的完整指南,将使用cuda来加速视频生成,并且可以使用Kaggle的TESLA GPU来免费执行我们的模型。 完整文章: https://avoid.overfit.cn/post/781a2bd8a4534f7cb2d223c14 阅读全文
posted @ 2023-01-24 11:12 deephub 阅读(992) 评论(0) 推荐(0) 编辑
摘要:目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。 这些算法已被用于在游戏、机器人和决策制定等各种应用中,并且这些流行的算法还在不断发展和改进,本文我们将对其做一个简单的介绍。 完整文章: https://avoid.overfit.cn/ 阅读全文
posted @ 2023-01-23 10:56 deephub 阅读(199) 评论(0) 推荐(0) 编辑
摘要:OpenAI 于 2022 年 11 月下旬推出的 ChatGPT 在网络世界引起了不小的轰动。它不仅引起了社交媒体用户的关注,也引起了各大媒体的关注。 这种先进的 AI 技术不仅可以根据命令生成、重写和汇总文本,还可以与用户进行交互。它会记住以前的对话,甚至可以根据用户输入提出问题,甚至可以编写代 阅读全文
posted @ 2023-01-22 11:29 deephub 阅读(469) 评论(0) 推荐(0) 编辑
摘要:对时间序列进行分类是应用机器和深度学习模型的常见任务之一。本篇文章将涵盖 8 种类型的时间序列分类方法。这包括从简单的基于距离或间隔的方法到使用深度神经网络的方法。这篇文章旨在作为所有时间序列分类算法的参考文章。 时间序列定义 在涵盖各种类型的时间序列 (TS) 分类方法之前,我们先统一时间序列的概 阅读全文
posted @ 2023-01-21 11:36 deephub 阅读(913) 评论(0) 推荐(0) 编辑
摘要:在数学上,高斯噪声是一种通过向输入数据添加均值为零和标准差(σ)的正态分布随机值而产生的噪声。 正态分布,也称为高斯分布,是一种连续概率分布,由其概率密度函数 (PDF) 定义: pdf(x) = (1/ (σ*sqrt(2*π))) *e^(- (x—μ)²/ (2*σ²)) 其中 x 是随机变量 阅读全文
posted @ 2023-01-20 10:39 deephub 阅读(410) 评论(0) 推荐(0) 编辑
摘要:2022年, Vision Transformer (ViT)成为卷积神经网络(cnn)的有力竞争对手,卷积神经网络目前是计算机视觉领域的最先进技术,广泛应用于许多图像识别应用。在计算效率和精度方面,ViT模型超过了目前最先进的(CNN)几乎四倍。 ViT是如何工作的? ViT模型的性能取决于优化器 阅读全文
posted @ 2023-01-19 19:48 deephub 阅读(163) 评论(0) 推荐(0) 编辑
摘要:CycleMLP由香港大学、商汤科技研究院和上海人工智能实验室共同开发,在2022年ICLR上发布。 MLP-Mixer, ResMLP和gMLP,其架构与图像大小相关,因此在目标检测和分割中是无法使用的。而CycleMLP有两个优点。(1)可以处理各种大小的图像。(2)利用局部窗口实现了计算复杂度 阅读全文
posted @ 2023-01-18 11:05 deephub 阅读(54) 评论(0) 推荐(0) 编辑
摘要:JupyterLab是 Jupyter Notebook「新」界面。它包含了jupyter notebook的所有功能,并升级增加了很多功能。它最大的更新是模块化的界面,可以在同一个窗口以标签的形式同时打开好几个文档,同时插件管理非常强大,使用起来要比jupyter notebook高大尚许多。 完 阅读全文
posted @ 2023-01-17 11:05 deephub 阅读(74) 评论(0) 推荐(0) 编辑
摘要:昨天的文章中,我们回顾了 YOLO 家族的前 9 个架构。本文中将继续总结最后3个框架,还有本月最新发布的YOLO V8. Backbone 最初由一个分支(GoogLeNet、VGG、Darknet)组成,然后过渡到包含跳跃连接的架构(Cross-Stage Partial connections 阅读全文
posted @ 2023-01-16 12:09 deephub 阅读(221) 评论(0) 推荐(0) 编辑
摘要:YOLO V8已经在本月发布了,我们这篇文章的目的是对整个YOLO家族进行比较分析。了解架构的演变可以更好地知道哪些改进提高了性能,并且明确哪些版本是基于那些版本的改进,因为YOLO的版本和变体的命名是目前来说最乱的,希望看完这篇文章之后你能对整个家族有所了解。 在YOLO出现之前,检测图像中对象的 阅读全文
posted @ 2023-01-15 11:36 deephub 阅读(403) 评论(0) 推荐(0) 编辑
摘要:还记得我们以前使用GAN、Clip、DALL-E生成神奇宝贝的文章吗,现在是时候使用Stable Diffusion了 在本文中,我将展示如何从神奇宝贝系列不同游戏中的Pokedex条目中获取神奇宝贝描述,并使用Stable Diffusion根据这些藐视生成图片,这样可以看看AI如何解释这些描述的 阅读全文
posted @ 2023-01-14 09:37 deephub 阅读(140) 评论(0) 推荐(0) 编辑
摘要:基于文本提示的生成图像模型近年来取得了惊人的进展,这得益于新型的深度学习架构、先进的训练范式(如掩码建模)、大量图像-文本配对训练数据的日益可用,以及新的扩散和基于掩码的模型的发展。 在23年1月新发布的论文 Muse中:Masked Generative Transformers 生成文本到图像利 阅读全文
posted @ 2023-01-13 11:59 deephub 阅读(28) 评论(0) 推荐(0) 编辑
摘要:时间序列预测的transformers的衰落和时间序列嵌入方法的兴起,还有异常检测、分类也取得了进步 2022年整个领域在几个不同的方面取得了进展,本文将尝试介绍一些在过去一年左右的时间里出现的更有前景和关键的论文,以及Flow Forecast [FF]预测框架。 完整文章: https://av 阅读全文
posted @ 2023-01-12 11:53 deephub 阅读(118) 评论(0) 推荐(0) 编辑
摘要:联合学习 (FL) 是一种出色的 ML 方法,它使多个设备(例如物联网 (IoT) 设备)或计算机能够在模型训练完成时进行协作,而无需共享它们的数据。 “客户端”是 FL 中使用的计算机和设备,它们可以彼此完全分离并且拥有各自不同的数据,这些数据可以应用同不隐私策略,并由不同的组织拥有,并且彼此不能 阅读全文
posted @ 2023-01-11 10:37 deephub 阅读(77) 评论(0) 推荐(0) 编辑
摘要:扩散模型的兴起可以被视为人工智能生成艺术领域最近取得突破的主要因素。而稳定扩散模型的发展使得我们可以通过一个文本提示轻松地创建美妙的艺术插图。所以在本文中,我将解释它们是如何工作的。 完整文章: https://avoid.overfit.cn/post/d46c23ece6024970af77ac 阅读全文
posted @ 2023-01-10 11:10 deephub 阅读(402) 评论(0) 推荐(0) 编辑
摘要:TensorFlow和PyTorch是两个最受欢迎的开源深度学习框架,这两个框架都为构建和训练深度学习模型提供了广泛的功能,并已被研发社区广泛采用。但是作为用户,我们一直想知道哪种框架最适合我们自己特定项目,所以在本文与其他文章的特性的对比不同,我们将以实际应用出发,从性能、可伸缩性和其他高级特性方 阅读全文
posted @ 2023-01-09 11:05 deephub 阅读(101) 评论(0) 推荐(0) 编辑
摘要:评估性能对预测模型的开发至关重要。交叉验证是一种流行的技术。但是在处理时间序列时,应该确保交叉验证处理了数据的时间依赖性质。在之前的文章中,我们也做过相应的介绍。 在本文中,我们收集了时间序列的常用的9种交叉验证方法。这些包括样本外验证(holdout)或流行的K-fold交叉验证的几个扩展。 Ti 阅读全文
posted @ 2023-01-08 09:31 deephub 阅读(137) 评论(0) 推荐(0) 编辑
摘要:对于数据科学项目来说,我们一直都很关注模型的训练和表现,但是在实际工作中如何启动和运行我们的模型是模型上线的最后一步也是最重要的工作。 今天我将通过一个简单的案例:部署一个PyTorch图像分类模型,介绍这个最重要的步骤。 我们这里使用PyTorch和Flask。可以使用pip install to 阅读全文
posted @ 2023-01-07 11:51 deephub 阅读(78) 评论(0) 推荐(0) 编辑
摘要:数据可视化本身就是一种通用语言。我们这里通用语言的意思是:它能够向各行各业的人表示信息。它打破了语言和技术理解的障碍。数据是一些数字和文字的组合,但是可视化可以展示数据包含的信息。 “数据可视化有助于弥合数字和文字之间的差距”——Brie E. Anderson。 有许多无代码/少代码的数据可视化工 阅读全文
posted @ 2023-01-06 11:55 deephub 阅读(461) 评论(0) 推荐(0) 编辑
摘要:就机器学习而言,音频本身是一个有广泛应用的完整的领域,包括语音识别、音乐分类和声音事件检测等等。传统上音频分类一直使用谱图分析和隐马尔可夫模型等方法,这些方法已被证明是有效的,但也有其局限性。近期VIT已经成为音频任务的一个有前途的替代品,OpenAI的Whisper就是一个很好的例子。 在本文中, 阅读全文
posted @ 2023-01-05 10:50 deephub 阅读(99) 评论(0) 推荐(0) 编辑
摘要:时间序列数据是一种在一段时间内收集的数据类型,它通常用于金融、经济学和气象学等领域,经常通过分析来了解随着时间的推移的趋势和模式 Pandas是Python中一个强大且流行的数据操作库,特别适合处理时间序列数据。它提供了一系列工具和函数可以轻松加载、操作和分析时间序列数据。 在本文中,我们介绍时间序 阅读全文
posted @ 2023-01-04 11:06 deephub 阅读(19) 评论(0) 推荐(0) 编辑
摘要:本文将比较各种降维技术在机器学习任务中对表格数据的有效性。我们将降维方法应用于数据集,并通过回归和分类分析评估其有效性。我们将降维方法应用于从与不同领域相关的 UCI 中获取的各种数据集。总共选择了 15 个数据集,其中 7 个将用于回归,8 个用于分类。 为了使本文易于阅读和理解,仅显示了一个数据 阅读全文
posted @ 2023-01-03 10:44 deephub 阅读(63) 评论(0) 推荐(0) 编辑
摘要:2022年随着聊天GPT和Mid - journey和Dall-E等图像生成器的流行,我们看到了整个人工智能领域的重大进展。在人工智能和计算机科学的时代,这是令人振奋的一年。本文我们总结了在2022年发表的最具开创性的10篇论文,无论如何你都应该看看。 完整文章: https://avoid.ove 阅读全文
posted @ 2023-01-02 11:09 deephub 阅读(323) 评论(0) 推荐(0) 编辑
摘要:PyTorch 2.0 于 2022 年 12 月上旬在 NeurIPS 2022 上发布,它新增的 torch.compile 组件引起了广泛关注,因为该组件声称比 PyTorch 的先前版本带来更大的计算速度提升。 这对我们来说是一个好消息,训练时间改进的结果令人印象深刻。PyTorch 团队在 阅读全文
posted @ 2023-01-01 11:32 deephub 阅读(224) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示