上一页 1 ··· 64 65 66 67 68 69 70 71 72 ··· 110 下一页
摘要: 评估性能对预测模型的开发至关重要。交叉验证是一种流行的技术。但是在处理时间序列时,应该确保交叉验证处理了数据的时间依赖性质。在之前的文章中,我们也做过相应的介绍。 在本文中,我们收集了时间序列的常用的9种交叉验证方法。这些包括样本外验证(holdout)或流行的K-fold交叉验证的几个扩展。 Ti 阅读全文
posted @ 2023-01-08 09:31 deephub 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 对于数据科学项目来说,我们一直都很关注模型的训练和表现,但是在实际工作中如何启动和运行我们的模型是模型上线的最后一步也是最重要的工作。 今天我将通过一个简单的案例:部署一个PyTorch图像分类模型,介绍这个最重要的步骤。 我们这里使用PyTorch和Flask。可以使用pip install to 阅读全文
posted @ 2023-01-07 11:51 deephub 阅读(76) 评论(0) 推荐(0) 编辑
摘要: 数据可视化本身就是一种通用语言。我们这里通用语言的意思是:它能够向各行各业的人表示信息。它打破了语言和技术理解的障碍。数据是一些数字和文字的组合,但是可视化可以展示数据包含的信息。 “数据可视化有助于弥合数字和文字之间的差距”——Brie E. Anderson。 有许多无代码/少代码的数据可视化工 阅读全文
posted @ 2023-01-06 11:55 deephub 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 就机器学习而言,音频本身是一个有广泛应用的完整的领域,包括语音识别、音乐分类和声音事件检测等等。传统上音频分类一直使用谱图分析和隐马尔可夫模型等方法,这些方法已被证明是有效的,但也有其局限性。近期VIT已经成为音频任务的一个有前途的替代品,OpenAI的Whisper就是一个很好的例子。 在本文中, 阅读全文
posted @ 2023-01-05 10:50 deephub 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 时间序列数据是一种在一段时间内收集的数据类型,它通常用于金融、经济学和气象学等领域,经常通过分析来了解随着时间的推移的趋势和模式 Pandas是Python中一个强大且流行的数据操作库,特别适合处理时间序列数据。它提供了一系列工具和函数可以轻松加载、操作和分析时间序列数据。 在本文中,我们介绍时间序 阅读全文
posted @ 2023-01-04 11:06 deephub 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 本文将比较各种降维技术在机器学习任务中对表格数据的有效性。我们将降维方法应用于数据集,并通过回归和分类分析评估其有效性。我们将降维方法应用于从与不同领域相关的 UCI 中获取的各种数据集。总共选择了 15 个数据集,其中 7 个将用于回归,8 个用于分类。 为了使本文易于阅读和理解,仅显示了一个数据 阅读全文
posted @ 2023-01-03 10:44 deephub 阅读(58) 评论(0) 推荐(0) 编辑
摘要: 2022年随着聊天GPT和Mid - journey和Dall-E等图像生成器的流行,我们看到了整个人工智能领域的重大进展。在人工智能和计算机科学的时代,这是令人振奋的一年。本文我们总结了在2022年发表的最具开创性的10篇论文,无论如何你都应该看看。 完整文章: https://avoid.ove 阅读全文
posted @ 2023-01-02 11:09 deephub 阅读(313) 评论(0) 推荐(0) 编辑
摘要: PyTorch 2.0 于 2022 年 12 月上旬在 NeurIPS 2022 上发布,它新增的 torch.compile 组件引起了广泛关注,因为该组件声称比 PyTorch 的先前版本带来更大的计算速度提升。 这对我们来说是一个好消息,训练时间改进的结果令人印象深刻。PyTorch 团队在 阅读全文
posted @ 2023-01-01 11:32 deephub 阅读(218) 评论(0) 推荐(0) 编辑
摘要: CLIP(Contrastive Language-Image Pre-training)是一种机器学习技术,它可以准确理解和分类图像和自然语言文本,这对图像和语言处理具有深远的影响,并且已经被用作流行的扩散模型DALL-E的底层机制。在这篇文章中,我们将介绍如何调整CLIP来辅助视频搜索。 这篇文 阅读全文
posted @ 2022-12-31 09:48 deephub 阅读(74) 评论(0) 推荐(0) 编辑
摘要: Pandas是Python中最著名的数据分析工具。在处理数据集时,每个人都会使用到它。但是随着数据大小的增加,执行某些操作的某些方法会比其他方法花费更长的时间。所以了解和使用更快的方法非常重要,特别是在大型数据集中,本文将介绍一些使用Pandas处理大数据时的技巧,希望对你有所帮助 磁盘IO Pan 阅读全文
posted @ 2022-12-30 12:28 deephub 阅读(74) 评论(0) 推荐(0) 编辑
上一页 1 ··· 64 65 66 67 68 69 70 71 72 ··· 110 下一页