上一页 1 ··· 88 89 90 91 92 93 94 95 96 ··· 109 下一页
摘要: 统计学是涉及数据的收集,组织,分析,解释和呈现的学科。 统计的类型 描述性统计 描述性统计是以数字和图表的形式来理解、分析和总结数据。对不同类型的数据(数值的和分类的)使用不同的图形和图表来分析数据,如条形图、饼图、散点图、直方图等。所有的解释和可视化都是描述性统计的一部分。重要的是要记住,描述性统 阅读全文
posted @ 2022-05-08 11:59 deephub 阅读(363) 评论(0) 推荐(0) 编辑
摘要: Pycaret是Python中的一个开源可自动化机器学习工作流程的低代码机学习库。它是一种端到端的机器学习和模型管理工具。要了解有关Pycaret的更多信息,可以查看官方网站或GitHub。 1、与最新版本的Scikit-Learn完全兼容 Pycaret 2.x需要Scikit-Learn 0.2 阅读全文
posted @ 2022-05-07 11:31 deephub 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 机器学习和深度学习中的模型都是遵循数学函数的方式创建的。从数据分析到预测建模,一般情况下都会有数学原理的支撑,比如:欧几里得距离用于检测聚类中的聚类。 傅里叶变换是一种众将函数从一个域转换到另一个域的数学方法,它也可以应用于深度学习。 本文将讨论傅里叶变换,以及如何将其用于深度学习领域。 什么是傅里 阅读全文
posted @ 2022-05-06 11:35 deephub 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 为什么要增加训练数据 机器学习中的数据增强主要通过人工构建数据,增加训练集的大小使模型达到更好的泛化特性。这是一个在机器学习学科中进行的广泛研究的研究领域。 数据增强的主要作用如下: 增加了模型的概括功能; 对于不平衡数据集很有用; 可以最大程度地减少标注工作; 提高了针对对抗性攻击的健壮性; 一般 阅读全文
posted @ 2022-05-05 11:02 deephub 阅读(176) 评论(0) 推荐(0) 编辑
摘要: Micro-Outlier Removal:这个词听起来不错。但是这个术语是本文的作者首创的。所以应该找不到其他相关的资料,但是看完本篇文章你就可以了解这个词的含义。 在Kaggle 的《Titanic》排行榜中,作者使用这项技术获得了巨大排名飞跃- 在使用这个技术之前排名是12616 使用这个技术 阅读全文
posted @ 2022-05-04 17:25 deephub 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 分箱是一种常见的数据预处理技术有时也被称为分桶或离散化,他可用于将连续数据的间隔分组到“箱”或“桶”中。在本文中,我们将讨论使用 python Pandas 库对数值进行分箱的 4 种方法。 我们创建以下合成数据用于演示 import pandas as pd # version 1.3.5 imp 阅读全文
posted @ 2022-05-03 10:52 deephub 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 1、Hybridised Loss Functions for Improved Neural Network Generalisation Matthew C. Dickson, Anna S. Bosman, Katherine M. Malan https://arxiv.org/pdf/22 阅读全文
posted @ 2022-05-02 10:28 deephub 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 在 SimCLS [2]论文发布后不久,作者又发布了抽象文本摘要任务的SOTA结果 [1]。BRIO在上述论文的基础上结合了对比学习范式。 BRIO解决什么问题? 上图显示 seq2seq 架构中使用的传统 MLE 损失与无参考对比损失之间的差异。 我们通常使用最大似然估计(Maximum Like 阅读全文
posted @ 2022-05-01 10:04 deephub 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 数据可视化基本上是数据的图形表示。在探索性数据分析中,可以使用数据可视化来理解变量之间的关系,还可以通过视化数据揭示底层结构或了解数据信息。 有多种工具可以帮助我们创建数据可视化。Seaborn就是其中之一 ,它是一个流行的 Python 数据可视化库。虽然Seaborn也是基于 Matplotli 阅读全文
posted @ 2022-04-30 13:25 deephub 阅读(72) 评论(0) 推荐(0) 编辑
摘要: 太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略: 删除未使用的列 删除具有缺失值的列 不相关的 阅读全文
posted @ 2022-04-29 11:20 deephub 阅读(217) 评论(0) 推荐(0) 编辑
上一页 1 ··· 88 89 90 91 92 93 94 95 96 ··· 109 下一页