会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
103
104
105
106
107
108
109
110
111
···
154
下一页
2023年3月1日
使用手工特征提升模型性能
摘要: 本文将使用信用违约数据集介绍手工特征的概念和创建过程。 通过对原始数据进行手工的特征工程,我们可以将模型的准确性和性能提升到新的水平,为更精确的预测和更明智的业务决策铺平道路, 可以以前所未有的方式优化模型并提升业务能力。 原始数据就像一个没有图片的拼图游戏——但通过特征工程,我们可以将这些碎片拼在
阅读全文
posted @ 2023-03-01 10:30 deephub
阅读(65)
评论(0)
推荐(0)
2023年2月28日
非参数检验方法,核密度估计简介
摘要: 在20世纪,统计学还处于起步阶段计算机还不是那么流行的时候,假设正态分布是生成数据的标准。这主要是因为在那个所有结果都是手工计算的时代,正态分布可以使计算不那么繁琐。 但在这个大数据时代,随着计算能力的提高,数据的可用性使得统计学家采用了更现代的技术——非参数统计。这里我们将讨论一种这样的方法来估计
阅读全文
posted @ 2023-02-28 10:41 deephub
阅读(81)
评论(0)
推荐(0)
2023年2月27日
聚类算法(下):10个聚类算法的评价指标
摘要: 上篇文章我们已经介绍了一些常见的聚类算法,下面我们将要介绍评估聚类算法的指标 在聚类算法中,评估聚类结果的好坏是非常重要的。常见的聚类评估指标包括: Rand Index:用于衡量聚类结果和真实标签之间的相似度。 Adjusted Rand Score:Rand Index的调整版本,可以对随机结果
阅读全文
posted @ 2023-02-27 10:32 deephub
阅读(408)
评论(0)
推荐(0)
2023年2月26日
聚类算法(上):8个常见的无监督聚类方法介绍和比较
摘要: 无监督聚类方法的评价指标必须依赖于数据和聚类结果的内在属性,例如聚类的紧凑性和分离性,与外部知识的一致性,以及同一算法不同运行结果的稳定性。 本文将全面概述Scikit-Learn库中用于的聚类技术以及各种评估方法。 本文将分为2个部分,1、常见算法比较 2、聚类技术的各种评估方法 本文作为第一部分
阅读全文
posted @ 2023-02-26 09:34 deephub
阅读(281)
评论(0)
推荐(0)
2023年2月25日
稀疏特征和密集特征
摘要: 在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。 完整文章: https://avoid.overfit.cn/post/db548d55a7f44ec791bbc024727673e8
阅读全文
posted @ 2023-02-25 09:26 deephub
阅读(62)
评论(0)
推荐(0)
2023年2月24日
选择最佳机器学习模型的10步指南
摘要: 机器学习可以用来解决广泛的问题。但是有很多多不同的模型可以选择,要知道哪一个适合是一个非常麻烦的事情。本文的总结将帮助你选择最适合需求的机器学习模型。 完整文章: https://avoid.overfit.cn/post/dee6ac1aae804fc1b40c849412076d0c
阅读全文
posted @ 2023-02-24 10:46 deephub
阅读(125)
评论(0)
推荐(0)
2023年2月23日
在Pandas中通过时间频率来汇总数据的三种常用方法
摘要: 当我们的数据涉及日期和时间时,分析随时间变化变得非常重要。Pandas提供了一种方便的方法,可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。 在Pandas中,有几种基于日期对数据进行分组的方法。我们将使用这些虚拟数据进行演示: https://avoid.o
阅读全文
posted @ 2023-02-23 10:16 deephub
阅读(43)
评论(0)
推荐(0)
2023年2月22日
广义学习矢量量化(GLVQ)分类算法介绍和代码实现
摘要: 广义学习矢量量化(Generalized Learning Vector Quantization,GLVQ)是一种基于原型的分类算法,用于将输入数据分配到先前定义的类别中。GLVQ是LVQ(Learning Vector Quantization)的一种扩展形式,LVQ在特征空间中利用一组代表性原
阅读全文
posted @ 2023-02-22 10:33 deephub
阅读(102)
评论(0)
推荐(0)
2023年2月21日
计算时间序列周期的三种方法
摘要: 周期是数据中出现重复模式所需的时间长度。更具体地说,它是模式的一个完整周期的持续时间。在这篇文章中,将介绍计算时间序列周期的三种不同方法。 我们使用City of Ottawa 数据集,主要关注的是每天的服务呼叫数量。所以不需要对病房名称进行初始数据处理。Ottawa 数据集在渥太华市提供的数据门户
阅读全文
posted @ 2023-02-21 10:18 deephub
阅读(235)
评论(0)
推荐(0)
2023年2月20日
使用PyTorch-LSTM进行单变量时间序列预测的示例教程
摘要: 时间序列是指在一段时间内发生的任何可量化的度量或事件。尽管这听起来微不足道,但几乎任何东西都可以被认为是时间序列。一个月里你每小时的平均心率,一年里一只股票的日收盘价,一年里某个城市每周发生的交通事故数。在任何一段时间段内记录这些信息都被认为是一个时间序列。对于这些例子中的每一个,都有事件发生的频率
阅读全文
posted @ 2023-02-20 10:10 deephub
阅读(314)
评论(0)
推荐(0)
上一页
1
···
103
104
105
106
107
108
109
110
111
···
154
下一页
公告