随笔分类 - 机器学习数据处理
摘要:UCI数据集作为标准测试数据集经常出现在许多机器学习的论文中,为了更方便使用这些数据集有必要对其进行整理,这里整理了论文中经常出现的数据集,并详细介绍如何使用MATLAB将数据集文件整理成自己需要的格式以及如何使用数据集文件。要点如下,博主另一篇博文UCI数据集详解及其数据处理(附148个数据集及处理代码)有更加详细的介绍。
阅读全文
摘要:这篇博文介绍几个写论文或平时学习中特别有用的网站,有的帮助你找论文中的代码或数据,有的则是论文写作、科研管理的利器,方便你更快完成高质量的paper。科学研究与艺术创作有异曲同工之妙,若是不能妙手偶得,就只能千锤百炼,通过成年累月的积累与沉淀。正可谓一入研途深似海,每天要面对的事情那么多,我们需要借助些‘工具’来更优雅地解决。这里分享的网站是博主平时发现并经常使用的,个人觉得很有用处所以分享出来希望对你也有所帮助。
阅读全文
摘要:在机器学习中,我们的数据集往往存在各种各样的问题,如果不对数据进行预处理,模型的训练和预测就难以进行。这一系列博文将介绍一下机器学习中的数据预处理问题,以UCI数据集为例详细介绍缺失值处理、连续特征离散化,特征归一化及离散特征的编码等问题,同时会附上处理的Matlab程序代码,这篇博文先介绍下特征归一化,其要点可见本文目录。
阅读全文
摘要:在机器学习中,我们的数据集往往存在各种各样的问题,如果不对数据进行预处理,模型的训练和预测就难以进行。这一系列博文将介绍一下机器学习中的数据预处理问题,以UCI数据集为例详细介绍缺失值处理、连续特征离散化,特征归一化及离散特征的编码等问题,同时会附上处理的Matlab程序代码,这篇博文先介绍下缺失值处理,其要点可见本文目录。
阅读全文
摘要:这篇博文总结了博主收集的深度学习常用的数据集,包含常用的分类、目标检测及人脸识别任务,对每个数据集给出了简要介绍、官网下载网站以及公众号获取的关键字。因为有的数据集较大,官网的下载速度可能比较慢,为了方便大家管理,这里我将其整理到了个人公众号平台中,可通过下方卡片“AI技术研究与分享”关注,并在后台回复各数据集关键字即可获取网盘链接。数据集文件均为官方网站下载,仅用于学习交流,博主会持续更新,欢迎关注。
阅读全文