摘要:
介绍你对互联网上的大量文本数据着迷吗?你是否正在寻找处理这些文本数据的方法,但不确定从哪里开始?毕竟,机器识别的是数字,而不是我们语言中的字母。在机器学习中,这可能是一个棘手的问题。那么,我们如何操作和处理这些文... 阅读全文
摘要:
用于建模的Python库我们已经到达了本文最受期待的部分 - 构建模型!这就是我们大多数人首先进入数据科学领域的原因,不是吗?让我们通过这三个Python库探索模型构建。Scikit-learn 就像用于数据操... 阅读全文
摘要:
概述 这篇文章中,我们挑选了24个用于数据科学的Python库。 这些库有着不同的数据科学功能,例如数据收集,数据清理,数据探索,建模等,接下来我们会分类介绍。 您觉得我们还应该包含哪些Python库?... 阅读全文
摘要:
导读:这篇文章中作者尝试将 15 年的自然语言处理技术发展史浓缩为 8 个高度相关的里程碑事件,不过它有些偏向于选择与当前比较流行的神经网络技术相关的方向。我们需要关注的是,本文中介绍的许多神经网络模型都建立... 阅读全文
摘要:
机器学习中的注释(Annotation)是标记数据的过程,可以是文本,视频,图像或音频等形式。在计算机视觉任务中,图像注释有助于计算机更好的理解图像,计算机尝试在带注释的数据中学习出适用于新数据识别的相似的规则... 阅读全文
摘要:
在训练了 50 个 epoch 之后,本文作者惊讶地发现模型什么都没学到,于是开始深挖背后的问题,并最终从恺明大神论文中得到的知识解决了问题。 上个星期我做了一些实验,用了在 CIFAR10 数据集上训练的 V... 阅读全文
摘要:
学习率是一个控制每次更新模型权重时响应估计误差而调整模型程度的超参数。学习率选取是一项具有挑战性的工作,学习率设置的非常小可能导致训练过程过长甚至训练进程被卡住,而设置的非常大可能会导致过快学习到次优的权重集... 阅读全文
摘要:
在本文中,来自旷视科技、南京大学和早稻田大学的研究者对基于深度学习的细粒度图像分析进行了综述,从细粒度图像识别、检索和生成三个方向展开论述。此外,他们还对该领域未来的发展方向进行了讨论。(CV)是用机器来理解和... 阅读全文
摘要:
【导读】今天,DeepMind爆出一篇重磅论文,引发学术圈热烈反响:基于最强图像生成器BigGAN,打造了BigBiGAN,在无监督表示学习和图像生成方面均实现了最先进的性能!Ian Goodfellow也称赞... 阅读全文
摘要:
聚类研究背景:在机器学习中,一个重要的任务就是需要定量化描述数据中的集聚现象。聚类分析也是模式识别和数据挖掘领域一个极富有挑战性的研究方向。聚类分析就是在无监督学习下数据对象的探索合适的簇的过程,在探索过程中,... 阅读全文