摘要:
监督学习是训练机器学习模型的传统方法,它在训练时每一个观察到的数据都需要有标注好的标签。如果我们有一种训练机器学习模型的方法不需要收集标签,会怎么样?如果我们从收集的相同数据中提取标签呢?这种类型的学习算法被称为自监督学习。这种方法在自然语言处理中工作得很好。一个例子是BERT¹,谷歌自2019年以 阅读全文
摘要:
联邦学习也称为协同学习,它可以在产生数据的设备上进行大规模的训练,并且这些敏感数据保留在数据的所有者那里,本地收集、本地训练。在本地训练后,中央的训练协调器通过获取分布模型的更新获得每个节点的训练贡献,但是不访问实际的敏感数据。 联邦学习本身并不能保证隐私(稍后我们将讨论联邦学习系统中的隐私破坏和修 阅读全文
摘要:
在过去几年中,主动学习 (AL) 策略已被证明可用于降低标签成本。但是当涉及现实世界的数据集时,当前的方法效果并不理想,现实世界的些数据集存在缺陷和许多特征,使得从中学习具有更大挑战性: 真实世界的数据集场景:(a) 稀有类:数字 5 和 8 很少见;(b) 冗余:数字 0 和 1 是冗余的;© 分 阅读全文
摘要:
为什么 Pi 会出现在正态分布的方程中? 任何在大学上过统计学课程的人都遇到过这个等式。我自己也看过很多次了,但这次重新看,立刻想到了两个问题: 这东西究竟是如何形成正态分布的? π在那里做什么? 第一个问题似乎很简单也很容易弄清楚:我只需要学习方程产生的历史然后将其逐个拼凑起来。但第二个问题绝对让 阅读全文
摘要:
目标检测是一种计算机视觉技术,用于识别和定位图像中的目标。有很多检测算法存在,这里有一个很好的总结。 Mask R-CNN是目标检测的扩展,它为图像中检测到的每个目标生成边界框和分割掩模。这篇文章是关于使用Mask R-CNN训练自定义数据集的指南,希望它能帮助你们中的一些人简化这个过程。 http 阅读全文
摘要:
在本篇中,我们将展式使用 Python 统计学模型进行时间序列数据分析。* 问题描述 *目标:根据两年以上的每日广告支出历史数据,提前预测两个月的广告支出金额。 原始数据:2017-01-01 到 2019-09-23 期间的每日广告支出。 数据准备:划分训练集和测试集。 df1 = data[[' 阅读全文
摘要:
各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的相似性的同时,使图像占用的空间尽可能地减小,这由图像的差异百分比表示。 阅读全文
摘要:
虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为一名侦探,负责在发布前确定帖子是否真实。但是,虚假新闻仍然会越过我们的防线,在网络上迅速扩散,由于用户的无知和粗心而加剧。正如NBC新闻报道所显示的那样,假新闻不仅会散布恐惧和虚假信息,而且还可能对公司和个人的声誉造成损害。为了减少错误信息的直接和间接 阅读全文
摘要:
本文旨在探究将PyTorch Lightning应用于激动人心的强化学习(RL)领域。在这里,我们将使用经典的倒立摆gym环境来构建一个标准的深度Q网络(DQN)模型,以说明如何开始使用Lightning来构建RL模型。 在本文中,我们将讨论: 什么是lighting以及为什么要将它应用于RL 标准 阅读全文
摘要:
您可能会感到惊讶,但这是有效的。 最近,我阅读了arXiv平台上的Jonathan Frankle,David J. Schwab和Ari S. Morcos撰写的论文“Training BatchNorm and Only BatchNorm: On the Expressive Power 阅读全文